Chengshuo Dai
Back to Blog

让大模型使用工具:Agent初体验

Agent

今天研究了 AI Agent(智能体),感觉打开了新世界的大门。以前我只是把大模型当成一个“懂很多的聊天机器人”,但 Agent 让它变成了能干活的数字员工。

核心思想其实就是 ReAct(Reasoning + Acting)框架。模型不再是直接给出答案,而是会在心里“碎碎念”: Thought:我需要知道今天的天气。 Action:调用天气 API。 Observation:北京今天晴,25度。 Thought:现在我知道天气了,可以回答用户了。

看着模型在后台一步步推导和调用工具,真的有一种它具备了逻辑思维的错觉!这个设计真的很妙。

不过我也发现,现在的模型做 Agent 还是有点笨。有时候它会陷入死循环,不断重复调用同一个工具,或者工具报错了它不知道怎么修复。

Lilian Weng 在她的博客里写道:"LLM as the core controller of an autonomous agent is a cool concept, but the reliability of the system heavily depends on the prompt engineering and the model's inherent reasoning capabilities."

深有同感。要写出能让模型稳定调用工具的 Prompt,简直像是在念咒语。