Chengshuo Dai

今天研究了 AI Agent（智能体），感觉打开了新世界的大门。以前我只是把大模型当成一个“懂很多的聊天机器人”，但 Agent 让它变成了能干活的数字员工。

核心思想其实就是 ReAct（Reasoning + Acting）框架。模型不再是直接给出答案，而是会在心里“碎碎念”： Thought：我需要知道今天的天气。 Action：调用天气 API。 Observation：北京今天晴，25度。 Thought：现在我知道天气了，可以回答用户了。

看着模型在后台一步步推导和调用工具，真的有一种它具备了逻辑思维的错觉！这个设计真的很妙。

不过我也发现，现在的模型做 Agent 还是有点笨。有时候它会陷入死循环，不断重复调用同一个工具，或者工具报错了它不知道怎么修复。

Lilian Weng 在她的博客里写道："LLM as the core controller of an autonomous agent is a cool concept, but the reliability of the system heavily depends on the prompt engineering and the model's inherent reasoning capabilities."

深有同感。要写出能让模型稳定调用工具的 Prompt，简直像是在念咒语。