吴恩达:Agent 开发有多难?单Agent跑通难，A2A协作开发更难

发布时间：2025-09-11 13:41:20

1 阅读

0 评论

文章标签：自学程序员有多难

前几天，吴恩达和 LangChain 联合创始人 Harrison Chase 聊了聊当下 AI 领域的情况，那叫一个机遇与挑战并存。咱们来好好唠唠他们都聊了啥。

一、Agent 系统构建：先别纠结定义，干就完了

吴恩达说，别再争论“这是不是 Agent”了，不如关注系统的 “代理性”。这就好比一个光谱，有的系统自主性强，有的弱。企业里很多工作都是线性流程，比如填表单、查合规风险、复制粘贴数据等。现在把这些流程变成 “代理性工作流”，难就难在任务该拆分成多细的步骤，怎么设计工作流结构，还有搭建评估体系。很多团队靠人工评估 Prompt 效果，效率太低。有经验的人知道啥时候该换方案，没经验的可能在一个组件上耗好几个月。

二、工具就像乐高积木，会组合才是真本事

过去几年，AI 工具越来越多，像 LangGraph、RAG 这些，就跟各种颜色和形状的乐高积木似的。有经验的人知道用哪个工具能快速解决问题，没经验的可能得走不少弯路。而且工具变化太快，比如随着大模型上下文长度增加，一年半前的 RAG 最佳实践现在可能就不管用了。

吴恩达觉得评估系统很重要，但很多人没真正去做。他自己会先快速搭一个简单的评估工具，虽然不完美，但能减轻人工评估的负担，然后再慢慢优化。另外，语音技术栈也被低估了，企业对语音应用很感兴趣，但开发者关注得还不够。还有，让开发者用 AI 辅助编程很重要，可很多公司还不让工程师用 AI 编程工具，这可不行啊。吴恩达还说，每个人都该学一点编程，就算不是工程师，学点编程也能提高生产力。

三、语音交互：快！一定要快！

语音和文本交互不一样，语音对延迟要求特别高，理想情况下系统得在1 秒内回应，最好是 500 毫秒以内。要是延迟太长，体验就很糟糕。不过可以用 “预回应” 设计来掩盖延迟，比如先说 “嗯，这是个有意思的问题”，或者播放点背景音，让用户更容易接受。而且语音能让用户更放松，更容易表达自己。

四、MCP 和 Agent 间通信：还在 “婴儿期”

MCP 挺让人兴奋的，它解决了数据接入的大问题，让工具、API、数据源之间的集成更容易了。但现在 MCP 还很 “蛮荒”，很多服务端跑不起来，身份验证和 token 管理也不成熟，协议本身也需要改进，比如需要分层发现机制。

至于 Agent 与 Agent 之间的通信，那就更早期了。现在一个团队内部的多 Agent 系统还能运转，但让不同团队的 Agent 协作，几乎不可能。如果说 MCP 是早期，那 Agent 间通信就更早期了。

五、关于编程和创业：别听 “别学编程” 的鬼话

现在流行 “氛围编程”，就是借助 AI 编码助手编程。有人说“别学编程了，AI 会帮你写”，这简直是史上最糟糕的建议。每次编程门槛降低，学编程的人反而更多。AI 编码助手会让更多人学编程，而且懂点编程，才能清楚地告诉计算机你想做什么。

对于有创业想法的人，吴恩达说创业成功的关键是速度和技术能力。高效团队的执行速度是传统企业想不到的，而技术理解力比商业技能更稀缺。AI Fund 就喜欢和技术背景深厚的人合作，商业能力相对容易补足。

好了，这就是吴恩达和 Harrison Chase 对话的主要内容。现在 Agent 开发确实还挺难的，单跑通一个 Agent 就像奇迹，两个 Agent 协作就像中彩票。但机会也很多，尤其是在简单的线性流程自动化方面。