吴恩达:Agent 开发有多难?单Agent跑通难,A2A协作开发更难

前几天,吴恩达和 LangChain 联合创始人 Harrison Chase 聊了聊当下 AI 领域的情况,那叫一个机遇与挑战并存。咱们来好好唠唠他们都聊了啥。


一、Agent 系统构建:先别纠结定义,干就完了

吴恩达说,别再争论“这是不是 Agent”了,不如关注系统的 “代理性”。这就好比一个光谱,有的系统自主性强,有的弱。企业里很多工作都是线性流程,比如填表单、查合规风险、复制粘贴数据等。现在把这些流程变成 “代理性工作流”,难就难在任务该拆分成多细的步骤,怎么设计工作流结构,还有搭建评估体系。很多团队靠人工评估 Prompt 效果,效率太低。有经验的人知道啥时候该换方案,没经验的可能在一个组件上耗好几个月。

二、工具就像乐高积木,会组合才是真本事

过去几年,AI 工具越来越多,像 LangGraph、RAG 这些,就跟各种颜色和形状的乐高积木似的。有经验的人知道用哪个工具能快速解决问题,没经验的可能得走不少弯路。而且工具变化太快,比如随着大模型上下文长度增加,一年半前的 RAG 最佳实践现在可能就不管用了。

吴恩达觉得评估系统很重要,但很多人没真正去做。他自己会先快速搭一个简单的评估工具,虽然不完美,但能减轻人工评估的负担,然后再慢慢优化。另外,语音技术栈也被低估了,企业对语音应用很感兴趣,但开发者关注得还不够。还有,让开发者用 AI 辅助编程很重要,可很多公司还不让工程师用 AI 编程工具,这可不行啊。吴恩达还说,每个人都该学一点编程,就算不是工程师,学点编程也能提高生产力。

三、语音交互:快!一定要快!

语音和文本交互不一样,语音对延迟要求特别高,理想情况下系统得在1 秒内回应,最好是 500 毫秒以内。要是延迟太长,体验就很糟糕。不过可以用 “预回应” 设计来掩盖延迟,比如先说 “嗯,这是个有意思的问题”,或者播放点背景音,让用户更容易接受。而且语音能让用户更放松,更容易表达自己。

四、MCP 和 Agent 间通信:还在 “婴儿期”

MCP 挺让人兴奋的,它解决了数据接入的大问题,让工具、API、数据源之间的集成更容易了。但现在 MCP 还很 “蛮荒”,很多服务端跑不起来,身份验证和 token 管理也不成熟,协议本身也需要改进,比如需要分层发现机制。

至于 Agent 与 Agent 之间的通信,那就更早期了。现在一个团队内部的多 Agent 系统还能运转,但让不同团队的 Agent 协作,几乎不可能。如果说 MCP 是早期,那 Agent 间通信就更早期了。

五、关于编程和创业:别听 “别学编程” 的鬼话

现在流行 “氛围编程”,就是借助 AI 编码助手编程。有人说“别学编程了,AI 会帮你写”,这简直是史上最糟糕的建议。每次编程门槛降低,学编程的人反而更多。AI 编码助手会让更多人学编程,而且懂点编程,才能清楚地告诉计算机你想做什么。

对于有创业想法的人,吴恩达说创业成功的关键是速度和技术能力。高效团队的执行速度是传统企业想不到的,而技术理解力比商业技能更稀缺。AI Fund 就喜欢和技术背景深厚的人合作,商业能力相对容易补足。

好了,这就是吴恩达和 Harrison Chase 对话的主要内容。现在 Agent 开发确实还挺难的,单跑通一个 Agent 就像奇迹,两个 Agent 协作就像中彩票。但机会也很多,尤其是在简单的线性流程自动化方面。