2025-03-21-MCP爆火思考-out
看了什么项目
之前主要在跟dify,最近看了openmanus,owl,browser-use这几个项目,以及MCP这个协议。
为什么
因为manus火了,同时实习的项目也需要做智能助手。总体认为是agent+升级版function call是很好的。其可以取代各种复杂的任务流编排,workflow,chatflow,无需手动去dify上像低代码构建一样构造任务流。 总结,就是说,agent会使用工具,就像人类之所以超过动物,就是人类会使用工具,而不是人类跑的比猎豹更快。这个思路我认可,训练一个超级强的万能大模型不可能,一个会用工具的agent更好。
优化建议
普通的功能我认为大模型都做的不错。例如http请求,调用api之类的。我在思考的是rag可以作为一个大脑,agent的外接大脑。把rag部署为一个单独的服务。因为现在agent识别工具,需要识别工具的名字和描述跟用户输入的相关性,这个不太靠谱,最好也能用rag的方式,把工具的配置都放在知识库里面,知识库就是agent的大脑。这样我也能给每个tool,加入更多的描述,甚至few shot,CoT。而且节约了token
