在这个意义上,Agent浪潮距离“通用智能★★◆■★”的实质性突破尚远■◆★★■■。正如一位业内人士所言◆■:“OpenAI普及了大模型的通用性,DeepSeek实践了‘思维链+强化学习’的路径◆★★■■,而Agent目前还没有出现那个可以‘定格行业时间线’的关键节点★■◆。◆◆■◆■◆”
一类是通用型Agent,具备链式思考和复杂任务执行能力■■★◆★,可与外部API和系统交互,正在“元宝”等原生AI产品中迭代推进;另一类是嵌入微信生态的专属Agent,借助微信的社交关系链、小程序体系和内容分发网络,探索具有■★★★★“社交嵌入感”的差异化助理产品。
所谓大道至简◆★★◆◆,个人开发者面对的客户用ROI衡量Agent生产力的关键问题,也间接呼应了红杉提出的下一轮AI共识■★“卖的不是工具,而是收益”。简单地说就是进入AI的生产力阶段,token付费模式不再有效■■★◆◆,按效果付费成为真假Agent的判断核心。
“开发一个小红书Agent1万元◆★★◆◆★,可以实现选题、撰写■★、发布的自动化。涉及到外部平台的多种交互◆◆★,这个难度比较大。如果只是简单的内部效率型工具Agent,最低可以做到2000左右■★★◆◆■,从给到需求到出产品,大概需要一周左右。”Agent个人开发者李祥对「市象」称。
但是在Agent的产品理念中■★,是把这一整套操作■★★★“串起来”包装成一键式体验。用户点一次,Agent帮你从读资料到生成PPT全部搞定。
说到底,Agent就是AI的自动驾驶★◆◆。放到汽车行业同样成立,只有新势力讲激进的自动驾驶故事,老牌车厂讲的还是稳定、安全、省钱。对于Agent这波浪潮同样推出,讲好“故事★■◆◆”的是初创公司,真正把AI变现的,仍是那些慢而稳的大玩家◆★◆。
对于字节旗下的扣子★◆★■,一些技术人员更倾向于基于通用大模型增强的旧产品。比如字节扣子的Agent开发路径是基于通用大模型★◆,用户自主搭建workflow■◆★◆■,这种LLM+workflow的实现路径,本质是一种类Agent。
只要账号不封◆◆★★、网络不断、token充足,它就能无限执行任务——因此也被称为“数字生命”的Agent雏形★■★◆★★。这类产品,并不着眼于当下的效率提升◆◆◆■,而是激发用户对Agent式未来的预期◆◆。
其中字节扣子的模板创作,在闲鱼■★、小红书等多个平台,买扣子的工作流模板,也成为不少Agent尝鲜者赚到的第一笔钱。这也间接呼应了大厂对于Agent的态度◆■◆■◆■,不在于概念更在于实际带来的产出◆■。
另一边是在应用落地层面,凭借邀请码机制一炮而红后,Manus最近的多个动作主要围绕商业化进行,在Agent的产品功能更新方面没有进一步出圈的动作推出。热潮背后,Agent的实际能力边界也正在被逐步验证◆■。
能够以一种产品概念讲融资故事的时代,似乎又来了■◆★◆,往前数十年,国内市场的上一次类似情况还发生在移动互联网时代。如果说百模大战时代需要的技术研究型创业者,那么Agent时代可能更需要的是AI需求封装者★◆◆。
“这种一键生成的产品体验,是初创企业向用户预支的Agent信任。”AI传播人士章邯认为■■◆★,尽管最终产出的成果不一定可交付,但是这种革命性的工作流程重塑还是会告诉市场什么是Agent式体验。
革命不是通过生产力发生的,而是通过叙事结构引发的,也成为不少Agent赛道创业明星的商业底色。
正如Kimi把■■“长文本”变成记忆力的象征,Agent产品也在努力将“执行力★■◆■◆”变成它的新神话。无论一键生成,还是无限流,本质上都不是注重降本增效,而是先抢注意力——走红的不是功能,而是叙事★★■■。
在Reddit海外社区,一个深耕企业级Agent开发者直言不讳地指出:“现在定制AI代理的需求激增,但市面上90%的代理都是垃圾◆■■★。◆■■”问题的根源在于,开发者们沉迷于花里胡哨的UI交互,而非专注于解决具体问题。
截至目前■◆★,美团员工基于NoCode平台已创建9410个应用,其中超过1600个活跃使用。在内部研发流程中,约52%的新代码由AI生成,一些团队的AI使用率已超过90%。此外,62%的产品经理和28%的业务分析师也在使用该平台开发效率工具和原型应用◆★,覆盖HR、财务、产品等多个岗位,实现全员参与的智能工具生态。
相比字节的工程路径★★■★,美团则更显★★◆“冷静■■■”。在最新财报会上,美团CEO王兴对◆■■★◆“Agent”字眼并无过多着墨◆■★◆,仅将近期推出的AI编程平台“NoCode”归类为◆★★“无代码工具■◆★”。他更强调★◆■◆◆:“我们重点关注的是AI在实际场景中如何支持中小商户数字化转型。”
一边是过去数月各大公司推出的Agent相关产品,大多是平台型基础设施:字节跳动发布了■◆■■“扣子空间”★★■■◆,腾讯上线◆■◆◆■◆“腾讯云智能体开发平台”,微软提出“Open Agentic Web◆★”◆★,Anthropic则围绕Claude 4搭建Agent系统接口■■◆。
相比私人定制的Agent尝鲜生意,企业级的Agent需求,才是红杉口中的万亿市场规模核心■◆■◆。但是在行业相关人士来看,因为需要可控性、稳定性◆■★★■,企业级的需求,目前多数还是被之前在传统SaaS行业拥有资源的人拿走了。同时,传统的SaaS企业也在全面向Agent转型融合。本质上AI只是让产品更新换代一遍■◆■,但是并没有让To B的资源重新流动分配。
但是热潮之下,泡沫总是有的。在Agent私人定制的中介王磊看来★◆◆“Agent还是比传统外包好做一些,基本明确需求以后,依托一些外部的Agent开发平台2-3天就可以搭建一个可交付的个人定制产品。★■■”
和初创企业热衷讲述“屠龙少年”的故事不同◆★◆★,大厂对于Agent的态度更符合ROI的Agent需求共识。尽管在Manus走红后,百度推出心响,字节也上线“扣子空间”,甚至字节还借鉴了Manus的“邀请码”策略,但是在定位上★★◆,大厂更倾向于构建Agent开发平台。
其中通用大模型作为流程中的工具人,仅处理特定环节,无自主决策能力。流程规划由人工预先编排◆★■■★,各模块独立运行,缺乏动态协作。本质是开发者基于通用大模型◆◆,部署并定义的静态工作流。
但是人工自定义,也意味着可以更快的融入到已有的工作流,对传统工作流实现大模型的增强提效■★◆。
相比那些改变技术历史的里程碑式事件,当下的Agent更像是一种商业现象级话题。
在一个尚未统一答案的行业里,满足大众的想象,往往比满足企业的预算更重要★■◆。“什么是Agent?”每个人都有自己的解释◆★■■■。但从技术路径上拆解,Agent=大模型+工作流规划+记忆系统+工具调用。
在他看来,和市场上传播的◆■“GitHub爆火、VC抢投”的Agent叙事不同,实际在和大多数客户接触时,最终的对话还是会回到传统软件外包时期的两个核心◆★★■■:多少钱能做★◆,都能实现什么功能■■★★。
在腾讯的AI战略中,“务实★★■★★■”同样是关键词。正如CEO马化腾在财报电话会议所言:“AI能力已对效果广告与长青游戏等核心业务产生实质性贡献,同时我们也在加大对元宝应用及微信AI生态的投入■■★■■。”
马化腾强调,这两类Agent代表不同路径,后者尤其有潜力建立腾讯在AI助手赛道的独特护城河。但是至于怎么做,什么时候上新Agent应用,手握AI基建、资金、以及生态优势的大厂并不着急■◆◆■★■。
如今在Kimi铺出来的路径上★◆■★★,还有更多的Agent产品在探索★■◆◆★■“满足想象力★★■”的新方式。比如flowith最新推出的“无限Agent模式■■★”■◆,支持无限步骤★■、无限上下文◆◆、无限工具链,理论上可以完成以“年■★◆★◆■”为单位的任务执行过程。
根据《特工宇宙》调研数据★■◆■,第一波下场做智能体的创作者收入主要来源于四部分,知识付费、定制开发、比赛奖金、模板分成■◆■,场景以私域营销,自媒体运营为主,收入在1w至100w不等。
技术堆叠并不能换来客户满意,真正有价值的是■◆■◆“每周能节省xx个小时”的实打实回报★■◆★◆。所谓Agent,最终还是回到商业效率本身。
毕竟相比大厂,在大模型基建◆★◆◆■、资本能力、生态资源方面都不具有优势■■,而一键生成,恰好满足了用户对“Agent”的科幻想象。
它不是某种全新形态,而是一种对AI能力的“打包式交付”◆■★★。因此当Mauns等产品火起来时,也引发了不少技术圈的质疑◆■◆:只是◆■★◆“AI套壳”,并不创新■■◆■◆★。但问题在于,“套壳”未必无效◆■◆◆◆。
对于市场买单的Agent产品有共识,但是这并不意味着ROI是Agent产品走红的关键■■★◆◆★。
这种打法◆◆■◆,和当年Kimi凭借■★★★“一次喂完《红楼梦》■◆★”在百模大战中脱颖而出是一个道理。不是多模态的能力◆★,也不是生成效果最好,而是选对了一个“最能传播”的点★■★■★。这也是当下,不少明星企业共同遵循的一套Agent商业叙事。
“大厂倾向于推出AI化的◆◆■■■◆‘全家桶’,而初创企业更热衷于原生型Agent★◆■◆。■■■■■”一位产品经理向「市象」总结:◆★■“前者是用AI重做旧产品,后者是用AI重生新产品■■★★。很难说哪种路径更优,但市场总爱听屠龙少年的故事。”
自互联网叙事向AI转轨,科技巨头们也在争相为自己贴上“Agent■★”标签。过去一个月,国内的腾讯、百度,海外的微软、谷歌◆◆,几乎每一家大型企业在发布会上都强调★★◆■★★:要做Agent◆■■★,要搭建Agent基建平台。
同时因为往往是To C的个人定制化产品,不少定制的人都是出于尝鲜的目的■★,或者想了解一下Agent的能力边界■■,所以即使没有达到想要的效果,也没有太多的售后维权扯皮发生,整个行业目前也没有传统外包那么卷。
这组数据揭示了一个核心矛盾◆★◆■★:Agent可以很快◆◆★、很准,但还不够持久。它仍未掌握复杂任务所需的韧性与稳定性★◆◆◆。
2024年发布的RE-Bench基准测试数据显示◆◆★★■■:在2小时短任务中◆◆★★,顶尖Agent的表现可达人类专家的4倍■◆■★;但在32小时长任务中,Agent则明显掉队——人类展现出更强的战略规划和动态适应能力。
这位曾为多家初创企业搭建过的Agent系统的开发者经验是◆★■◆★,企业不在乎AI用了哪个模型,而在乎它是否能带来明确的ROI。他说得直白◆★■■★:◆■◆◆■“构建Agent只是整件事的30%◆★◆■,部署、维护、更新API才是最耗精力★◆◆★◆。◆◆”
当技术落地到商业应用阶段,ROI成为衡量Agent生产力有效性的直接数据。李祥说之前圈子里面有个调侃Agent生产力的段子:“调用1美元的token◆★★■◆★,产出1元的价值。”直戳许多是难以产出可交付成果的Agent产品。
一位AI测评爱好者这样形容传统AI使用体验:想做一份PPT,先用ChatGPT消化资料、总结要点;然后把这些要点丢进WPS生成初稿;接着用图库配图,再自己逐页调整■★◆◆★。流程链条可能涉及十多个网页、三五个不同产品★★◆。