
文 | 周天产业分析
2026,好像率是AI智能体的「大年」。
大模子资格了三年的技艺发展演进,行业叙事从chatbot(聊天机器东说念主)期间,迈入「用AI替东说念主服务」的Agent期间。
就在最近,智能体全面收受咱们日常生涯的信号,就出现了。千问App上线了全新AI Agent才气「任务助理」,全面买通阿里生态,包括淘宝、闪购、飞猪、高德舆图和支付宝。
无为来说,你张张嘴就有个AI助理替你点单,替你找餐厅、订旅舍。
在这个期间点,互联网平台齐在偷偷准备各自的Agent决议和AI道路图。
阿里是全生态沿路上,能买通的尽量买通。
某搜索中厂,他们的发力点之一是AI医疗,正在灰暗大举招东说念主,想把竞价名次的方式在AI医疗里复现,哪家病院付费意愿强,就把哪家算作谜底径直给到用户。搜索大厂零落我方的生态、用户粘性和优质内容,只可回偏激把昔日最得益的样貌再行捡起来,用AI重作念一次。
豆包则是推出了我方的硬件豆包手机,以「蔚来-江淮方式」拓荒出一个让豆包领有系统级权限的手机,主买通过「读屏+模拟用户点击」的式样来接替用户进行操作。
各家齐在我方的才气资质和贪念限制内,进行着AI期间的挫折和防护。
AI一键生成翰墨图片视频,chatbot和你聊天,非论聊成啥样,对咱们时时东说念主的影响还不算很大,最多是需要醒目AI换脸骗术的可能性。
但Agent替你下单,替你聊天,波及到钱和秘籍的事儿,时时东说念主的费神应该会高一个量级,无论是行业仍是用户,齐需要神思背后的首先机制。
因此,这次我就拿放大镜望望千问的首先逻辑,到底是怎样替你服务,替你把钱付出去的。
我从千问的用户确认里阅读到这样一段翰墨:
互助方调用与数据授权。AI Agent在部分功能下需要调用互助平台接口 (如淘宝、淘宝闪购),为您提供自动购物、智能比价、外卖各种生涯服务。
在您明确授权的前提下,咱们会将您的必要个东说念主信息分享给互助平台,用于杀青您的千问账号与互助平台账号的绑定、数据互通及功能授权,具体分享的个东说念主信息类型、使用猜测见产物页面领导。未经您的许可,咱们不会私行分享您的敏锐个东说念主数据。
用行业术语来说,这就了了了互助方式是agent to agent之间的才气调用:千问和其互助平台、哄骗签署了调用公约——这属于一种双重授权机制,不仅千问和用户之间签署公约,千问还和不同平台签署公约,赢得调用许可。
通盘大阿里生态的念念路是一致的,就在这两天,蚂蚁支付宝还荟萃千问App、淘宝闪购、Rokid、大麦、阿里云百真金不怕火等,恰当发布ACT公约 (智能体买卖信任公约)。这是中国首个面向Agent买卖需求策动的怒放技艺公约框架,为AI与电商、外卖等服务平台的协同打造一套「通用话语」,助力跨终局、跨系统、跨平台的AI任求实施。
那么,在2026年的年头,道路分辨就知道出来了。
阿里千问所代表的「双重授权机制」,是一种基于怒放公约的互助方式。在这种方式下,AI Agent通过次序化授权公约与第三方服务进行对接,通盘的数据交换齐在结构化的接口中完成,权限领域瓦解可控,每一次操作齐有完好的审计日记。这就像是酬酢渠说念——走正门,递国书,在明面上进行。
亦然在不久前,豆包手机问世,则代表了另一种技艺道路:「读屏加模拟点击」。它通过屏幕OCR识别界面元素,然后模拟东说念主类点击、勾选等触控操作来完成任务。这种式样绕过了哄骗的逻辑层,径直在阐扬层进行操作,绕开了第三方平台的配合或授权。形象地说,更像是翻窗入室——天然也能进去服务。
读屏模拟道路最大上风在于部署速率快、遮掩限制广。由于不需要与任何平台进行商务谈判或技艺对接,厂商不错片面杀青对险些通盘哄骗的收受才气,这种「即插即用」的特质使其在市集竞争中具有明显的先发上风。
但从用户侧来看,这种便利性仍是会打一些扣头。读屏+模拟点击道路,需要模拟东说念主类点击,需要跳转App,再一页一页去翻、去识别、去填写,而淌若是两个Agent之间签有公约,短暂就完成信息授权和互通。
业内东说念主士以为,模拟点击的便利性是有代价的,存在安全隐患和职守真空。API授权道路天然部署徐徐、遮掩限制受限于平台怒放意愿,但它提供了精准的权限粒度端正和瓦解的职守包摄。
从资金安全和用户秘籍角度推敲,让咱们具体遐想一个场景:用户对AI说「帮我把余额宝的钱转到银行卡」。在读屏方式下,为了完成这个任务,AI必须具备读取屏幕上通盘信息的才气,这意味着它施行上能看到用户通盘的账户余额、通盘的交游纪录、通盘的关连东说念主信息,况兼不错模拟点击任何按钮——包括转账给轻易账户。
还有一个敏锐场景是好友之间的对话,十分是对方不知情的情况下,让Agent帮我方复兴信息,是松弛了打字的忙碌,但读屏读的是现时页面全部信息,很敏锐的信息也会一望广大,这极少上读屏方式可能仍是得拿出令东说念主驯服的风控决议。
职守包摄的腌臜性偶而是最辣手的问题。假定AI误操作导致转错账或买错股票,或者把一张情侣之间的像片发给了碰巧同名的第三方,在API方式下,有完好的调用日记、授权纪录和明确的接白话义,不错瓦解地牵挂职守。但在读屏方式下,AI Agent说它看到的是这个按钮,App则说按钮那时不在阿谁位置,通盘事件无法复现、无法审计、无法锁定职守。这种职守真空在金融场景中尤其不成残暴。
而从互联网生态健康度的角度看,读屏方式骨子上是一种「寄生」关系,它饱读舞的是顽抗而非互助。平台一朝发现我方的哄骗被这种式样「入侵」,天然会采纳技艺反制措施,这将导致一场持续断的攻防战。相悖,API方式创造的是「共生」关系——Agent厂商赢得才气,平台赢得流量和生态位,用户赢得便利,各方齐受益。
站在愈加宏不雅视角,读屏模拟点击道路,很可能使得滴滴、携程、好意思团这类具有线下践约收罗的平台,其线上的高利润方法被绕开,买卖价值被缩短,这会对产业产生众多轰动,Agent是帮用户松弛了三秒钟,地球上就此磨灭了些许门第界五百强,这种道路,在现时经济社会景况下,应该是不会得到各方首推的。
我猜测一下趋势可能的走向,在改日一到两年的短期内,读屏方式会在非敏锐场景快速提高,比如查天气、内容铺张这类步地。而波及到金融、支付和聊天场景,需要愈加审慎。
站在旁不雅者角度来看这次千问发布会,有一个真义是很特出的,阿里生态选用双重授权道路,能最初卡住A2A道路,有契机成为行业次序制定者,拓荒一个生态定约,有益于先把一又友搞得多多的。
合理推测,2026年,阿里必会推出我方界说的AI手机,以至关于大多量头部互联网平台来说,尽快推出我方界说的Agent手机,齐是件朝发夕至的事。
在AI叙事的另一个大国,2026年1月,谷歌也在举止,它荟萃Shopify、沃尔玛等全球零卖业巨头,发布「通用商务公约」(UCP),前沿探路者们齐在试图争夺次序界说权。
在三到五年的中期,我瞻望会出现相似「Agent Protocol」的行业次序,主流哄骗会提供官方的Agent接入点,读屏方式将退化为「临了技巧」,用于那些尚未适配的长尾哄骗。
读屏模拟是「讲解Agent有效」的捷径九游体育娱乐网,API授权是「让Agent真确」的必经之路。前者合适垦荒探路,后者合适恒久假寓。站在不想被一眼看透的时时用户,以及产业能健康发展的角度,咱们仍是但愿双重授权的A2A方式,成为最终行业次序和共鸣,众人沿路走得愈加沉稳极少。
