行业洞察 · 10 分钟阅读

AI 购物代理为什么需要结构化商业数据

2025年1月23日,OpenAI正式推出Operator。这是一个能够操控浏览器、填写表单、替用户完成购买的AI代理,定价200美元/月,捆绑在ChatGPT Pro计划中。

购物代理的革命已经开始

2025年1月23日,OpenAI正式推出Operator。这是一个能够操控浏览器、填写表单、替用户完成购买的AI代理,定价200美元/月,捆绑在ChatGPT Pro计划中。Operator的意义不仅是一个新产品发布,它标志着前沿AI实验室第一次将自主代理明确定位为购物入口。

Operator并非孤例。Amazon的Rufus早已嵌入主应用,覆盖超过2.5亿用户,Amazon公布的数据显示使用Rufus的购物者转化率高出60%。Google的Project Mariner开始在Chrome标签页间自主导航,执行多步骤网页任务。Perplexity推出了"Buy with Pro"功能,让用户直接从搜索结果中完成购买。

这些产品路径各异,但指向同一个判断:下一代电商的核心交互界面不是人在滚动页面,而是AI代理在执行任务。

然而,繁荣的表面下藏着结构性问题。目前绝大多数代理驱动的商业交易仍然依赖网页抓取——AI模型像人类一样解析渲染后的HTML。据行业估算,99%的代理交易通过抓取而非结构化API完成。这种方式勉强能用,但速度慢、极其脆弱、且准确率堪忧。

问题已经不是AI代理会不会购物。它们已经在购物了。问题是:你的店铺数据准备好了吗?

AI代理眼中的网页世界

人类访问商品页面时,看到的是精心设计的视觉布局:主图、颜色选项、醒目的价格标签、带星级的用户评价、以及那个大大的"加入购物车"按钮。大脑基于多年的网购经验,瞬间完成信息处理。

AI代理看到的是完全不同的东西。它接收到的是原始HTML——一堆<div>标签、CSS类名、JavaScript包和穿插其中的广告脚本。这些代码本身不携带语义信息。价格可能在一个站点的<span class="pdp-price__main">里,在另一个站点的<div data-testid="offer-price">里。代理只能猜测、推断,甚至产生幻觉。

普林斯顿和斯坦福的WebArena基准测试清楚地量化了这个差距。GPT-4在使用非结构化HTML执行网页导航任务时,端到端准确率仅为16%。同一模型在获取结构化数据——干净的、带语义标签的字段——后,准确率跃升至54%。模型没变,仅凭数据格式的改善,性能提升了3.4倍。

这种准确率差距有切实的商业后果。一个读错价格、识别错变体、或未能检测到缺货状态的抓取代理,不仅仅制造了糟糕的用户体验,它正在侵蚀整个代理商务范式的信任基础。

结构化商务数据的崛起

解法不是更好的AI模型,而是更好的数据。

Schema.org是由Google、Microsoft、Yahoo和Yandex联合维护的标准化词汇表,提供了一种以AI 可读格式描述商品、报价、评论和品牌的统一方式。JSON-LD(链接数据的JavaScript对象表示)是首选编码格式,直接嵌入页面的<head>标签中,任何爬虫或代理都可以提取它,而无需解析可视化DOM。

一段JSON-LD Product标记能告诉代理它需要知道的一切:商品名称、SKU、价格、币种、库存状态、品牌、综合评分和评论数。无需猜测,无需抓取策略,无需在站点改版时随时可能失效的CSS选择器。

Google长期使用结构化数据来生成富搜索结果。但2024到2025年间发生的变化是:AI代理——而非仅仅是搜索爬虫——开始将这些数据作为主要信息来源。Schema.org Product标记现在是AI可发现性的基准线。缺少它的店铺,对于日益壮大的购物代理群体而言,实际上是隐形的。

协议生态全景

页面上的结构化数据是必要条件,但不是充分条件。AI代理还需要与商务系统交互的标准化协议——搜索商品目录、管理购物车、发起支付、与其他代理协调。过去18个月里,四个主要协议已经浮现,各自覆盖这个技术栈的不同层级。

MCP(Model Context Protocol) 由Anthropic于2024年11月开源。MCP定义了将AI模型连接到外部工具和数据源的通用标准,属于连接层——LLM用它发现服务器提供哪些能力,并调用这些能力。可以把MCP理解为AI领域的USB-C:无论两端是什么模型或数据源,都用同一个接口。

ACP(Agentic Commerce Protocol) 由OpenAI和Stripe于2025年9月联合推出,聚焦支付与交易层——AI代理如何安全地发起购买、处理支付授权、管理订单状态。它构建在Stripe的支付基础设施之上,为代理驱动的交易提供可信赖的结算机制。

UCP(Universal Commerce Protocol) 由Google和Shopify联合开发,2025年1月公布。UCP覆盖完整的购物旅程:商品发现、目录浏览、购物车管理和结算流程。它定义了AI代理与商户店面交互的标准化API契约,从首次搜索到订单确认。

A2A(Agent-to-Agent) 由Google于2025年4月发布。前三个协议处理代理与服务器之间的通信,A2A则处理代理与代理之间的协作。它定义了一个AI代理如何将任务委托给另一个代理、共享上下文、协调多步骤工作流——比如个人购物代理与物流代理之间的协调。

每个协议有明确的分工。MCP提供管道,UCP构建购物体验,ACP处理资金,A2A实现代理间的协作。它们共同构成了代理商务的新兴基础设施。

数据不会说谎

市场数据的方向明确。2025年全球AI代理市场规模达到约73亿美元,复合年增长率在43%到50%之间。McKinsey预测,到2030年,仅美国AI影响的零售支出就可能达到1万亿美元。

消费者行为正在同步转变。Adobe Analytics报告,2024年假日购物季期间,AI驱动的零售网站流量同比增长了4700%。另一项调研显示,2025年有26%的美国成年人使用AI进行商品发现或购物推荐——一年前这个数字还是个位数。

平台方的动作更说明问题。2025年夏天,Shopify在其生态系统中的每一个店铺上默认激活了MCP端点,让数百万商户瞬间对AI代理开放了结构化协议访问。这不是内测功能,也不是开发者预览。这是全平台的默认配置,说明Shopify已经将代理就绪性视为基础设施级别的能力,而非可选增强项。

Google搜索的AI模式、Microsoft Copilot的购物功能、ChatGPT的原生购物体验——全都依赖结构化产品数据来填充结果。这些不再是实验性功能。它们是消费者发现和评估商品的主要界面。

隐形危机

商户面对的战略现实很简单:如果你的产品数据不是结构化的、不能通过协议访问,AI代理就无法可靠地找到你。

这跟传统SEO不同。在有机搜索中,一个元数据一般的页面仍然可以凭借内容质量、外链和域名权威获得排名。AI代理的工作方式不一样。它们不像搜索爬虫那样"浏览"网页。它们查询结构化端点、消费JSON-LD、调用协议定义的工具。如果商户的数据被锁在渲染后的HTML里,没有结构化层,代理要么直接跳过这个商户,要么以低置信度进行抓取——产出的结果会被代理自身的排序逻辑降权。

类比很直接。移动电商早期,没有做移动端适配的商户,随着智能手机使用率上升,流量和转化率断崖式下跌。同样的动态正在AI代理领域重演。结构化商务数据就是代理时代的响应式设计。

而行动窗口正在收窄。当代理驱动的购物从26%走向主流采用,缺乏结构化数据基础设施的商户将发现自己被排除在越来越多的购买决策之外。

构建代理就绪的店铺

让一个店铺做到代理就绪需要在三个层面投入。

第一层:结构化标记。 每个商品页面需要有效的JSON-LD,包含Schema.org的Product、Offer、Brand、AggregateRating和Review类型。这是AI可发现性的最低门槛。Google的Rich Results Test等工具可以验证标记的准确性。

第二层:协议端点。 在静态标记之上,店铺还需要活的API端点,让代理能够实时查询——用自然语言搜索商品、检查库存、创建购物车、发起结算。MCP、UCP、ACP各自定义了这些交互的规范。

第三层:数据质量与时效性。 结构化数据只有在准确的前提下才有价值。价格必须反映当前定价,库存数量必须近实时更新,商品描述必须足够完整,让代理无需幻觉就能做出推荐。

这正是ORBEXA等基础设施平台所做的事情。ORBEXA提供多协议基础设施层,将现有的店铺数据转化为代理就绪的格式,支持MCP、UCP、ACP和A2A协议,通过共享的多租户基础设施和自定义域名支持,让任何规模的商户都能具备代理可访问性,而无需独立实现多个协议、标准化数据、维护结构化端点。

接下来会发生什么

从人类浏览到代理查询的商务转型不是推测性的未来。它正在发生——OpenAI、Google、Amazon、Microsoft以及一个快速增长的垂直生态系统都已推出了生产级别的代理产品。协议在标准化,消费者行为在转变,平台默认配置在改变。

今天就投资结构化商务数据和协议基础设施的商户,正在为一个AI代理影响越来越多购买决策的市场做准备。选择等待的商户面临着与十年前忽视移动优化的企业相同的命运——不是突然的消亡,而是可见性和市场份额的缓慢侵蚀,而这种侵蚀会随时间复利累积。

数据层就是新的店面。问题是:你的店面开门了吗?

← 返回新闻