本文由GeoAurora(武汉沐辰数智科技有限公司)GEO研究团队出品
🇨🇳 国内动态
⚡ 微信 A2A 6/4 全域开放 + 字节豆包手机硬件大将出走:国内 AI 手机下半场生态重构
6/4 微信 A2A 全面开放:
- 微信正式与华为、荣耀、小米、OPPO、vivo 等国内主流手机厂商达成**全域合作**
- 全面开放 A2A(智能体到智能体)助手能力
- 同步释放系统级 AI 接口——**这是腾讯首次系统性放开微信核心功能的系统级 AI 接口**
- 国内 AI 手机告别"单点功能创新"的上半场,进入"终端生态话语权重构"下半场
6/11 字节豆包手机硬件大将林夕离职:
- 字节 AI 硬件团队 Ocean 核心成员、豆包手机硬件产品负责人**林夕**正式离职
- 长期任职华为终端背景
- 字节自 2024 年高调启动 AI 手机项目以来,**首位出走的核心硬件负责人**
- 截至发稿前,豆包手机官方未予置评
- 新一代豆包手机或二季度面世
赛豆科技 AIVA ME7 量产:
- 首款量产车 AIVA ME7 将于年内上市
- 搭载火山引擎豆包座舱 + 速腾聚创激光雷达
- 国内 AI 汽车品牌首个量产落地
GEO 启示:
- **微信 A2A 全域开放 = "iOS 系统级 AI 入口"在中国的对位**——Siri AI 与微信 A2A 在两个最大生态中同步释放
- 企业需重新评估"微信内搜索/小程序/公众号/视频号"作为 GEO 新信源通道的可能
- 字节豆包硬件大将出走 + 林夕来自华为终端——**国内 AI 硬件的人才战已经"挖角-反挖角"化**,对豆包商业化节奏(5 月月活减少 610 万)有间接影响
- **AI 入口"两端化"**:消费端是"超级 App + 操作系统"(微信/苹果),企业端是"模型 API + 私有部署"(Anthropic/DeepSeek)——GEO 团队必须在两条路径上同时布局
来源:每日经济新闻 6/12 报道(http://m.toutiao.com/group/7650330090487693865/)
⚡ DeepSeek V4 系列 6/1-6/3 永久降价 75%:腾讯云率先跟进 + 多源深度分析
6/1 官方宣布(永久降价):
- DeepSeek V4 系列促销期 5/31 15:59 UTC 结束,**价格自动转为长期标准价**
- 降幅 **75%** 永久生效(不再是限时促销)
- 新价格区间:$0.003625-$0.87 / 百万 token(原 $0.0145-$3.48)
- 4sapi/Greyhound Research/Counterpoint Research 多方分析师确认:核心是**架构效率**(长上下文推理设计降低 per-token 计算量到 1/4,运行时内存下降到 ~10%),不是补贴
6/3 腾讯云率先跟进:
- 腾讯云智能体开发平台 6/3 0 时起对 DeepSeek-V4 系列调价
- 最高降幅 **97.5%**(缓存命中价格)
- V4-Pro 推理输入/输出价格同步降 75%
- V4-Flash 缓存命中价降 90%
- 同步:GLM 5、MiniMax 2.5、Kimi 2.5 由免费转正式商用按量计费
4sapi 6/6 报告核心数据:
- 输出价 $0.87/M token vs Claude Opus 4.7 ($25)、GPT-5.5 ($30)
- **V4-Pro 输出价约为高端闭源模型的 1/7 到 1/35**
- 60% 重复低复杂度流量可路由到 V4-Pro 自建部署 + 40% 高价值任务保留高端模型——企业月度成本可降 30-50% 而无需生产架构大改
GEO 启示:
- **DeepSeek 永久降价 = 中国 AI 推理成本被永久重置**——对 GEO 监测、批量内容生成、A/B 测试等"高 token 消耗"任务是直接利好
- 60/40 路由模式将成为中型企业 AI 部署的**事实标准**
- 国内 8 大平台 GEO 监测工具应优先将 DeepSeek API 纳入**全量监测**而非"二等公民"
来源:techbriefly 6/1(https://es.techbriefly.com/deepseek-reduce-permanentemente-el-precio-del-modelo-insignia-v4-pro-ai-en-un-75-2-ai-92529/)、4sapi 6/6(https://blog.4sapi.com/blog/deepseek-v4-pro-75-percent-price-reduction)、新京报 6/2(http://m.toutiao.com/group/7646756168081179136/)
⚡ 月之暗面 6/8 启动新一轮融资 + 6/12 Kimi K2.7 Code 开源:300 亿美元估值 + 高速版 6/15 上线
6/8 融资动态:
- 月之暗面启动新一轮融资,**投前估值 $300 亿**(较 2025/12 的 $43 亿增长近 6 倍)
- 半年内累计融资 **超 $39 亿**
- 华峰资本披露:总融资额已超 **376 亿元**,为国内大模型创业公司最高
- 4 月 ARR 突破 **$2 亿**(3 月初刚破 $1 亿)
- 截至 6/12,OpenRouter 榜单 Kimi K2.6 位列全球第 9
6/3 Kimi Work Beta 公测上线:
- 定位"面向知识工作者的本地通用 Agent"
- 核心能力:本地文件全量管控、WebBridge 浏览器自动化、Cron 定时任务、Agent Swarm(300 子 Agent 并行)、Office 输出(PPT/Excel/Word)
- 内核:Kimi Code 技术底座 + K2.6 模型 + K2.5 思考/非思考双模
6/12 K2.7 Code 开源发布:
- 在 K2.6 基础上完成多项优化
- 长上下文编程场景指令理解 + 任务处理强化
- **整体 token 平均消耗降低 30%**
- Kimi Code Bench v2 提升 21.8%、Program-Bench 提升 11%、MLS Bench Lite 提升 31.5%
- 智能体执行能力约 10% 涨幅
- API 定价延续 K2.6:1M token 输入 ¥6.5 / 输出 ¥27(缓存命中输入降至 ¥1.3)
- **K2.7 Code 高速版 6/15 上线**(同模型输出速度 5-6 倍,约 180 token/s、短上下文最高 260 token/s,资费 2 倍)
GEO 启示:
- 月之暗面半年估值 6 倍 + ARR 1 个月翻倍 = **国内开源大模型"商业化拐点"已现**
- Kimi Work 把"Agent"从"云端嘴"挪到"桌面手边"——**企业级 Agent 内容资产需从"网页可读"升级到"本地可调度"**
- K2.7 Code token 消耗降 30% + 高速版输出提速 5-6 倍 = **B2B 编程类 GEO 客户的 token 经济性再次被重置**
来源:未来图灵 6/8(http://m.toutiao.com/group/7648944623146926655/)、太平洋电脑网 6/12(http://app3.myzaker.com/news/article.php?pk=6a2cc3048e9f095f5f7b991f)、智迅文化 6/9(http://m.toutiao.com/group/7649374293133918766/)、ai小能手 6/12(http://m.toutiao.com/group/7650346840793088548/)
⚡ 阿里通义系 6 月连发:千问高考志愿 Agent + Token Foundry 事业部重组
6/10-6/11 通义系密集动作:
- **千问高考志愿 Agent**:发布国内首款全周期高考志愿填报 AI Agent,融合夸克 8 年高考数据;提供志愿日历、志愿报告、志愿问答三大功能;适配老旧机型与弱网环境;面向全国考生免费开放
- **Token Foundry 事业部**:阿里合并通义大模型与未来生活实验室成立,由**集团 CEO 直接管理**,整合多类大模型与生成产品,布局 AI 全产业链
- 千问持续深耕民生 AI 应用(高考志愿为典型场景)
背景对照(5/31 豆包月活-610 万):
- 同期阿里通义千问月活 +1300 万
- **千问"民生高频 + Agent 化"路径 vs 豆包"通用 + 订阅"路径**形成分叉
- 阿里将通义提升至"集团 CEO 直管"级别,组织优先级明确
GEO 启示:
- **国内 AI 平台格局从"通用 Chatbot 铺量"转向"垂类 Agent + 民生高频场景"**——千问高考 Agent、豆包手机、腾讯 WorkBuddy、智谱 SCAIL-2 角色动画都是同方向
- 民生高频场景的"被 AI 引用"机会窗口正在快速打开:**教育、医疗、法律、本地服务**四大类内容的 GEO 优先级应主动上调
- 国内 8 大平台的"垂类 Agent 化进度"应作为 GEO 监测的**新维度**——仅监测"通用搜索引用"已不够
来源:CSDN 6/11 全球 AI 前沿动态(https://happyprince.blog.csdn.net/article/details/161903655)、太平洋科技 5/31(http://m.toutiao.com/group/7649710147815899683/)
二、GEO 策略与实战
⚡ [预告跟进-5] "5% 营销预算用于 GEO"临界线落地实操:多份独立研究给出可执行框架
Presenc AI 6/17 报告(注:原文 5/17,本期参考)核心数据:
- **行业基准**:活跃品牌的 GEO 投入通常占总营销预算 **0.5-3%**;行业领先者达 **4-6%**
- **在有机+内容营销预算中**,GEO 通常占 **3-8%**;领先者达 **10-15%**
- **未投资品牌通常在 0-1%**(多为"SEO/PR 团队做 GEO 而不自知")
GEO 预算子项分配框架:
| 子项 | 占比 | 备注 |
|---|---|---|
| PR 和 earned media | **40-60%** | 驱动 AI 训练数据包含(数字 PR > guest post) |
| 结构化内容生产 | 20-30% | 长尾问题集群 + 50-150 字直接回答段 |
| 技术基础设施 | 10-20% | 含 llms.txt、MCP、Schema |
| 测量和工具 | 10-15% | 含 GEO 监测订阅(如 Presenc AI) |
| Wikipedia + 权威信源 | 5-10% | 长期"被 AI 训练数据包含" |
Derivatex 5/25 报告:B2B SaaS 按 ARR 阶段的 GEO 预算:
- **种子期**(< $1M ARR):月 $2K-$5K,SEO/GEO = 75/25
- **A 轮**($1-10M ARR):月 $7K-$15K,比例 70/30
- **B 轮**($10-30M ARR):月 $15K-$35K,比例 60/40
- **C 轮+**($30M+ ARR):月 $40K-$100K+,比例 55/45
- **关键拐点**:约 $15M ARR 时,SEO 和 GEO 预算趋近持平
Optifai 报告(2025/10)核心数据:
- Gartner 预测 2026 年传统搜索量下降 **25-40%**
- 2025 年全球 AI 搜索引擎市场 $43.63B → 2032 年 $108.88B(CAGR 14.1%)
- 60% B2B 买家已使用 AI 工具做供应商调研(Gartner Q3 2025)
- AI 销售工具使用率:2023 年 34% → 2025 年 78%(2 年 2.3 倍)
- 全球搜索流量中 Perplexity 占 **13%**(vs 2024 年 3%)
- AI 引用源 60-70% 来自排名良好的传统站点
ChatGPT 转化率优势(5/25 报告核心数据):
- ChatGPT 引流转化率 **15.9%** vs Google 自然搜索 **1.76%**(约 9 倍)
- "100% 投 Google SEO = 饿死高转化渠道"——B2B SaaS 应主动重新分配预算
中小企业 90 天最小可行 GEO 方案:
- **第 1-30 天**:技术基础设施(Schema、llms.txt、站点速度)+ GEO 测量工具部署
- **第 31-60 天**:5-10 个"高意图问题"长尾页面(定价/对比/集成/最佳-X)
- **第 61-90 天**:数字 PR 启动(专家评论、播客、行业会议发言),目标是被 earned media 引用
GEO 启示:
- **"5% 营销预算"是有可衡量影响的临界投入线**——低于此难以跑通测量-优化-复利闭环
- **GEO 预算的 40-60% 应投向 PR/earned media**,而非"发文章"——这是 SEO 思维到 GEO 思维的根本转变
- **60-70% AI 引用源 = 高排名传统站点**——传统 SEO 是 GEO 的"基础设施",不能丢
- B2B SaaS 客户应从"种子期 GEO 试点"开始,ARR 拐点($15M)后提升 GEO 预算至与 SEO 持平
来源:Presenc AI 5/17(https://presenc.ai/guides/how-to-budget-for-geo-2026)、Derivatex 5/25(https://derivatex.agency/blog/b2b-saas-seo-spend-by-arr-stage/)、Optifai(https://optif.ai/media/articles/seo-decline-geo-rise-ai-search/)、Gartner 2026 预测(VentureBeat 转载)
⚡ CSDN 6/5 引用机制技术解析(中等质量但数据有出处):80% 联网率 + AirOps 16851 次查询实证
80% 联网率(Cloro.dev,52 国 5200 次查询):
- ChatGPT 联网搜索使用率 **>80%**
- 技术含义:推理流程从"纯生成"转向"检索+生成"
- 对 GEO 的直接启示:**内容必须对 AI 爬虫可见,且必须在检索排序中靠前**
引用排名分布(AirOps 16,851 次查询):
- Position 1 被引用率 **58.4%**
- Position 11 被引用率仅 **14.2%**
- 反映 RAG 架构的"Top-K 截断"特性——第 K 位之后的文档根本进不了候选集
- 排序模型(BM25 + 神经排序器)的质量直接决定 LLM 看到的内容
85% 被引页面已有传统排名:
- AirOps 实证:85% 被 ChatGPT 引用的页面已在传统搜索中至少有一个关键词排名
- 原因:ChatGPT 检索依赖 Bing 索引
- **传统 SEO 优化(页面结构、加载速度、移动端、结构化数据)直接影响 GEO 效果**
个人创作者权重上升(Profound 研究):
- LinkedIn 在 ChatGPT 引用中排名从 #11 升至 **#5**
- 59% 引用来自个人创作者
- 原因:知识图谱"实体消歧"——公司官方内容偏"品牌视角",个人创作者偏"专业视角"
- AI 更倾向引用"信息密度高、立场客观"的内容
llms.txt 部署率仍极低:
- 仅 **7.4%** 的 Fortune 500 部署了 llms.txt
- llms.txt 类似 robots.txt + sitemap.xml 的"AI 站点摘要"
- 作用:帮 AI 快速理解站点主题领域,优先抓取高价值页面
Agentic Search 时代(Google 印度餐厅预订任务):
- 传统 AI 搜索:Query → 检索 → 生成
- Agentic Search:Query → 检索 → **调用工具** → **执行任务** → 返回结果
- 内容优化要考虑"被工具调用"——结构化任务步骤、API 接口、可操作流程
GEO 启示:
- **RAG 架构是 GEO 优化的"地基"**——脱离传统 SEO 的 GEO 是空中楼阁
- 优化优先级:检索排序(SEO 基础)> 信息密度(精准 > 全面)> 实体消歧(个人专业内容权重)> 结构化站点摘要(llms.txt 部署)> 任务适配(Agentic 时代)
- 50-150 字"自包含直接回答段" + 30 天更新周期仍是黄金法则
来源:CSDN 6/5(https://blog.csdn.net/ZSYGEO/article/details/160314261,原作者"智搜云 GEO")、Cloro.dev、AirOps、Profound、llms.txt 部署率统计
三、行业趋势与市场洞察
⚡ 国内 6 月 AI 模型"集中爆发期"全景:DeepSeek/Kimi/小米 MiMo/U2/SCAIL-2 齐发
2026/4/24 起的"卷王集中爆发期"延烧到 6 月:
- 一周内 OpenAI、月之暗面、阿里、智谱、MiniMax、DeepSeek 相继发布重磅模型
- 6 月延续发布:Anthropic Fable 5 + Mythos 5(6/10)、Kimi K2.7 Code(6/12)、腾讯云调价(6/3)
6 月新发布清单(CSDN 6/11 整理 + 多源补充):
| 模型/产品 | 发布方 | 日期 | 核心亮点 |
|---|---|---|---|
| **Claude Fable 5** | Anthropic | 6/10 | 公测版 6/22 前免费;2 月代码迁移缩至 1 天 |
| **Claude Mythos 5** | Anthropic | 6/10 | 仅网络安全合作方;解除多数安全限制 |
| **Claude Sonnet 4.6 重大升级** | Anthropic | 6/9 | 1M 上下文;OS World/SWE-Bench 领先 |
| **Kimi K2.7 Code** | 月之暗面 | 6/12 | token 消耗 -30%;Bench 提升 11-31.5% |
| **Kimi K2.7 Code 高速版** | 月之暗面 | **6/15 上线** | 5-6 倍速度提升 |
| **Kimi Work Beta** | 月之暗面 | 6/3 | 本地 Agent;300 子 Agent 并行 |
| **GPT-5.6 内测** | OpenAI | 6 月 | UI 生成/视觉升级;部分能力弱于 Claude Mythos 5 |
| **MiMo-V2.5-Pro-UltraSpeed** | 小米 | 6 月 | 推理速度 1000-1200 tokens/s;8 卡 GPU 即可跑 |
| **新程 Alpha 认知模型** | 中国团队 | 6 月 | 仅 4B 参数;群体智能比肩 GPT-5.4 |
| **U2 原生智能体大模型** | 云知声 | 6 月 | 接近 3000 亿参数;端到端完成编程 |
| **星火医疗 V3.5** | 讯飞 | 6 月 | 全国产算力;临床诊疗 + 居民健康管理 |
| **SCAIL-2 角色动画** | 智谱 + 清华 | 6 月 | 开源;端到端;6 万对视频数据集 |
| **Core AI 框架** | 苹果 | WWDC 6/9 | 接替 Core ML;适配全苹果设备 |
| **ADP 4.0** | 腾讯云 | 6 月 | 企业智能体开发框架;自然语言配置 |
| **Token Foundry 事业部** | 阿里 | 6 月 | 集团 CEO 直管;通义+未来生活实验室合并 |
| **AIVA ME7** | 赛豆科技 | 年内 | 国内首款 AI 汽车量产;豆包座舱 |
DeepSeek V4 国产算力里程碑:
- 深圳河套学院基于**昇腾 910C 集群**完成 DeepSeek-V4-Pro 1.6 万亿参数全参数后训练
- MFU 达 **34.9%**
- 验证**国产算力可支撑超大规模模型训练**
Anthropic 模型矩阵格局:
- "Opus / Sonnet / Fable / Haiku" 四级 + "Mythos 防御专项" 五线
- **Fable 5 的"训练抑制"机制 = Anthropic 在"防止自家模型被蒸馏"上的明确防御**
- 对依赖 Anthropic API 做二次训练的中游厂商是直接打击
GEO 启示:
- **"6 月集中爆发"印证 2026 是"AI 模型年"而非"GEO 服务年"**——GEO 服务商必须围绕"模型更新节奏"重建交付节奏
- **国产算力支撑 1.6 万亿参数全参数后训练 = 中国 AI 自主可控进入"工程现实"**——对国内 AI 引擎的"被引用权重"中长期看涨
- **苹果 Core AI 框架开源 + 下载量 <200 万 App 免费** = Apple Intelligence 端侧化进入"工具普及"阶段
- GEO 团队应建立"模型更新监控机制"——每月 1 次大模型更新盘点
来源:CSDN 6/11 全球 AI 前沿动态(https://happyprince.blog.csdn.net/article/details/161903655)、Anthropic 官方、各厂商公告
⚡ 5 月以来国内 AI 商业化大盘:C 端年亏 200 亿 + 通义逆势涨 1300 万 + 字节净利润 -70%
C 端整体亏损(中金预测 2026):
- 2025 年国内 C 端通用大模型应用整体亏损 **180 亿元**
- 2026 年预测突破 **200 亿元**
- 豆包单月净亏损 2.1-2.7 亿元
- 字节 2025 年净利润同比下滑 **超 70%**
豆包 5 月月活拐点(6/3-6/10 多家媒体跟进):
- 5 月月活从 **3.36 亿 → 3.30 亿**,环比减少 610 万(降幅 1.81%)
- 自 2023 上线以来**首次大规模流失**
- 同期阿里通义千问月活**逆势增长 1300 万**
- 流失导火索:5 月初 App Store 悄然更新付费定价(3 档月 68/200/500 元,年 688/2048/5088 元)
- 用户反馈焦点:付费版"与免费版差异不大","幻觉"问题仍重(用户反馈"先让豆包生成报告,再扔给千问/文心核查")
- 摩根士丹利测算:付费转化率 1-1.5% 即可带来 4.26-6.84 亿美元年化订阅收入
6 月字节 AI 投入规划:
- 字节 2026 年 AI 投入约 **1600 亿元**
- **850 亿专项 AI 芯片采购**
- 同步:组织上"硬件大将林夕 6/11 出走"——AI 硬件路径不确定
商业化路径分叉:
- **豆包**:通用 + 订阅制 + 工具付费(付费信任问题)
- **千问**:垂类 Agent + 民生高频 + 集团 CEO 直管
- **腾讯元宝**:搜索服务深度化(汤道生:"最期待的是搜索服务做得越来越好,引入更多实时数据源、权威数据源和专业数据")
- **DeepSeek**:开源 + API 永久降价 75% + 60/40 路由建议
- **Kimi**:Work 本地 Agent + K2.7 Code 开源 + 估值 6 个月 6 倍
GEO 启示:
- **"豆包月活减少 610 万 + 通义 +1300 万" = 国内 AI 平台马太效应未现 + 用户"用脚投票"成常态**
- 中小企业的 GEO 预算**不会因豆包收费而向豆包倾斜**,反而可能因不确定性向"主流多平台铺"迁移
- **B2B GEO 客户应优先"多平台均匀监测"而非"押注单一平台"**
- 国内 8 大平台引用偏好应按"商业化模型"分组:通用订阅(豆包/百度/文心)/ 垂类 Agent(千问/智谱)/ 搜索深度(元宝/Kimi)/ 开源 API(DeepSeek)四象限
来源:太平洋科技(http://m.toutiao.com/group/7649710147815899683/)、《中国企业家》、Vista 看天下、36 氪、东方财富网、增长黑盒、智东西
四、AI 搜索算法与技术前沿
⚡ TechGraphRAG 论文(arXiv 2606.01613):面向技术文献推理的 Agentic Graph-Augmented RAG 框架
论文核心创新(5 个路由 + 结构化分块 + 混合检索 + 智能体评估):
1. 5 个查询路由(多分类并行):
- **Bibliometric**:文献计量分析(OpenAlex API,publication_year 聚合)
- **Trend**:研究演变/出版量趋势
- **Content**:技术内容分析(学术 API 为主)
- **Methods**:方法学对比
- **Current_world**(辅助):公司战略、市场数据、监管、行业新闻(绕过学术 API,走 web search)
- 分类器返回**主路由 + 适用路由列表**
2. Structure-Aware 分块(离线):
- **Section-Aware 分块**:基于 section 头分块,chunks 严格不跨 section
- **Paragraph-Aware 分块**:段内合并为完整语义单元
- 分块大小:目标 **3,500 字符**(min 300 / max 6,000),重叠 **400 字符**
- **每个 chunk 是 self-contained 语义单元**,对齐自然结构
3. 混合检索(Step 2):
- **Dense 语义嵌入**:sentence-transformers/all-MiniLM-L6-v2,384 维
- **Sparse lexical**:BM25(领域感知归一化,保留 alphanumeric tokens / acronyms / 技术符号)
- **融合策略**:Reciprocal Rank Fusion (RRF)
- **Cross-encoder rerank**:cross-encoder/ms-marco-MiniLM-L-6-v2
4. 证据充分性评分(Step 3,5 维 100 分制):
- 检索置信度(40 分):Cross-encoder reranker 分数
- 答案特异性(25 分):chunk 是否含具体数据/方法/方程/结果
- 信源多样性(15 分):独立论文数
- 元数据完整性(10 分):section 标签/页码/可提取年份
- 时效/意图匹配(10 分)
5. 决策阈值:
- **80-100 STRONG**:仅用内部语料,跳过外部搜索
- **50-79 MODERATE**:内部语料 + 可选外部增强
- **0-49 WEAK**:触发 Step 4 智能体重试 + Step 5 外部学术搜索
GEO 启示:
- **学术/技术文献领域的"高质量检索"已成为新基准**——RAG 不再是"找 Top-K 文档",而是"5 维 100 分评估证据充分性"
- Section-Aware 分块 = 内容应"按学术结构组织"——这对 B2B 行业 GEO 是直接借鉴
- 证据评分机制 = 未来的 GEO 监测工具应引入"AI 引用证据质量评分"而非"是否被引用"二分法
- **Agentic RAG 的 5 路由分类器** = 提示工程层需要"查询路由感"——把"商业问题"和"技术问题"分开优化
来源:arXiv 2606.01613v1(https://arxiv.org/html/2606.01613v1)
⚡ QDRAG 论文:稀疏 RAG + Query Decomposition 解决多跳问题的"过度引用"难题
核心问题(C-1/C-2/C-3):
- **C-1**:Dense RAG 上下文有噪声,MLLM 注意力分散 → 引用质量低
- **C-2**:现有多跳 QA 的 QD(query decomposition)方法对子问题上下文相关性评估不准
- **C-3**:QD 模型对多模态、动态上下文的泛化能力差
核心创新:
- **QD-C**(Context-Guided Query Decomposition):拆为两个算子——entity replacement(处理指代实体)+ open decomposition(独立子问题)
- **QD-R**(QD with Retriever Feedback):以"golden context 召回率"作为 QD 计划的 reward,DPO 直接优化 QD 任务
- 两种方法**消除人工编写 in-context 示例**,QD-C 即插即用,QD-R 泛化能力更强
实验结论:
- 稀疏 RAG(带重排序)在 single-hop 问题上**答案+引用都更优**
- 但直接套用到 multi-hop 问题上**答案质量下降**——稀疏 RAG 丢弃了 golden context
- **QDRAG 是首个在 single-hop 和 multi-hop 都显著优于 dense RAG 的方法**
GEO 启示:
- **"答案准确 vs 引用准确"是两个独立维度**——GEO 监测工具不应只看"是否被引用",还要看"引用是否准确"
- **Sparse RAG 的"过滤/去噪"能力 = GEO 的"高密度段落"价值**——内容应避免"水化",目标高信号密度
- **多跳查询 = 用户真实场景**("哪家 GEO 服务商最适合跨境电商品牌" = 多个子问题组合)——内容优化应考虑"多跳可拆解性"
- **QD-C 的 entity replacement** = 内容优化应处理"同义词/近义词/品牌别名"以提升 LLM 实体识别
来源:arXiv QDRAG 论文(多模态长引用版本)
⚡ AI 引用幻觉研究 6/11 突破:商业深度研究代理 78-94% 准确率
核心数据:
- **Pickaxe 6/11 综述**:跨 13 个 LLM × 40 个研究领域基准,**引用幻觉率 14-95%**(按模型/领域差异极大)
- **医学系统综述**:GPT-4 引用幻觉 28.6% → 旧模型高达 **91.4%**
- **商业深度研究代理 2026 专项研究**:
- OpenAI Deep Research 引用准确率 **78%**
- Claude with search 引用准确率 **94%**
- **6-22% 错误率仍是"业务决策级别"问题**
两类失败模式(学术界标准分类):
- **Citation hallucination**:引用本身不存在(假 DOI/假论文/假 URL)
- **Statement hallucination**:引用真实但 AI 说的不是引用里写的——**更隐蔽,链接可点,源是真的,但内容被误读**
人类验证缺口:
- 87% 研究人员声称"总是验证 AI 引用"
- 42% 承认"复制粘贴引用数据时不检查"
- **验证缺口是 GEO 内容被"误引"的最大隐患**
Grounding Stack 三层架构:
- **Layer 1(Live sources)**:实时 web search / 学术数据库 / 结构化数据 feeds
- **Layer 2(Retrieval + grounding)**:RAG 检索 + 上下文窗口注入
- **Layer 3(Generation with citation rules)**:明确"每条事实必须带引用""必须直接引用而非意译""找不到就写'无法验证'"
GEO 启示:
- **"被 AI 引用" ≠ "被 AI 准确引用"**——GEO 监测应建立"引用准确率"作为二级指标
- 78-94% 的引用准确率 = 6-22% 的内容有被"误引"风险
- **GEO 团队应主动建立"反误引"机制**:定期抽样 AI 引用,验证内容匹配度
- Claude 引用准确率 94% 显著领先 = **Anthropic 引用权重应作为高价值信源**
来源:Pickaxe 6/11(https://pickaxe.co/post/ai-research-agent)、2026 商业研究代理专项研究、Bloomberg 5/29 金融分析师文献综述提速 25% 报告
五、上期预告落实(6/15 周一 · GEO 周初观察)
| # | 上期预告(6/11 周四版) | 本期落实情况 | 状态 |
|---|---|---|---|
| 1 | Perplexity Search as Code 生态影响实测 | 多家媒体 6/8-6/9 跟进;The Decoder "Code is the New Interface Layer"评价;Anthropic `web_search_20260209` 同步走"代码驱动多步检索"路线 | ✅ 已落实(国际动态首条) |
| 2 | ChatGPT Ads CPA 6/5-6/14 真实转化数据 | 6/9 Criteo 报告:试点 6 周年化破 $1 亿、零售品类转化率近 2 倍;6/8 Codex 合并;6/5 起全面开放 | ✅ 已落实(国际动态第 2 条) |
| 3 | OpenAI 1万亿 IPO 估值对中国 GEO 行业连锁影响 | 6/8 S-1 提交确认;估值锚定 $730B-$1T;Anthropic 5/28 完成 $650 亿 H 轮估值 $9650 亿首次超过 OpenAI;6/1 也提交 S-1;三剑客 IPO 合计估值 $4 万亿 | ✅ 已落实(国际动态第 3 条) |
| 4 | 国内 8 大 AI 平台 6 月算法更新盘点 | 6/3 微信 A2A 全域开放、6/1-3 DeepSeek V4 永久降价 75%、6/3 Kimi Work Beta、6/8 月之暗面融资 $300 亿、6/10 阿里千问高考 Agent + Token Foundry 事业部、6/12 Kimi K2.7 Code 开源 | ✅ 已落实(国内动态全条) |
| 5 | "5% 营销预算用于 GEO"临界线落地实操 | Presenc AI 5/17 报告:活跃品牌 GEO 占总营销 0.5-3%、领先者 4-6%;Derivatex 5/25 报告:B2B SaaS 按 ARR 阶段预算;Optifai 报告:ChatGPT 转化率 15.9% vs Google 1.76% | ✅ 已落实(策略与实战首条) |
5 项预告全部落实。
六、本期核心洞察与下期预告
⚡ 本期核心洞察
- **OpenAI 6/8 S-1 + Anthropic 6/1 S-1 + SpaceX IPO 筹备 = AI 行业"三剑客"进入"估值锚定 + 上市倒计时"阶段**:万亿 IPO 估值传导至 AI 搜索广告定价、引用权重、API 价格全方位;Anthropic 引用权重中长期看涨(B2B 安全叙事被资本市场确认溢价);OpenAI CPM $60 成为全球 AI 搜索广告"高端参考线"。
- **DeepSeek V4 永久降价 75% + Kimi 估值 6 个月 6 倍 = 中国 AI 进入"成本重置 + 商业化拐点"双拐点**:60/40 路由模式成为中型企业 AI 部署事实标准;Kimi Work + K2.7 Code 共同推动"Agent 从云端到桌面"——企业级 Agent 内容资产需从"网页可读"升级到"本地可调度"。
- **微信 A2A 6/4 全域开放 + 苹果 Core AI 框架 + 字节豆包手机硬件大将出走 = AI 入口"两端化"已成现实**:消费端是"超级 App + 操作系统"(微信/苹果),企业端是"模型 API + 私有部署"(Anthropic/DeepSeek)——GEO 团队必须在两条路径上同时布局。
- **国内 6 月"模型集中爆发期"延烧**:Anthropic Fable 5 + Mythos 5、Kimi K2.7 Code、小米 MiMo-V2.5-Pro-UltraSpeed、U2 原生智能体、星火医疗 V3.5、智谱 SCAIL-2、Core AI 框架、ADP 4.0、AIVA ME7、Token Foundry 事业部 16 款重磅同月发布——**"GEO 服务商必须按月重建交付节奏"**。
- **AI 引用准确率研究突破**:商业深度研究代理引用准确率 78-94%(OpenAI 78% / Claude 94%),但 6-22% 错误率仍是业务决策级别问题;**"被 AI 引用" ≠ "被 AI 准确引用"**——GEO 监测应建立"引用准确率"作为二级指标,"反误引"机制成为新基础设施。
- **"5% 营销预算"是有可衡量 GEO 影响的临界投入线**:Presenc AI 5/17 数据显示活跃品牌 0.5-3%,领先者 4-6%;GEO 预算 40-60% 应投向 PR/earned media 而非"发文章"——这是 SEO 思维到 GEO 思维的根本转变;B2B SaaS 在 ARR 拐点($15M)后应将 GEO 预算提升至与 SEO 持平。
- **国内 8 大平台"商业化模型"分叉决定 GEO 策略分组**:通用订阅(豆包/百度/文心)、垂类 Agent(千问/智谱)、搜索深度(元宝/Kimi)、开源 API(DeepSeek)四象限——B2B GEO 客户应按象限优化而非"全平台铺"。
- **议题 1:6/18 专题"分引擎信源权重矩阵"实测预告**:将基于 6/11 头部 GEO 调研的 7×5 信源权重框架 + 6/13 5 家硬资质核验,给出可被 32 客户复用的"信源权重 + 引用密度"双维度矩阵
- **议题 2:arXiv 高频词偏见论文(人民大学等)+ EmbedFilter 对 GEO 的启示**:6/13 已收到该论文推送,6/18 专题将深入展开"AI 引擎引用 = LLM 文本嵌入机制"这一核心命题
- **议题 3:6/19 周报预告**:本周(6/15-6/19)将出 6/15(本期日报)+ 6/16(周二技术展示日)+ 6/17(周三实战案例日)+ 6/18(周四深度专题日)+ 6/19(周五科普日)共 5 个产物,下期周报将汇总分析
- **议题 4:国内 8 大平台"6 月底算法更新"盘点**:豆包流失 610 万后官方会否调整付费策略?通义 Token Foundry 成立后模型更新节奏?元宝"搜索服务深度化"路径?——6 月底是观察窗口
- **议题 5:备案盲点后续**:6/14 发现官网无 ICP 备案 → 6/19 之前能否拍板备案三选项(A/B/C),将直接决定 7 月起官网在 AI 引擎的"被引用率"
📅 下期预告(6月18日 周四 · GEO 深度专题方向)
按 6/13 19:44 拍板的 E 选项战略,6/18 深度专题为"分引擎信源权重矩阵 + arXiv 学术论文"方向。本期日报将先就 6/18 弹药库中2 个核心议题做预告:
声明:以上内容仅为信息整理与行业观察,不构成任何商业建议。数据来源包括 Google/Anthropic/Alibaba/字节跳动/Microsoft/Perplexity/Apple/OpenAI/月之暗面/腾讯 官方公告、Anthropic Platform Docs、arXiv 学术论文、Pickaxe/Cloro.dev/AirOps/Profound/Presenc AI/Derivatex/Optifai/Gartner/Criteo/PitchBook/TradingKey/VentureBeat/The Verge/36 氪/中国企业家/智东西/太平洋科技/新京报/每日经济新闻/CSDN/未来图灵/智迅文化 等权威机构及媒体,所有事实和观点均标注具体来源,读者可追溯验证。GEO 领域发展迅速,建议结合最新官方公告和实际测试综合判断。
发布机构:GeoAurora(武汉沐辰数智科技有限公司)GEO研究团队
发布日期:2026年6月15日
声明:以上内容仅为信息整理与行业观察,不构成任何商业建议。数据来源包括 Google/Anthropic/Alibaba/字节跳动/Microsoft/Perplexity/Apple/OpenAI/月之暗面/腾讯 官方公告、Anthropic Platform Docs、arXiv 学术论文、Pickaxe/Cloro.dev/AirOps/Profound/Presenc AI/Derivatex/Optifai/Gartner/Criteo/PitchBook/TradingKey 等权威机构及媒体,所有事实和观点均标注具体来源,读者可追溯验证。GEO 领域发展迅速,建议结合最新官方公告和实际测试综合判断。
发布机构:GeoAurora(武汉沐辰数智科技有限公司)GEO研究团队
发布日期:2026年6月15日