Gemini3正式发布,采用Transformer的MoE,原生支持文本、视觉和音频等多模态输入,构建最强全模态推理能力。具体测试看Gemini3先进性体现在:(1)推理能力。Gemini3 Pro在各项AI基准测试中,LMArena排行榜1501的Elo评分高居榜首,GPQADiamonds达到91.9%的准确率,在Humanity’s Last Exam不使用任何外部工具取得37.5%的成绩。(2)多模态理解能力。从Gemini 1.0即确立原生多模态和长上下文的原则,致力于原生且无缝理解文本、图像或音频等信息模态之间的内在联系和差别。Gemini3 Pro在多模态理解上达到新高度,MMMUPro取得81%成绩、Video-MMMU达87.6%。(3)编码能力。基于推理和多模态能力,Gemini3 Pro仅需非常简单的自然语言描述,即可交付出视觉丰富、可交互的前端界面或应用实体。

  重构用户体验,全栈优势体现:Gemini3发布即全面集成到搜索AIMode下,Gemini APP用增年内有望进一步提速。(1)Google为应对Chatbot对传统搜索冲击,24年起推出AIO和AIMode模式,目前搜索AIO已覆盖20亿MAU、AIMode DAU达7500万。此次Gemini3发布即上线AIMode,重塑传统搜索从单点查询—>散点主动规划生成。(2)我们观点为底模能力为应用(用增)第一生产力。Gemini 25Q1 DAU 3500万–>25Q2 MAU 4.5亿–>25Q3 MAU 6.5亿,Gemini3 Pro上线及后续NanoBanana2集成(更强语义理解能力、更简易自然语言交互、更强中文能力),看好Gemini APP、及Google AI系列用增进一步上行。(3)比直接落地更重要的是Gemini 3优化了用户交互【看见并交互】,比如让搜索实现了“生成式用户界面”(Generative UI)。AI不再只是生成内容,开始实时动态生成一个为用户搜索量身定制的可视化界面。对于用户而言,这意味着信息获取从“阅读”升级为“体验”,不仅是文字、图文简单交互,这是应用场景的巨大进步。

  重构生产力范式:全新AIIDEGoogle AntiGravity,从AI辅助写代码到AI合作开发。基于Google AntiGravity,开发者可以在更高的抽象层级下达任务,Gemini3会自主将其分解为子任务,规划执行路径开始编码,并通过浏览器验证运行效果。

  我们观点是:科技大厂更强调全栈能力,硬件(自研芯片、数据中心等)-研究层(AGI探索)-模型-应用(产品、平台),全栈路径的最大优势在于速度和协同。(1)速度:能大幅缩短模型开发完成与在产品中展示给大量用户之间的时间。(2)协同:谷歌搜索产生的大量用户数据将为Gemini模型后训练带来极强数据优势,即应用数据-模型训练具有明显飞轮效应。模型能力强化将带来Gemini算力消耗大幅增加,有望反哺上游google cloud需求增长,且谷歌TPU在Gemini的训练具有明显效率优势,即云/硬件-模型能力具有飞轮效应。因此我们看好谷歌全栈AI能力的飞轮效应,对标国内同样具备全栈优势的阿里巴巴。

  投资建议与投资标的

  (1)我们看好具有硬件-研究-模型-应用场景全栈AI路径的科技大厂,相关标的:阿里巴巴-W(09988,买入)、谷歌(ALPHABET)-A(GOOGL.O,未评级)。

  (2)重视其他具备模型能力的厂商及相关产业链,以及受益于底模能力迭代、下游应用场景体验改善,相关标的:腾讯控股(00700,买入)、快手-W(01024,买入)、美图公司(01357,买入)、同道猎聘(06100,未评级)、北森控股(09669,未评级)

  风险提示AI技术迭代不及预期、AI应用落地不及预期、AI商业化变现不及预期。(来源:研报虎)