2026年3月,谷歌正式启动macOS版Gemini原生应用早期Beta测试,本次测试仅向受邀用户开放,核心将上线“桌面智能”功能,支持AI深度理解屏幕内容上下文交互,同时搭载Nano 、Veo等模型满足多媒体生成需求,此举主要为应对ChatGPT、Claude等竞品在Mac桌面端的布局,补全自身AI生态落地场景。
过去两年大模型C端竞争的焦点始终集中在网页端和移动端,但随着办公场景AI需求的持续爆发,桌面原生应用已经成为头部玩家新的必争之地。此前OpenAI、Anthropic均已率先推出Mac原生应用,支持跨应用内容调取、文档识别等功能,在办公场景的用户渗透率远超纯网页端AI工具。而谷歌此前在苹果桌面生态始终仅提供网页版Gemini入口,入口较浅、功能受限的问题长期被用户诟病,市场份额也持续被竞品分流。
本次启动的macOS版Gemini测试目前仅面向受邀用户开放,核心亮点是即将上线的“桌面智能(Desktop )”功能。根据测试版代码显示,该功能将赋予Gemini系统级的屏幕内容理解权限,参考安卓端已经落地的Gemini Live屏幕共享模式,用户无需手动上传截图、文档,直接呼出Gemini即可基于当前屏幕显示的内容完成交互——比如总结正在浏览的行业报告核心观点、提取打开的表格数据生成可视化图表、基于PPT草稿优化内容逻辑等。
除此之外,参与测试的用户已经可以调用Nano Banana、、Lyria等多个细分模型,完成图文、视频、音频等不同类型的多媒体内容创作。作为原生桌面应用,macOS版Gemini支持全局快捷键唤醒,无需跳转浏览器即可调用,响应速度较网页版有明显提升。
从谷歌的AI布局来看,本次macOS版Gemini的测试只是其补全桌面生态的第一步。据了解,谷歌后续还将推出Windows版原生Gemini应用,同时打通网页端、移动端、桌面端的用户数据与使用上下文,实现多端场景的无缝衔接,比如用户在手机端生成的内容大纲,在桌面端打开即可直接结合本地文件继续优化。
当前大模型行业的竞争已经从参数规模的比拼转向落地场景的覆盖,谁能抢占更多用户高频使用的场景入口,谁就能在C端市场获得更稳固的用户粘性。谷歌此次加快桌面端AI产品的落地,也意味着接下来头部玩家在桌面办公场景的竞争会进一步加剧。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/247376.html