生成式AI
一、Claude Code重构上线Routines,Opus 4.7本周发布
1. Anthropic重构Claude Code桌面端,支持同窗口并行多任务、侧边栏管理、集成终端与Diff查看器,开发体验大幅升级;
2. 推出Routines功能,支持定时、API、GitHub三路触发,云端托管让Claude Code合上电脑也能24小时自动干活;
3. 旗舰模型Claude Opus 4.7本周上线,同步推出直接生成网页和演示文稿的设计工具,挑战Adobe、Figma等巨头。
二、OpenAI发布GPT-5.4-Cyber,面向网络安全防御人员
1. OpenAI推出专为网络安全场景微调的GPT-5.4-Cyber模型,面向经认证的安全防御人员开放,支持二进制逆向分析等高级防御能力;
2. 通过网络安全受**问(TAC)框架分级授权,在合法防御场景降低拒绝门槛,优先提供给经审核的安全厂商和研究人员;
3. 被视为对标Anthropic上周发布的Claude Mythos,但两家路线分化:一条做更能打的安全模型,一条做更可控的智能系统。
三、李飞飞World Labs开源Spark 2.0,手机可跑亿级粒子
1. World Labs发布并开源Spark 2.0,基于THREE.js的动态3D高斯点云渲染引擎,让手机浏览器也能流畅运行上亿粒子的超大3D场景;
2. 核心技术包含连续LoD树、.RAD流式格式与GPU虚拟内存,移动端预算约50万splat、桌面端250万,帧率稳定;
3. 与Marble创作平台深度绑定,形成从文本生成3D世界到网页渲染交付的完整链路,推动开源3DGS生态发展。
四、谷歌Gemini Robotics-ER 1.6,仪表读数率升至93%
1. 谷歌推出Gemini Robotics-ER 1.6,在视觉空间理解、任务规划与成功判断能力上全面升级,支持原生调用Search与VLA等功能;
2. 新增仪表读数能力,结合Agentic Vision技术读取压力表、液位计等,成功率达93%,较上一代23%飙升300%;
3. 与波士顿动力合作,赋能Spot四足机器人实现工业场景全自主巡检,同时在物理安全约束遵守方面明显提升。
五、阿里ATH发布Meoo秒悟,自然语言一分钟生成网站
1. 阿里ATH事业群发布AI开发工具Meoo(秒悟),零门槛自然语言描述即可生成前后端完整网站和H5页面,最快1分钟生成;
2. 集成千问、Kimi、GLM、MiniMax四大模型,内置阿里云数据库、存储、域名、FC沙盒等核心服务,一键部署上线;
3. 创新支持蜂群Agent模式,多个Agent并行处理任务;Agent模式可自主规划拆解任务,遇到问题自我检测和修复。
六、Chrome上线Gemini Skills,浏览器变身免费智能体
1. 谷歌Chrome推出Gemini Skills,免费内置,可将常用提示词一键保存为可复用技能,斜杠键快速调用;
2. 预置50多个现成技能库,涵盖食谱营养、成分分析、视频总结等场景,支持跨设备同步与自定义修改;
3. 杀手级能力是单个技能可同时读取多个标签页并排对比,涉及日历邮件等实际操作会先确认再执行。
前沿科技
七、英伟达开源量子AI模型Ising,纠错速度提升2.5倍
1. 英伟达推出全球首个开源量子AI模型系列Ising,包含校准与解码两类模型,直接拉动美股量子计算概念股集体飙升;
2. Ising Decoding解码速度比开源标准pyMatching快2.5倍、精度高3倍;Ising Calibration把校准时间从数天缩短至数小时;
3. 黄仁勋称AI将成为量子机器的"操作系统",把脆弱量子比特转化为可扩展的量子GPU系统,QPU有望成数据中心下一代协处理器。
👇加入AGI数据库,AI智能问答
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/265696.html