生成式AI
一、OpenAI新模型GPT Image 2泄露,文字渲染突破
1. OpenAI新生图模型GPT Image 2在LM Arena以maskingtape等代号短暂泄露,在文字渲染、指令跟随、真实感和世界知识四维度均超越Nano Banana Pro;
2. 可精准渲染中文字形、生成逼真证件样式图和UI截图,让"截图作为证据"的可信度受到质疑;
3. DALL-E 2/3将于5月12日正式停服,正式发布窗口预计在退役前后。
二、Anthropic推出Claude Design,Figma股价下跌
1. Anthropic推出Claude Design,基于Opus 4.7模型支持通过对话生成可交互原型、PPT、单页文档等视觉作品;
2. 提供Tweaks、Comment、Edit、Draw等精细修改方式,可导出至Canva、PPTX、HTML或交给Claude Code生成代码;
三、智谱AutoClaw澳龙上线自进化机制与Skill商店
1. 智谱AutoClaw上线自进化机制,每轮对话后自动扫描值得记住的经验,经用户审批后写入记忆成为新能力;
2. 提供关键词触发与自动检测两种进化方式,保持每周1-3次的高质量进化而非噪音堆积;
3. 同步上线Skill商店与GLM Office Skills五件套,覆盖PPT、DOCX、XLSX、PDF、Charts全场景办公。
前沿科技
四、Physical Intelligence发布π0.7,VLA涌现时刻
1. Physical Intelligence发布5B参数VLA模型π0.7,首次在机器人领域证明组合泛化能力,可将学过的原子技能组合解决新任务;
2. 核心方法是将prompt展开为任务指令、子任务指令、子目标图像、元数据四层,让模型吃下多样化数据;
3. 在做咖啡、叠衣服、装箱三个任务上,通才模型开箱即用就追平甚至超过经过微调的专家模型。
五、人形机器人半马开跑,前三名均为荣耀「闪电」机型
1. 2026北京亦庄人形机器人半程马拉松开跑,300余台机器人、26个主流品牌参赛,齐天大圣队以50分26秒夺冠;
2. 前三名全部跑进53分钟,大幅刷新去年冠军2小时40分的成绩,冠亚军仅差30秒;
3. 赛道全长21.0975公里,首次引入南海子公园生态路段,融合平地、坡道、弯道等10余种地形。
六、高德发布ABot全栈技术,空间智能走向物理世界
1. 高德发布ABot具身智能技术基座,由世界模型、导航模型N系列、操作模型M系列和Harness架构构成"三位一体";
2. ABot-World首创物理硬约束训练与双引擎自进化系统,在WorldArena榜单超过Veo 3.1达10%;
3. 宣布开源ABot-World、ABot-M、ABot-N、ABot-Claw全栈能力,推动空间智能成为行业基础设施。
七、OpenAI发布GPT-Rosalind,专攻生命科学研究
1. OpenAI发布生命科学推理模型GPT-Rosalind,目标加速平均10-15年的药物研发与转化医学进程;
2. 该模型在蛋白质化学推理、基因组学分析、生物化学知识和科学工具调用上表现更强;
3. 采用可**问部署架构,首批向安进、莫德纳、艾伦研究所、赛默飞世尔科学等机构开放。
报告观点
八、群核科技登陆港股,对话创始人黄晓煌谈空间智能
1. 群核科技4月17日登陆港股,成为"杭州六小龙"首家完成IPO的企业,创始人黄晓煌押注空间智能未来;
2. 黄晓煌解析世界模型、空间智能、具身智能三者关系:从脑中预测世界到三维建模再到作用现实世界;
3. 空间智能最大瓶颈是缺乏高精度多模态真实数据,中美路线分野:美国贴近虚拟世界、中国贴近物理世界。
👇加入AGI数据库,AI智能问答
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/272518.html