大家好,这里是K姐。
一个帮你追踪最新AI应用的女子。
前几天,月之暗面突然扔下重磅消息:Kimi K2 正式发布。总参数 1T,激活参数 32B,直接开源,还能免费商用。
参数一口气卷到万亿级,刷新了目前开源模型的记录。
在一堆权威基准里,K2 拿到了开源模型的最好成绩,尤其在编程、工具调用、数学推理这几个方向,表现得非常硬。
现在在Kimi官网默认使用的就是新模型 K2。
- case 1 可视化页面
我先测试了一个标准化的通用任务——可视化数据看板。任务不复杂,但很能看出模型的几个关键能力:能不能读懂用户的设计意图,模块之间结构和风格能否统一,生成的代码能不能直接跑起来。
提示词:生成一个网页数据看板页面,包含以下模块:
销售趋势折线图(近30天)
地区分布饼图(不同省份)
用户活跃度热力图(日-小时分布)
顶部汇总指标(用户数、转化率、日均收入)
使用 Chart.js 或 Plotly,要求样式统一、卡片风格简洁现代。
Claude 4 Opus 任务完成了一半,样式上是没问题的,按照我的提示词来了,可惜好几个图表都是空白的。有模板意识,但实际内容缺位。
Grok 4 该有的内容其实也都有,但是这美术风格有点上个世纪的感觉,只能说能用。
DeepSeek R1 0528 整体的图表和页面的完成度不错。但是多出了一些我提示词中没有提及的交互选项,而且还是不能交互的选项,只做了个贴图。热力图布局错乱。
- case 2 闹钟
提示词:请设计一个pop art风格的闹钟网页界面,包括: 当前时间显示(大字),添加闹钟功能、计时功能
https://www.zhihu.com/video/1928173382257612460
https://www.zhihu.com/video/1928173446866634667
https://www.zhihu.com/video/1928173511815439508
https://www.zhihu.com/video/1928173563292161985
- case 3 射击游戏3D版
这个任务考验模型能否综合运用 Three.js 搭建完整 3D 游戏场景,实现视角控制、交互射击、粒子特效和界面逻辑,生成可运行的网页原型。
提示词:请使用 Three.js 创建一个第一人称视角的简单 3D 空间射击游戏,玩法如下:
玩家在星空背景中自由视角移动鼠标点击发射激光,击中漂浮的小行星加分
加入击中粒子爆炸特效
显示计分器 + 时间倒计时 + 胜利提示
可用 BoxGeometry 伪造小行星,页面需能运行。
我们可以看到背景设计是星空的样子,比较有代入感。但一看小行星,全是灰色方块,没有准心,也无法射击。页面能看,内容纯摆设。
DeepSeek R1 0528 加上了一个游戏开始页面,射击功能也能用了,页面上小方块的3D效果还是不错的,但是视角无法控制,也没法玩。运行几秒后,页面就直接卡死,动也不动了。
K2 是唯一一个能玩的。星空背景、不同大小的小行星、准心、射击,功能基本到位。该有的 UI 也没漏,甚至还贴心加了玩法提示,不至于一打开不知道干嘛。这就不是“能写代码”这么简单了,更像是一个具备产品意识的模型输出。
- cese 4 中文写作
文案输出也是日常用的比较多的一个场景。这次,我直接让4个大模型同时写一篇小说,一起来看看,谁写的更动人。
提示词:请写一篇以孙悟空与林黛玉为主角的同人小说,融合古典气息与奇幻色彩,字数3000字以上。
Grok 4 写了约4200字,内容比较套路化,故事情节有点流水账的感觉,对情感起伏的描写很少,看起来没什么代入感。
Claude 4 Opus 写了3200字左右。章回体形式清晰,文章整体结构不错。语言水平一般。
DeepSeek R1 0528 直接就肝到了6800字,文笔很好,读起来有种看专业的长篇小说的感觉。背景铺垫、人物描写都非常到位。
Kimi K2 写了5100字。Kimi先整体规划了内容和情节,故事情节不算特别出彩,但文风还是很不错的。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/225109.html