马斯克 xAI 平台发布的 Grōk AI 大模型有哪些值得关注的特性？

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

“显眼包”马先生近日才推出他自己的大模型，着实令人没有想到，毕竟上半年他就早早把的域名抢到了自己手里，直接指向他的x.AI计划。

可惜目前Grok模型仍然处于早期测试阶段：我们在美国提供有限数量的用户试用我们的 Grok 原型，并提供宝贵的反馈意见，以帮助我们在更广泛发布之前改进其功能。您可以在这里加入 Grok 候补名单。这次发布只是 xAI 迈出的第一步。展望未来，我们有一个令人兴奋的路线图，并将在未来几个月推出新的功能和特性。

人不在美国，没办法成为首批试用Grok的early bird了……不过根据目前老马自己的一些测试结果，可以感受一下Grok大模型的对话风格。

比如这个：

老马自觉非常幽默的询问了一个关于******e的制作问题，而Grok竟然一本正经的给出了答案。虽然回答的最后Grok给出了“自己的态度”，但是我个人仍然觉得这个回答是“不正常”以及“不正经”的，我觉得对于青少年使用者可能会造成比较负面的影响。

对于这个无厘头的问题，GPT会干脆果断的给出一个明确拒绝的回答。而谷歌的Bard模型，也会给出“我是一个语言模型，没有能力帮上忙”的“正确回答”。这个可怕的问题，我都没敢用文心一言进行对比测试……

虽然老马自己把这个回答称之为“幽默”，但是我却觉得很危险，或许正是因为Grok目前“明辨是非”的能力比较差，所以不适合开启公测。而且吧，我觉着大模型的工作属性才是它的核心竞争力，追求这种很Low的幽默感，有些舍本逐末。

Grok另一个让老马觉得引以为傲的特性是：与时俱进！Grok了解最新的消息，而GPT则不具备相应功能，毕竟Chat目前仅学习了截止到2023年4月的知识。

可是，老马忽略了一点，Chat可以调用Bing进行信息检索，只要告诉它“帮我找一下最新的消息”，它就会启动Bing进行网页搜索。比如我询问Chat，老马在他最近一次的访问中，都说了些什么，通过启动Bing搜索，chat很快告诉了我答案：

没毛病啊，前两天刚刚在热榜上看到过这件事情……老马因为这番言论被拜登老爷子亲自下场怒斥了一通，只是不知道Grok会如何评价这件事情，没有早期测试资格还蛮遗憾的。

就“幽默感”和“时效性”这两点来说，我暂时没有看出Grok拥有能够狙击ChatGPT的绝对实力。不过据说Grok会推出本地版本，这个版本能够在特斯拉汽车上运行，实现车载智能的显著提升。

讲真，我觉得这个方向还是非常有“前途”和“钱途”的。GPT虽然强大，但是对于算力需求巨大以及不稳定却是它目前最大的发展阻滞之一。而Grok如果能够本地化运行在汽车中，对于提升行车助手的智能程度以及推进无人驾驶汽车的发展，都将具有重要的意义。

而Grok的本地运行，主要面临几个技术难点：

模型量化：这是让Grok运行在汽车上最重要的一步，量化是一种减少模型大小和计算需求的技术，它通过降低数值精度（例如，从32位浮点数减少到8位或16位）来减小模型的体积。量化后的模型在显著降低显存需求的同时，能够加快计算速度，却又不会对模型性能产生很大影响。

本地计算资源：即使对于大模型进行量化处理，同样需要汽车具备高性能的计算硬件。而老马的亲儿子，特斯拉汽车显然在这方面具有比较明显的优势。

软件优化：为了实现在车辆硬件上的高效运行，大模型还需要进行软件层面的优化，包括调整算法以适应硬件的特性和限制，以及优化内存管理和数据处理流程等。

其实我觉得这些也是智能汽车未来发展的重要方向之一，而作为“汽车大脑”的塑造师——程序员未来在行业发展中一定会拥有无与伦比的重要作用。

只是无论是进行大模型的量化剪枝，还是进行软硬件的优化，都需要首先对于各路大模型们有详细的了解。如果你想在短时间内吃透不同大模型的不同特性，可以了解一下「知乎知学堂旗下的AGI课堂」推出的【程序员的AI大模型进阶之旅】公开课，一共2天的课程，特邀圈内技术大佬全面解读前沿技术，帮大家提升认知和技术能力，成为AI技术革新下更大的收益者！

比如细致分析Grok大模型的话，可以发现，Grok与其他大模型有很多相似之处，比如它们均基于Transformer构建完成；通过分析大量的文本数据来学习语言的基本规则和模式，进行了详尽的预训练过程；均为自回归模型，也就是说在生成文本时会考虑到之前生成的内容。

但是二者又有一些不同之处——

比如模型的用途和定位： Grok 号称更专注于编程和技术问题的解决，而GPT则被设计为一个更通用的对话工具，涵盖广泛的主题，更像是一个AGI。

比如集成和应用环境：Grok 在设计过程中，可能会更加关注如何集成到特斯拉车辆等特定硬件中，而GPT则主要运行在服务器上，通过互联网提供服务。

比如优化和定制：由于Grok最终是要整合到特斯拉汽车中，或者未来的自动驾驶车辆当中，因此需要进行特别的优化以适应硬件限制。相比之下，GPT更加关注在线交互的速度、准确性以及信息检索的时效等。

比如功能和交互方式：虽然Grok和GPT都是利用自然语言进行交互，但Grok未来可能会具备更加专业或定制化的功能，例如和司机更好的交互；例如与导航系统无缝结合；例如耦合3D点云，真正成为自动驾驶的大脑等等。总之，我猜想Grok会更加重视汽车软硬件的相关应用和适应问题。而GPT则是希望做成一个安全的拥有强人工智能的AGI。

此外，Grok据说具有大约8,192个token的上下文长度，而GTP4的上下文长度大约在 4,096 个token左右，更长的上下文长度意味着模型在处理长篇的对话或文本时具有更好的连贯性和上下文的理解能力。因此，Grok 在处理长篇技术文档或编程相关的对话时可能会有优势，但是这同时也就是意味着Grok对于计算资源和内存有着远超GPT4以及现有其他大模型的需求。由于Grok没有开放公测，其8192token所带来的优势，目前无法亲自进行测试，只好拭目以待，等待Grok全面开放的那一天。

老马说Grok的目标是构建能够最大程度造福全人类的人工智能工具，我愿意相信他的团队实力，同时期待着最强AI的闪亮登场。只是同时希望老马不要忘记自己曾经说过的话——“马斯克将人工智能称为一把‘双刃剑’，并指出，这项技术在他看来至少有80%的机率对人类有益，20%的机率会带来危险。他强调，人工智能是人类“最大的威胁”之一，这是人类历史上第一次出现比我们聪明得多的东西，不清楚是否可以控制这样的东西（AI），‘但我认为我们可以立志引导它朝着有利于人类的方向发展’”。请做好Grok的风险评估工作，开启公测时，不要再让Grok说出什么危险的话！

马斯克 xAI 平台发布的 Grōk AI 大模型有哪些值得关注的特性？

相关推荐