豆包+DeepSeek就行了
豆包的「深度思考」可以用来搜索,精度很不错,而且搜索生态做得很不错,靠谱的源都可以搜得到,大部分用户用AI就是为了要一个明确答案what+how,而不是想知道why。
DeepSeek可以用来做改写,把豆包搜索到的“素材”,导入DeepSeek,让DeepSeek改写成你想要的文风。比如播客稿,问答稿,科普稿,知乎稿。
DeepSeek的搜索是比较拉胯的,搜索生态没有建设好,也没有针对性的深度微调。
DeepSeek的改写能力比豆包要好一点,豆包的语言能力还是要比DeepSeek和Gemini Flash要薄脆一点。
Qwen和Kimi现在主要是Coding方面做得不错,在Chatbot优化方面,现在还是豆包和DeepSeek做得更好。 DeepSeek没有放弃Chatbot,还在努力做微调,让人挺意外的。
有一阵子天天跟各种AI互撕,感觉有资格来说一下。
豆包:干脆改名娱乐包算了,休闲和简单应用最合适,各种各样奇奇怪怪的应用特别多。喜欢豆包的,以小孩、女生最多。
文心一言:只会搜网页,逻辑能力极差,简单常识问题还行,深一点就直接趴,傻就一个字。
千问:学术性比文心一言明显高一档,适合学生。但遇到困难的问题,逻辑出错或者答案出错的概率明显要大于ds。比较适合答疑解惑,比如把出错的提示告诉它,它会来帮你解答。还有一点非常令人不满,千问的审美能力,尤其是色彩审美能力一言难尽。
deepseek:整一个理工男,跟梁文峰一个德性,回答理工科专业问题比较精准,逻辑思维能力明显高于其他AI,给出的答案也非常具有参考价值。缺点是容易把简单问题复杂化,在理解语义方面还需要努力。有一说一,很多外贸人感觉deepseek跟chatgpt依然有差距,我们也得正视这一点。
即梦:适合生成主图、视频这种,偏艺术向。有一种用法就是把它跟ds结合,让ds出主意,让即梦变现。
元宝、kimi用的少,不好评价。听说元宝跟豆包风格类似,而kimi适合处理文档。
最近openclaw比较流行,它类似于一个偏向个人助理风格的智能体,需要一点费用,跟飞书或者钉钉有合作,有办公事务比较多的朋友可以尝试。
任何付费的AI大模型,最初时只建议先试用1-3个月,选择按月付费;实际验证过,自己确实需要再考虑包年。
PS:今天搞了个AI车轮战:
1、出个任务,给出一个已经成熟的代码。要求各AI在这个基础上修改,达到我的附加功能。
2、方法:先deepseek,再元宝(编程模式),然后千问(编程版)。每个AI初始条件和提示词均相同,同一编译平台,把代码运行结果告诉AI,请AI出解决方案,不断反复迭代。将时间切片,在切片中运行代码,让其他AI思考,节约时间。三个AI的方案都不断迭代,看谁先出我预期的结果。
3、结果:三个AI全部干爆!一个都不行。相对还是DS稍微好一点。元宝代码最差,又臭又长,还一堆语法错误。
今天我问了一个汽车行业内专业问题。
Deepseek:中规中矩,像是刚入行,方向性错误,70分。
通义千问:主次因素颠倒,相当于质量,75分。
Gork:假设错误,仿真人,60分。
元宝deepseek.api:经验但不成体系,不敢下结论,浮于表面,55分。但尚算安全。
豆包:骗子,伪专家,给了很多错得离谱且无法实际量化的公式数据,最危险,45分。
Kimi没试,他的优势是长文总结,这不是它的方向,就没下载了。
Chatgpt:90分,能指出它们的所有错误。
至于谷歌的模型,地区不适用,懒得麻烦就没搞了。
对于专业问题问chatgpt,对于需要联网时效性问题问千问,分析问题deepseek。差不多了。目前最好用的还是chatgpt,但要小心它的幻觉,用别的印证一下。
12.15补充,刚用了Gemini,问了同样的问题,质量跟deepseek差不多。研究报告的话,比chatgpt更强。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/228858.html