另外,GPT-4o的生图能力是否还需要依赖OpenAI的DALL·E模型?
更新一下,目前4o生图应该是最强了。
https:// zhuanlan.zhihu.com/p/18说一下结论:GPT-4o应该不是目前生图能力最强的模型,但是GPT-4o作为一个端到端的原生多模态模型,可以直接生成图像,不再需要像GPT-4那样外接一个DALLE-3模型。
我这里之所以说GPT-4o的生图能力不是最强,是因为OpenAI的官方公告中并没有直接给出GPT-4o在生图能力与其它SOTA模型比如Midjounery和SD 3的对比。
GPT-4o的一大亮点是一个支持文本、语音和图像的端到端的多模态大模型,它可以输入文本、语音和图像,也可以输出文本、语音和图像。
这和之前的多模态大模型有比较大的区别,比如GPT-4V只支持输入图像,而要生成图像需要接一个单独的文生图模型DALL-E 3。而且GPT-4V原生并不支持语音,要输入语音和输出语音,还要接两个语音模型:语音->文字模型和文字->语音模型。
虽然GPT-4o的生图能力不是最强,但是我觉得从目前OpenAI给出的例子来看,GPT-4o这种原生多模态模型会有一些单独的文生图所不具有的能力,因为GPT-4o可以支持文本+图像作为条件。
比如我们可以输入文本+图像来做头像的风格转换:
还可以组合两个图像加上文本生成新的图像:
还可以借助大模型的上下文能力创作一致性的角色:
此外,GPT-4o还可以渲染大段的文字:
以上所展示的能力,靠GPT-4来外接一个DALL-E 3还是比较难做到的。所以,我觉得GPT-4o会是一个非常有前景的多模态模型。
发现伊藤润二版的敖闰真的很迷人!
有兴趣为我去亖吗?人类
在2025年而言,真的太强了,可以说是效率上完美比得上SD和FLux,关键不用配置也不调,用的当然是自家的DALL.E 。
值得注意的是在GPT上AI绘画和在Sora上的效果一样,但是在Sora上用AI绘画会更快。
也可以直接打开GPT,输入Prompt:请改为日本动画电影新海诚《你的名字》的画风
得出来的就是新海诚《你的名字》的画风:有兴趣作个梦吗?
《龙珠》画风:有兴趣打一架吗?悟空!
那我变成超级赛亚龙3,有兴趣打一架吗?
《魔卡少女樱》版:有兴趣变装拍个照吗?知世
这个好认,一看就是《多啦A梦》的画风:有兴趣给我一个法宝吗?叮当
《小猪佩奇》版:有兴趣来吹个口哨吗?
《天线宝宝》版:有兴趣来嗨吗?宝贝们
蜡笔小新版:有兴趣来看屁屁外星人吗?
《瑞克和莫蒂》版来了:有兴趣来穿越吗?
《恶搞之家》版:有兴趣玩虐待吗?
《海绵宝宝》版:有兴趣来个汉堡吗?
欧美超级英雄画风:
马里奧画风:
1985年:
2023年:
美少女战士敖闰(把龙甲换了的原因,是因为美少女战士的战衣是重点):有兴趣让我代表月亮消灭你吗?
《圣斗士龙》:有兴趣让我来保护雅典娜吗?假教皇……
(把龙甲换了的原因,是因为圣斗士的圣衣是重点)
《城巿猎人》版:
JOJO版:有兴趣换个替身吗?老东西
《EVA》版:有兴趣给我驾驶一下初号机吗?碇司令!
《海贼王》版:有兴趣做个海贼王吗?路飞
《高达》版:有兴趣来部高达吗?旧人类
《火影》版:有兴趣当个火影吗?鸣人
《名侦探柯南》版:有兴趣找个真相吗?柯南
《死神》版:有兴趣卐解吗?一护
《灌篮高手》版:有兴趣打个篮球吗?大猩猩
游戏《拳皇97》版:
《熊出没》版:有兴趣来砍棵树吗?光头强
《喜羊羊与灰太狼》版:有兴趣去吃只狼吗?喜羊羊
《奶龙》版:
这种尸鬼风的是魂系游戏《血源诅咒》:
这个很明显就是《黑神话悟空》:
这个当然是正常少女版的敖闰,说实话比別的COSPLAY都好看些:
这个可能很多人都猜不着,其实是国产水墨颠峯《雾山五行》的画风:
接下来,继续来几个国漫风格的:
这是2003年的《哪吒传奇》的风格:
1986年上海美院的《葫芦娃》风格:
还可以换一个黑猫警长……
应评论区的来一个《北斗神拳》:
想看什么风格的小伙伴可以评论。
最可怕的还是对中文的支持,随手都可以来一张海报:
再来一张,也完成没有问题:
真的是不懂设设都能解决电商图,带来的影响就是文案+设计,可以直接合并为一个岗位。
有兴趣可以看看其它AI知识:AI大千宇宙
经过长达一年与人类训练师协作优化,OpenAI于美国当地时间周二发布了GPT-4o原生多模态图像生成功能,支持生成更加逼真的图像。这是 Deep Research 以来 OpenAI 最有意义的模型更新。 新模型+一句话指令,效果就超过了人类精心设计的工作流。 Al 在设计方面超过人类,已是必然。
用户只需在ChatGPT中描述图像(可指定宽高比、色号或透明度等参数),GPT-4o便能在一分钟内生成相应图像。让我们细致看一看:本次更新,突破了以往的哪些边界。
OpenAI在公告中确认,GPT-4o图像生成功能具有以下特点:
- 精准渲染图像内文字,能够制作logo、菜单、邀请函和信息图等;
- 精确执行复杂指令,甚至在细节丰富的构图中也能做到;
- 基于先前的图像和文本进行扩展,确保多个交互之间的视觉一致性;
- 支持各种艺术风格,从写实照片到插图等。
新模型即日起将作为ChatGPT的默认图像生成引擎,向ChatGPT Free、Plus、Team及Pro用户开放,取代此前使用的DALL-E 3。企业版、教育版以及API接口也将在不久后支持该功能。
据OpenAI官方说明,GPT-4o在多个方面相较于过去的模型进行了改进:
更好的文本集成:与过去那些难以生成清晰、恰当位置文字的AI模型不同,GPT-4o现在可以准确地将文字嵌入图像中;
增强的上下文理解:GPT-4o通过利用聊天历史,允许用户在互动中不断细化图像,并保持多次生成之间的一致性;
改进的多对象绑定:过去的模型在正确定位场景中的多个不同物体时存在困难,而GPT-4o现在可以一次处理多达10至20个物体;
多样化风格适应:该模型可以生成或将图像转化为多种风格,支持从手绘草图到高清写实风格的转换。
让我们看看,目前4o生图可以做到的水平吧!
“你能基于这个UI创建一个高保真的产品模型吗?”。
现阶段,GPT-4o取得了许多进步,但它仍然存在一些问题,其中包括:
裁剪问题:像海报这样的较大图像可能会被过度裁剪;
非拉丁字符的文本准确性:某些非英语字符可能无法正确呈现;
小字体中的细节保留:小字号文本的细节可能会丢失或不够清晰;
编辑精确度:修改图像的特定部分时,可能会意外影响其他元素。
OpenAI表示,正在通过持续的模型改进积极解决这些问题。
怎么才能用上最新版 GPT-4o?
目前,可以确定的渠道是付费的 OpenAI 的 Plus、Pro 和 Team 用户。
但是海外使用有点困难,所以整理了一些其他的方式,小伙伴们可以尝试使用,接触一下4o生图的功能。
千言万语其实不如你自己实际体验一下,快来领会一下科技的魅力。
没错,如果有能力的话,建议还是直接去官网使用,体验相当nice。
就是价格稍微贵,需要20美刀,不过这个价格打包市面上OpenAI对话模型、视频、图片、语音给你使用。我觉得也合理。毕竟免费才是最贵的。
使用地址:https://chatgpt.com/
国内大佬主要做解决GPT4o和Claude使用的公益服务网站,但是最近因为项目经常被攻击,目前采用订阅方式使用,感兴趣的可以自己去了解。本来是公益的,现在限制了一下防止攻击,需要订阅了。
公益网址我这边没去赞助,没拿到喔,想了解自己去看看吧!
使用地址:https://afdian.com/a/warmo
注意,加入工作区一般需要使用国际邮箱,用微软的outlook邮箱就好了。首次加入需特殊环境(需自行准备)。加入完进入工作区在频道@GPT4应用即可。
工作区加入链接:https://h5ma.cn/jxn
进入竞技场后点击DIRCTChat,然后选择4o模型就好。
需要注意的是,模型竞技场有些时候会因为没有次数额度下架4o模型使用。你可以去试试看,如果没有的该模型选项的话,晚会再进去试试。
注:首次进入稍微卡,需要等待一会。
使用地址:https://h5ma.cn/lpi
一个海外AI模型聚合平台,提供各种各样的模型体验。市面上热门的Claude3.5、Claude3 Opus、GPT4o、Gemini基本都涵盖了。
但是限制次数,免费用户每天有3000积分,每日重置一次,对于4o模型来说,每次对话消耗200积分,也就是每天可以免费对话15次。尝个鲜还是不错的。当然次数用量大,可以换号薅~
使用地址:https://poe.com/
国内最大的镜像站之一,主要提供OpenAI和Claude的镜像服务。目前账号充足,采用自购账号和API方式接入官网服务。运行时间长,可靠稳定。
注册后需使用激活码订阅,订阅完成即可使用。具体不多说,需要的可自行了解。
使用地址:chatshare.biz
激活码获取:https://h5ma.cn/chatjhm
Sider是一款浏览器插件,你可以在Edge浏览器和Chrome浏览器中安装它。
接入ChatGPT官方提供的付费稳定版API,为用户提供无需科学上网、稳定快速的服务。目前支持GPT4、Claude3、Claude3.5-16k等等,可在国内使用。
可以帮助我们进行更正语法、改写内容、扩充内容和生成广告脚本。它支持在任何网站上使用,并提供摘要文章、解释代码等功能。
使用地址:https://sider.ai/invited?c=c72098f2510f255a812ffb1a4b8fe977
俄罗斯的一个网站,可以使用4o和o1模型,但是模型应该是有次数限制的,具体多少忘记了,各位小伙伴可以自己测试。如果次数受限,可以配合大神开发的油猴脚本突破这个使用限制。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/231639.html