迪士尼彩乐园登录网址 GPT-4o的P图全家桶有多强？连Midjourney CEO皆坐不住了

发布日期：2024-11-07 15:16 点击次数：174

　　编订|佳琪

　　不会 PS 也能赢麻了！

　　这句话咱们如故在各式万般的 AI 生图器具那里听了太多遍，不外，此次 GPT-4o 有时玩的是确凿。

　　盛开酬酢媒体，不管是 X 照旧，皆被 GPT-4o 生成的图片刷了屏。前次 AI 居品能让全网这样嗨玩，可能照旧 DeepSeek R1。

　　立地掉落几个案例，震荡一下还没刷到的一又友，比如底下这张论文插图，即是 GPT-4o 作念的。

开首：小红书 @陆导

　　画风的特朗普「积极坦诚对话」泽连斯基，GPT-4o 作念的。

　　约稿一张 5 块的日本小人，GPT-4o 作念的。

　　排版邃密的长图海报，GPT-4o 作念的。

开首：小红书 @张一凡

　　3D 深度图，GPT-4o 作念的。

开首：小红书 @小崔大口吃汤圆，原博主指摘：「诚然当今图像还有些流弊，关联词这空间智商和 affordance 推断智商莳植有点太大了。」

　　各式格调的头像随性切换，照旧 GPT-4o 作念的。

最左为原图，分散改为迪士尼、吉卜力、史努比和星露谷格调

　　最伏击的是，以上这些操作，GPT-4o 险些皆是一次收效，无需多轮对话修改。

　　再加上 AI 视频的魔法，一部宫崎骏格调的《星际穿越》就这样水汪汪地作念出来了。

　　

视频来自 X@kb24x7

　　制作法子其实独一两大步：第一，用 GPT-4o 生成首尾帧；第二，把这些图片放到 Morphic 等视频生成平台输入念念要的行为后果，再裁剪拼合。

　　那么问题来了，AI 画图器具明明多如过江之鲫，为什么是 GPT-4o 破圈？

　　谜底也很直不雅，最初是悦目。AI 生图，颜值即正义，后果奈何一眼就能看出来。

　　就拿生成微信公众号封面来说，吞并段教唆词，即梦和 GPT-4o 端出来的作品，不需要投票，从构图到配色，服气环球心中也有判断。

　　教唆词：A pair of pastel-colored headphones with a gradient from blue to purple, floating in a soft pink background. In the center of the headphones, there is a small ball with the word \"mureka\" written on it in a playful font. The image should have a 3D, cartoonish style.colorful background.

图左来自即梦，图右来自 GPT-4o

　　其次是迷漫轻便，能达到这样好的后果的，操作比对话复杂得多，终点是 Stable Diffusion 和 Midjourney，于今仍需要复杂咒语。至于还念念更细巧，就只可我方微调 lora 或者测验模子了。

　　而格调化、抠图、带翰墨排版，在其他平台要手动框选，在页面之中跳转的功能，GPT-4o 皆包揽在一个对话框里，后果还更强。

　　概述来看，贯串了「能打」和「好用」的 GPT-4o 此次主要带来了几大杀手锏：

　　高保真真正相片

　　有审好意思的翰墨排版：从海报到梗图，不仅准确，字在那边皆听你诱骗

　　各式格调、滤镜随性切换

　　P 图全家桶：抠图、换脸、扩图样样行，还能贯串不同图片中的元素「炖」出一张新图来

　　听起来很蛮横？让咱们一项一项地来看，GPT-4o 是不是确凿这样神。

　　真正感

　　这尽然是 AI 生成的吗？照相师看了千里默，平台审核看了哽噎，以后咱们还看得出相片里的 AI 味吗？

　　教唆词：帮我生成一张身着白裙的女生，比着剪刀手，在佛罗伦萨的旧宫门口拍的相片。

　　不外，GPT-4o 偶尔也会翻车，不仅没画出小米 su7 的「樱花」轮胎，还把雷总生生卡在了车外。

　　教唆词：雷军从小米 su7 里探头比耶，布景是武大樱花，相片尽可能接近真正。

　　翰墨排版

　　不管是菜单、婚典请帖、漫画、科研插图，只淌若需要排版的图片，迪士尼彩乐园GPT-4o 确凿带来了一种「aha moment」的嗅觉。

　　除了字体角落稍为有些朦拢除外，这个菜单似乎不错平直放在餐厅用了。

图源微信公众号：赛博禅心

　　不外，诚然排版够用了，GPT-4o 的汉字写得还不太好。

　　以后平直把论文要领扔给 ChatGPT，配图就不错出来了：

图源：小红书 @云安

　　教唆词写得稍许轻便一些，这个配图亦然 next level 了：

　　念念要更复杂的贪图，网易云听歌年度发达也能安排。天然，比较英文的准确度，GPT-4o 的汉字还亟待跳跃。

图源 X@歸藏 @op7418

提前订了夏日湾的行程，司机在指定时间到酒店接我们。

　　最伏击的是，GPT-4o 多模态智商是原生的，它不错结实你的需求，在不提供案牍的情况下，它也能续上画面中的主体和对话。

　　要知说念，主体一致性于今亦然视觉生成的重视。在 GPT-4o 出现之前，环球一般会用 Stable Diffusion 和 ControlNet 来诊治生图模子「遴荐性失忆」的问题。

　　关联词当今在 GPT-4o 里，主题一致性如故扫数不再是问题。

图源： X@emollick

　　不仅扫数告别即使是输入图像主题参考，每次抽卡的东说念主物也皆各有各的抽象。当今把柄高下对话中的甩手，GPT-4o 就能踏实输出，脚色特征分绝不差。

图源： X@zhansheng

　　格调化

　　皆说 GPT4o 一出，宫崎骏的天塌了一半。

　　当今 X 上最火的，即是把各式万般的名时局让 GPT-4o 用宫崎骏的格调再画一遍。不管文娱圈，照旧科技圈，哪怕已退生物圈，皆逃不掉。

OpenAI CEO Sam Altman 把我方的头像改成了吉卜力格调的我方

　　诚然换了画风，关联词画面中东说念主物原来的面部特征，皆得以保留，不逐个标出这些图片中的东说念主物，服气环球皆认得出来它原来的面庞。

　　天然，除了吉卜力格调，任何画风它也能 hold 得住。

　　比如梵高格调的李逵，就连翰墨皆能无缺融入其中：

　　再比如，皮克斯 CG 3D 格调的伊利亚和奥特曼吵架神图：

　　还有泽连斯基和特朗普在白宫吵架的经典一幕，也被网友用 GPT-4o 转成了蜡笔小新格调：

图源：小红书 @AI 学习札记

　　看来以后，网友的整活又多了一款神器。

　　恬逸基础贪图功能

　　2023 年底，好意思图秀秀和剪映曾推出了扩图功能，但画风十分癫狂，不是男女不分，即是东说念主面兽身。

　　而 GPT-4o 也被网友缔造出了疏导的功能，后果十分惊艳，不仅能扩出小狗的全身，还能让它跑起来。

　　一键换衣，不必再提供 10 张全身相片：

　　仅需两张图片外加一句轻便的教唆词，就能让图一的东说念主物跑到图二中的手机样机里：

图源：小红书 @AIGC 魔法学院

　　此外，GPT-4o 还能平直生成带通说念的相片，图中的东说念主物、和布景皆是分开生成的，不需要后期抠图，编订起来便捷了不少：

动图开首：X 博主歸藏

　　看已矣这些 case，学绘画的一又友们，学 comfyui 的一又友们，你们还好吗？

　　天然，除了一派叫好声外，也有质疑声。传奇今早，Midjourney 的 CEO 就在内网大大嘲讽了 GPT-4o 一通：

　　GPT-4o 生成图像又慢，质料又差。

　　他们发这个功能仅仅为了筹集资金用的。

　　GPT-4o 不是一款创意器具。

　　一周后（Midjourney v7 行将发布），就没东说念主会在筹办 GPT-4o 了。

　　至于 Midjourney v7 发布后，GPT-4o 是不是照旧这样火，咱们无从得知，但 AI 好好用将执续热心～

　　© THE END

　　转载请干系本公众号获取授权

热点资讯

推荐资讯

友情链接：

Powered by 迪士尼彩乐园 @2013-2022 RSS地图 HTML地图

Copyright Powered by365建站 © 2013-2024