迪士尼彩乐园登录网址 GPT-4o的P图全家桶有多强?连Midjourney CEO皆坐不住了

  编订|佳琪

  不会 PS 也能赢麻了!

  这句话咱们如故在各式万般的 AI 生图器具那里听了太多遍,不外,此次 GPT-4o 有时玩的是确凿。

  盛开酬酢媒体,不管是 X 照旧,皆被 GPT-4o 生成的图片刷了屏。前次 AI 居品能让全网这样嗨玩,可能照旧 DeepSeek R1。

  立地掉落几个案例,震荡一下还没刷到的一又友,比如底下这张论文插图,即是 GPT-4o 作念的。

开首:小红书 @陆导

  画风的特朗普「积极坦诚对话」泽连斯基,GPT-4o 作念的。

  约稿一张 5 块的日本小人,GPT-4o 作念的。

  排版邃密的长图海报,GPT-4o 作念的。

开首:小红书 @张一凡

  3D 深度图,GPT-4o 作念的。

开首:小红书 @小崔大口吃汤圆,原博主指摘:「诚然当今图像还有些流弊,关联词这空间智商和 affordance 推断智商莳植有点太大了。」

  各式格调的头像随性切换,照旧 GPT-4o 作念的。

最左为原图,分散改为迪士尼、吉卜力、史努比和星露谷格调

  最伏击的是,以上这些操作,GPT-4o 险些皆是一次收效,无需多轮对话修改。

  再加上 AI 视频的魔法,一部宫崎骏格调的《星际穿越》就这样水汪汪地作念出来了。

  

视频来自 X@kb24x7

  制作法子其实独一两大步:第一,用 GPT-4o 生成首尾帧;第二,把这些图片放到 Morphic 等视频生成平台输入念念要的行为后果,再裁剪拼合。

  那么问题来了,AI 画图器具明明多如过江之鲫,为什么是 GPT-4o 破圈?

  谜底也很直不雅,最初是悦目。AI 生图,颜值即正义,后果奈何一眼就能看出来。

  就拿生成微信公众号封面来说,吞并段教唆词,即梦和 GPT-4o 端出来的作品,不需要投票,从构图到配色,服气环球心中也有判断。

  教唆词:A pair of pastel-colored headphones with a gradient from blue to purple, floating in a soft pink background. In the center of the headphones, there is a small ball with the word \"mureka\" written on it in a playful font. The image should have a 3D, cartoonish style.colorful background.

图左来自即梦,图右来自 GPT-4o

  其次是迷漫轻便,能达到这样好的后果的,操作比对话复杂得多,终点是 Stable Diffusion 和 Midjourney,于今仍需要复杂咒语。至于还念念更细巧,就只可我方微调 lora 或者测验模子了。

  而格调化、抠图、带翰墨排版,在其他平台要手动框选,在页面之中跳转的功能,GPT-4o 皆包揽在一个对话框里,后果还更强。

  概述来看,贯串了「能打」和「好用」的 GPT-4o 此次主要带来了几大杀手锏:

  高保真真正相片

  有审好意思的翰墨排版:从海报到梗图,不仅准确,字在那边皆听你诱骗

  各式格调、滤镜随性切换

  P 图全家桶:抠图、换脸、扩图样样行,还能贯串不同图片中的元素「炖」出一张新图来

  听起来很蛮横?让咱们一项一项地来看,GPT-4o 是不是确凿这样神。

  真正感

  这尽然是 AI 生成的吗?照相师看了千里默,平台审核看了哽噎,以后咱们还看得出相片里的 AI 味吗?

  教唆词:帮我生成一张身着白裙的女生,比着剪刀手,在佛罗伦萨的旧宫门口拍的相片。

  不外,GPT-4o 偶尔也会翻车,不仅没画出小米 su7 的「樱花」轮胎,还把雷总生生卡在了车外。

  教唆词:雷军从小米 su7 里探头比耶,布景是武大樱花,相片尽可能接近真正。

  翰墨排版

  不管是菜单、婚典请帖、漫画、科研插图,只淌若需要排版的图片,迪士尼彩乐园GPT-4o 确凿带来了一种「aha moment」的嗅觉。

  除了字体角落稍为有些朦拢除外,这个菜单似乎不错平直放在餐厅用了。

图源微信公众号:赛博禅心

  不外,诚然排版够用了,GPT-4o 的汉字写得还不太好。

  以后平直把论文要领扔给 ChatGPT,配图就不错出来了:

图源:小红书 @云安

  教唆词写得稍许轻便一些,这个配图亦然 next level 了:

  念念要更复杂的贪图,网易云听歌年度发达也能安排。天然,比较英文的准确度,GPT-4o 的汉字还亟待跳跃。

图源 X@歸藏 @op7418

提前订了夏日湾的行程,司机在指定时间到酒店接我们。

  最伏击的是,GPT-4o 多模态智商是原生的,它不错结实你的需求,在不提供案牍的情况下,它也能续上画面中的主体和对话。

  要知说念,主体一致性于今亦然视觉生成的重视。在 GPT-4o 出现之前,环球一般会用 Stable Diffusion 和 ControlNet 来诊治生图模子「遴荐性失忆」的问题。

  关联词当今在 GPT-4o 里,主题一致性如故扫数不再是问题。

图源: X@emollick

  不仅扫数告别即使是输入图像主题参考,每次抽卡的东说念主物也皆各有各的抽象。当今把柄高下对话中的甩手,GPT-4o 就能踏实输出,脚色特征分绝不差。

图源: X@zhansheng

  格调化

  皆说 GPT4o 一出,宫崎骏的天塌了一半。

  当今 X 上最火的,即是把各式万般的名时局让 GPT-4o 用宫崎骏的格调再画一遍。不管文娱圈,照旧科技圈,哪怕已退生物圈,皆逃不掉。

OpenAI CEO Sam Altman 把我方的头像改成了吉卜力格调的我方

  诚然换了画风,关联词画面中东说念主物原来的面部特征,皆得以保留,不逐个标出这些图片中的东说念主物,服气环球皆认得出来它原来的面庞。

  天然,除了吉卜力格调,任何画风它也能 hold 得住。

  比如梵高格调的李逵,就连翰墨皆能无缺融入其中:

  再比如,皮克斯 CG 3D 格调的伊利亚和奥特曼吵架神图:

  还有泽连斯基和特朗普在白宫吵架的经典一幕,也被网友用 GPT-4o 转成了蜡笔小新格调:

图源:小红书 @AI 学习札记

  看来以后,网友的整活又多了一款神器。

  恬逸基础贪图功能

  2023 年底,好意思图秀秀和剪映曾推出了扩图功能,但画风十分癫狂,不是男女不分,即是东说念主面兽身。

  而 GPT-4o 也被网友缔造出了疏导的功能,后果十分惊艳,不仅能扩出小狗的全身,还能让它跑起来。

  一键换衣,不必再提供 10 张全身相片:

  仅需两张图片外加一句轻便的教唆词,就能让图一的东说念主物跑到图二中的手机样机里:

图源:小红书 @AIGC 魔法学院

  此外,GPT-4o 还能平直生成带通说念的相片,图中的东说念主物、和布景皆是分开生成的,不需要后期抠图,编订起来便捷了不少:

动图开首:X 博主歸藏

  看已矣这些 case,学绘画的一又友们,学 comfyui 的一又友们,你们还好吗?

  天然,除了一派叫好声外,也有质疑声。传奇今早,Midjourney 的 CEO 就在内网大大嘲讽了 GPT-4o 一通:

  GPT-4o 生成图像又慢,质料又差。

  他们发这个功能仅仅为了筹集资金用的。

  GPT-4o 不是一款创意器具。

  一周后(Midjourney v7 行将发布),就没东说念主会在筹办 GPT-4o 了。

  至于 Midjourney v7 发布后,GPT-4o 是不是照旧这样火,咱们无从得知,但 AI 好好用将执续热心~

  © THE END

  转载请干系本公众号获取授权






Powered by 迪士尼彩乐园 @2013-2022 RSS地图 HTML地图

Copyright Powered by365建站 © 2013-2024