国外编程猫少儿编程让一让,全球最鲜活的AI小猫来了
未命名
2024年12月17日 12:18 2
予晖
原创 刺猬公社编辑部 刺猬公社
刷屏小红书、抖音的AI生图工具,什么来头?
文|啊游
编|陈梅希
2012年,计算机科学家吴恩达和Jeff Dean进行了一场试验。
他们用1.6万个CPU、1000万张猫咪图片以及当时全球最大的深度学习网络,训练了3天,生成了世界上第一张AI猫脸图像。这是人们基于深度学习模型自动生成图片的开端,受限于当时的技术能力,图片中的小猫称得上是“面目全非”。
12年后,当网友第一次看到背着白色翅膀的黑猫图片时,几乎所有人都以为,那是一张真实的照片。
毕竟,宠物博主用翅膀饰品装扮自家猫咪后,再用胶片机拍照记录,不算是什么稀奇事。直到看见帖子下方的“AIGC”标签,人们才惊奇地发现:“这竟然是AI生成的?”
12年前的AI小猫 vs 12年后的AI小猫
怀揣着巨大的好奇心,越来越多网友顺着网线,前往一个名为“Recraft AI”的应用,尝试生成自己心目中的理想小猫。
情况一发不可收拾。
最近几天,各式各样的“小猫胶片照”填满了小红书、抖音等社交平台的信息流。无论是举着红酒杯的小猫、在键盘上打字的小猫,还是举着魔棒正在施法的小猫,全是Recraft AI的杰作。
近年来,AI领域的所有进展中,离普通用户最近的非AI生图莫属。
自2021年年初,OpenAI发布DALL-E大模型,AI得以通过文字生图起,三年内诞生的AI生图工具已经进化、迭代了一波又一波。专攻技术能力突破的有Stable Diffusion、Midjourney、FLUX等等,专攻C端应用的也有妙鸭相机、Remini等等。
从最初追求极致的“像”,到如今逐渐厌倦AI味儿,开始追求风格与审美,这届网友正在将Recraft AI捧上新的“神坛”。
没有AI味的“造梦AI”
这次火起来的,其实是Recraft AI内置的一种预设风格“Hard Flash”。
该模式可以模拟胶片摄影时,开启闪光灯之后的拍摄效果,生成的图片主体突出,对比度高,彩色饱满浓郁。目前,该AI网站支持免费用户每天获得50个积分,生成50张图片,虽然中文提示词的生成效果仍不如英文,但Recraft支持中文口令直接输入。
如果说,ChatGPT的出现让作者焦虑,Midjourney的出现让画家忧愁,这一次,慌的是摄影师。
小红书,是Recraft最初被国内用户关注到的地方,目前相关话题下已经有超过1万条笔记。
其中不乏有摄影爱好者哀嚎“我宣布,摄影不存在了”;也有专业的胶片摄影博主在看完Recraft生成的图片后,认为该AI的构图和色彩、审美极佳,开始思索还有什么是人类摄影师能够抓住的东西;甚至有人开始研究Recraft的调色与构图,试图进行“反向学习”。
图源:小红书
尽管其他AI工具的画风更加细腻,生成的图片更为精美,但看久了难免会有一种“AI味儿”。
无论是不和谐的色彩过渡、结构上的不自然;还是过度平滑、整齐的勾线,毫无瑕疵的质感,总之,早期“一眼假”的是AI味儿,如今过于逼真无瑕的,也是一种AI味儿。
在一众追求细节、力争真实的AI绘画工具面前,强烈、鲜明的视觉风格是Recraft出圈的关键。
刺猬公社(ID:ciweigongshe)尝试用几个不同的模型,输入相同的口令“many animals”。从最终生成的结果来看,Recraft内置的Hard Flash模式,一眼望去的确有种不一样的feel。
Recraft并没有像FLUX或是DALL·E 3那样进行常规构图,而是将不同的动物一字排开,画面中土地与天空的大面积留白,似乎给图像增添了别样的情绪:这是一头孤独的狮子。
从左至右分别由Recraft、FLUX、DALL·E 3生成
当AI生成的画面能够传达情绪,Recraft AI也被贴上了“梦核”“怪诞”的标签,越来越多网友的创作欲开始被激发。
有人将自己喜欢的电影台词或是歌词当做口令输入Recraft,期待着会生成什么画面。
在一条有着1.6万点赞的小红书笔记中,博主“帆”将《宇宙探索编辑部》的台词输入了Recraft,生成的图片虽然并不能百分百复刻台词内容,但整体的画面风格简直“比宇宙探索编辑部还宇宙探索”。
也有人试图用Recraft记录自己的梦境,或是表达难以言喻的情绪,有热心网友专门整理出了,能让Recraft生成更空灵、更梦幻感图片的常用提示词。甚至也有网友从中发现了新商机,帮助无法使用Recraft的用户,生成他们心目的梦核图片,一张几块钱。
图源:小红书
网友们的热情参与下,继妙鸭相机、Remini黏土特效之后,又一场AI狂欢的浪潮掀起。大家似乎都想亲自试一试,给AI输入“咒语”,生成一张天马行空的图片,实现一种“魔法成真”的奇妙感受。
于是,近期的小红书、抖音等社交媒体似乎被“魔法”包围了:HelloKitty站在窗边看烟花、小狗在雪地里吃蛋糕、金鱼在蓝色天空中飞过……
11月25日,小红书官方科技薯还专门发起了一项活动,用户使用Recraft生图,带相关话题发布笔记,将有机会被推流。
在社媒的推动下,据点点数据显示,过去一周Recraft在国内App Store的下载量已经跃升至“图形和设计榜单”第二。
AI黑马,什么来头?
尽管Recraft AI已经俘获了国内大量网友的芳心,但实际上,该模式既不能体现、也不能代表Recraft AI的技术实力。
在很多经常使用AI生图工具的用户看来,此前已有的许多AI绘画大模型均能通过口令输入,实现类似的胶片效果。
真正能够证明Recraft AI实力的,是其今年发布的Recraft V3模型。
正式官宣Recraft V3模型前,Recraft AI曾用“red-panda”的化名参与Artificial Analysis网站中AI图像竞技场的投票,并一举超过FLUX、Midjourney、Ideogram、Stable Diffusion 3.5排名第一,成为AI生成图像赛道的一匹黑马。
因为“red-panda”(小熊猫)这个名字,最初还有很多人猜测该模型背后站着的是不是一家中国公司,直到今年10月,Recraft AI在推特上认领该模型,人们才开始关注这家已经成立了两年的AI企业。
Recraft AI成立于2022年,是一家总部位于英国的初创公司。
创始人兼首席执行官安娜•维罗尼卡•多罗古什(Anna Veronika Dorogush),此前曾在谷歌和微软从事软件工程相关工作,后来加入了俄罗斯最大的搜索引擎平台Yandex,是CatBoost开源梯度提升库的创造者。
今年1月,Recraft AI获得了一笔由美国风投机构Khosla Ventures领投的1100万美元A轮融资,GitHub 前首席执行官纳特•弗里德曼(Nat Friedman)也参与其中,该笔融资主要用于加速技术研发以及市场拓展。
由于国内大多用户是通过社交媒体上传播的“Hard Flash”模式,了解到的Recraft AI,所以人们通常会误以为这是一家像Midjourney那样的AI图像生成公司。
但了解之后便会发现,Recraft AI成立的初衷一直是“专注于为平面设计师提供AI辅助工具”。因此,比起Midjourney,它其实更像是AI版的Cavan或者Photoshop。
就连排名第一的Recraft V3模型,某种程度上也是Recraft AI为了方便设计师生成海报而训练的。
在Recraft V3模型官方介绍的博客中,该公司声称此模型是“图像生成领域里,唯一可以生成带有长文本内容的AI图像模型”。
举个例子,如果一名设计师需要在海报上展现大量文字内容,以往的AI生图模型很容易在文字内容上出现拼写错误,所以设计师的常规做法可能是先借助AI生图生成海报背景图,再用其他工具将文字内容P上去。
而Recraft V3模型的逻辑则是,通过提升AI直接在图像中渲染文字内容的准确性,精简设计师利用AI生成海报的流程。AI媒体“新智元”曾在文章中解释该模型的运作机制:
在构建文本信息的过程中,Recraft团队采用的是TextDiffuser-2的表征方式,每一行文本首先记录了文本的内容,随后通过坐标来指明文本的具体区域。但是与TextDiffuser-2不同的是,Recraft用了三个坐标点表示文本,使得模型能够支持渲染倾斜的文本。
总之,结果就是借助Recraft V3,设计师对于海报中文字内容的生成效果与把控力,大大提升了。
除了AI生成漫画风、写实风、胶片风,矢量图、插图、图标和3D图像外,Recraft还提供套索、局部重绘、抠图、mockup等设计工具。
体验过后,最令刺猬公社的设计同事惊艳的是其中的mockup功能。借助AI能力,Recraft AI能够实现图样或图标自动贴合产品图片,直接生成产品样图,省去了设计师手动调整参数的麻烦。此外,Recraft还引入了实时协作功能,同一项目的设计师可在无限画布上对生成的内容进行评论,并及时修改。
懂模型不够,还要懂内容
虽然似乎有80%的国内用户,并没有像Recraft AI创始人设想的那样,把它当成AI设计工具使用,但凭借Hard Flash走红对其而言也并非坏事。
从AI生成图像领域的历史来看,最近3年绝对是赛道内各大玩家竞争最激烈的时期,大家都在争先恐后地更新大模型,生怕一不小心就被甩在身后。
2021年年初,OpenAI发布了DALL-E大模型,AI得以通过文字生图;
2022年3月,Midjourney上线,能根据用户输入的文字快速生成高质量图像;
2022年8月,Stable Diffusion正式开源,通过将随机噪点转化为高保真图像,实现从文本到图像的生成;
2024年8月,Black Forest Labs推出FLUX模型,其图像质量、文本理解和细节表现均超越了Stable Diffusion 3以及Midjourney,成为了该领域新的领头羊……
而到了10月,人们讨论的主角又迅速变成了Recraft。
根据Recraft AI的官方数据显示,在Recraft V3模型发布20天后,该应用在全球的累计注册用户已经超过了200万。每次注册登录时,Recraft都会询问用户“通过什么途径得知的该应用”,据创始人多罗古什透露:“几乎所有的增长都来自于社交媒体,以及用户之间的口口相传。”
Recraft AI生成
这背后暗含的变化是,随着AI生成图像工具逐渐走进普罗大众的生活,AI企业们要想出圈,仅凭模型实力也许还不够。就像多罗古什在采访时说的那样:“仅仅靠生成高质量的AI图像是不够的,(产品)还需要建立一些能够吸引人们注意力的东西。”
以往一些主要面向C端的AI产品,其实早已证明了这点。
比如去年火爆网络的妙鸭相机和今年上半年火了一阵的Remini,这两款产品一个瞄准了“AI写真”,一个创建了“黏土特效”,两者都是凭借极具代表性的产品功能,才在用户心中留下了不可替代的产品标签。
对于Recraft AI来说,Hard Flash所带来的胶片感,就是它在社媒出圈、在更多用户心中形成认知的“抓手”。
Recraft AI生成
在一众力争画面细节与真实感的AI模型中,Recraft出人意料地切入了允许不合常理的“想象力”赛道。
一方面,风格统一的滤镜画风,加深了普通用户对于该应用的记忆,让Recraft的名字在人们脑海中扎下了根。另一方面,这也十分巧妙了掩盖了AI模型在部分能力上的欠缺,就算是生成的人物充满塑料感、画面总是以彩色幕布作为背景,但在“梦核”“怪诞”的风格标签下,一切都变得合理。
AI企业不断追求技术能力的层层突破,自然仍是当下AI发展阶段的重中之重。但若想带领更多的普通用户走进AI时代,也许除了突破性的AI技术,同样也需要进一步降低使用门槛、选择适宜的产品定位以及营销策略,唯有如此,才能有越来越多的AI产品“飞入寻常百姓家”。
(文章头图由Recraft AI生成)
参考文章:
1、新智元:深度解析Recraft V3 突破文本渲染限制,「文生图」黑马是怎样炼成的?
2、Web3天空之城:AI 绘画何以突飞猛进? 从历史到技术突破, 一文读懂火爆的 AI 绘画发展史
原标题:《让一让,全球最鲜活的AI小猫来了》
阅读原文
相关文章
最新评论