包阅导读总结
1.
关键词:AI 造像、Flux、图像鉴别、发展迅速、隐患担忧
2.
总结:AI 图像生成领域新巨头 Flux 崛起,引发轰动。前谷歌搜索创始人用 Claude 编写 AI 图像鉴别工具,但对 JPG 压缩后的真实图像有误判。Flux.1 优势众多,引发 AI 生图热潮,人们对难以区分的 AI 图片带来的隐患表示担忧。
3.
主要内容:
– 图像生成领域新巨头 Flux 崛起
– 由 Stable Diffusion 原始团队开发
– 规模庞大,表现力卓越
– 新的 AI 图像鉴别工具
– 由前谷歌搜索创始人用 Claude 编写
– 能鉴别部分 AI 生成图像,但对压缩后的真实图像有误判
– Flux.1 模型的特点与优势
– 包含开发者版、快速版、专业版
– 开源、图像质量高、可扩展性强
– 人们对 AI 图像的担忧
– 难以区分真假图片
– 可能带来隐患
– 检测方法可能很快失效
思维导图:
文章地址:https://mp.weixin.qq.com/s/WYUhcvTKqjSIznxJC4bhsQ
文章来源:mp.weixin.qq.com
作者:CSDN
发布时间:2024/8/12 10:43
语言:中文
总字数:2499字
预计阅读时间:10分钟
评分:85分
标签:AI 图像生成,Flux,图像鉴别工具,AI 发展趋势,技术伦理
以下为原文内容
本内容来源于用户推荐转载,旨在分享知识与观点,如有侵权请联系删除 联系邮箱 media@ilingban.com
最近,在 Stable Diffusion 和 Midjourney 长期占据霸主地位的图像生成领域中,有一个新的巨头正在崛起:Flux。
这款由 Black Forest Labs(即 Stable Diffusion 的原始团队)开发的文本到图像模型,以其庞大的规模和卓越的表现力,正逐步成为文生图模型领域的领军者——前几天被疯狂刷屏的这张极其逼真的“TED 演讲者”图片,就是基于 Flux 训练的 LoRA 模型所生成的。
自 8 月初发布以来,Flux 已在开发者和创意工作者之间引起了巨大轰动。许多人在尝试过 Flux 之后,相继发出“根本分不清到底是真人和 AI”的惊叹。
然而 AI 的魔法,看来还是要用 AI 来打败:昨日,前谷歌搜索创始人之一 Deedy Das 在 X 上宣布,他全程用 Claude 编写了一个辨别图片是否由 AI 生成的工具,其关键在于“提高饱和度”。
完全由 Claude 编写的 AI 鉴别神器?
以最近很火的这张“TED 演讲者”图片为例,Deedy Das 将其上传至这个工具后,原本看似极其逼真的 AI 人像瞬间就暴露了其“真容”:相当诡异的牙齿部分,麦克风和胸牌上的色块也不太正常。
Deedy Das 指出,与下面的真实人像图片相比,显然后者的牙齿部分很正常,提高饱和度后的整体色块也更为均匀且一致。
Deedy Das 还强调,工具代码完全由 AI 模型 Claude 编写,尤其它还是在原始图像数据上编写饱和度代码的,都不用使用外部库。目前,该工具处于公开可用状态(https://claude.site/artifacts/6890e3d7-e65e-41ff-a7d4-3ccb38040b46),感兴趣的人可以去试试。除此之外,Deedy Das 还附上了工具源代码:https://t.co/v6nmtLrezW。
接下来,我们试两张网友用 Flux 生成的 AI 图像,来看看这个工具的具体效果如何:
从结果来看,如果辨别图片是否由 AI 生成的标准是奇怪的牙齿和不和谐的色块,那么这个工具确实将这两张 AI 图片识别出来了。
正当许多人以为,终于出现了个“神器”能准确辨别 AI 图片、不用担心再被 AI 欺骗的时候,有位用户突发奇想,借用 Deedy Das 的 X 头像图片试了试,结果出现了突兀的色块——难道他的头像照片也是 AI 生成的?
看到这个结果,Deedy Das 自己也哭笑不得,解释道:“这可能是图片压缩造成的。我刚用原始图片上试了试,并没有这些没有色块补丁。”
基于这个发现,后来 Deedy Das 在原帖下补充,理论上该工具可以检测 AI 图片,但它对 JPG 压缩后的真实图像会有误判,因此它可能不太适用于辨别社交媒体上的几乎所有图片,因为那些图片普遍都经过压缩:“经过 JPG 压缩的真实图片,整体色块的一致性会被破坏。”
对此 Deedy Das 表示,之后他会想办法构建一个针对最大饱和度图像的分类器,以此来分辨 JPG 压缩图像和 AI 图像。
AI 文生图模型的发展,实在太快
虽然 Deedy Das 承诺会想办法,但我们无法得知他具体会在何时实现——而且就目前来看,AI 文生图模型的发展,实在是太快了。
如开头所说,本月初 Stable Diffusion 背后的原始团队发布了全新的图像生成模型 Flux.1。据介绍,Flux.1 包含开发者版、快速版、专业版三种模型:
● Flux.1 [dev]:基础模型,以非商业许可方式开源,供社区在此基础上构建。
● Flux.1 [schnell]:基础模型的精简版,运行速度提高了 10 倍。Apache 2 授权。
● Flux.1 [pro]:仅通过 API 提供的封闭源代码版本。
根据 Flux 官网公布的数据显示,Flux.1 的 ELO 评分(一种在国际象棋等竞技游戏中广泛使用的评分方法,主要用于计算比赛对手实力等级)已超越 Midjourney-V6.0 和 Stable Diffusion3-Ultra 等主流模型,就算是较小规模的 Flux.1 [schnell] 在性能上也超越了 Midjourney-V6.0 和 Dall-E 3 HD 等更大的模型。
基于以上数据,不少开发者都认为:或许,未来 Flux.1 将会是替代 MidJourney 和 Stable Diffusion 的终极 AI 图像生成工具。
若与 MidJourney 进行对比,Flux.1 在许多方面都具备优势。首先是开源,与 MidJourney 不同,Flux.1 的开源性质使得开发者可以轻松地对其进行修改和扩展,允许深度自定义、集成到各种应用程序中,还能根据需要修改模型。其次是卓越的图像质量,Flux.1 能提供既详细又逼真的高保真输出,图像质量在很多评分中都超过了 MidJourney。最后是可扩展性和性能,拥有 120 亿参数的 Flux.1 能够处理复杂且大规模的图像生成任务,适用于广泛的应用。
凭借着以上功能和优势,Flux.1 仅发布一周有余,就在网上引发了大规模的 AI 生图热潮,其逼真程度令人担忧:“AI 正在失控”。下面图片均由 Flux.1 生成,试问谁能一眼看出这些是 AI 生成的?
不仅图片,甚至连视频都可以流畅生成——AI 创意制作人 Heather Cooper 就分享了一个用 Flux 制作化妆品广告的例子,甚至仅需 8 个步骤即可。
检测 AI 的方法,很可能也会很快失效
面对这些难以区分的 AI 图片,不少人十分担忧其可能带来的隐患,由此开始讨论到底该如何区分这些真真假假的图片。
有网友发现,如果让 AI 生成“普通人”的图片,通常都是不会笑的人,但如果是要求生成“漂亮的人”则多数都面带微笑。如下,提示词为“相貌平平的人”所生成的图片:
对此有人分析称,这是因为模型根据当下的社会现象,认为“普通人”就该是正常的、平淡无奇的,“漂亮的人”的人则应该开朗明媚。某种程度上来说,这也是一种训练偏差。
还有人指出,AI 生成的图像往往略显模糊,因此放在大屏幕上比在手机上更容易分辨。除此之外,AI 生成的人的脸颊和额头,通常会有反光,且反光程度比真实照片要夸张一些——尽管如此,根据这两年的 AI 发展状况,这些检测 AI 的方法很可能也会很快失效。
基于以上,越来越多人对 AI 发展的未来前景感到担忧:
●“我在网上看到过一些帖子,帖子里有几张 AI 照片,然后作者会说其中一张是真的。现在真的越来越难一眼分辨了。很多人也不会花时间仔细检查他们在社交媒体上看到的每张照片。”
●“这东西很可怕,因为如果我把它给我父母看,他们根本不会分辨出这是真的还是假的。”
那么,你是否也有被 AI 图片混淆过,又是否有辨别 AI 图片的方法可以分享吗?
参考链接:
https://x.com/deedydas/status/1822665923775611374
https://x.com/AngryTomtweets/status/1822203767728591350
https://www.reddit.com/r/artificial/comments/1epjlbl/average_looking_people/
▶堪比Windows蓝屏危机!Linux被曝12年史诗级漏洞,“投毒者”是谷歌?
▶郑州富士康小时工时薪涨至26元;90后银行程序员黄雪梅奥运大众马拉松女子第一;谷歌开发乒乓球机器人 | 极客头条
▶干掉Windows?微软曾花7年研发新系统:连管理层都亲自写代码,最终却惨遭夭折
能学习到新知识、产生共鸣,解答久困于心的困惑,这是《新程序员》的核心价值。欢迎扫描下方二维码订阅纸书和电子书。