火爆全网的 AI 造像，逼开发者祭出“火眼金睛”：让 AI“完美”图片瞬间现原形，不料却秒翻车？_AI阅读总结

包阅导读总结

关键词：AI 造像、Flux、图像鉴别、发展迅速、隐患担忧

总结：AI 图像生成领域新巨头 Flux 崛起，引发轰动。前谷歌搜索创始人用 Claude 编写 AI 图像鉴别工具，但对 JPG 压缩后的真实图像有误判。Flux.1 优势众多，引发 AI 生图热潮，人们对难以区分的 AI 图片带来的隐患表示担忧。

主要内容：

– 图像生成领域新巨头 Flux 崛起

– 由 Stable Diffusion 原始团队开发

– 规模庞大，表现力卓越

– 新的 AI 图像鉴别工具

– 由前谷歌搜索创始人用 Claude 编写

– 能鉴别部分 AI 生成图像，但对压缩后的真实图像有误判

– Flux.1 模型的特点与优势

– 包含开发者版、快速版、专业版

– 开源、图像质量高、可扩展性强

– 人们对 AI 图像的担忧

– 难以区分真假图片

– 可能带来隐患

– 检测方法可能很快失效

思维导图：

文章地址：https://mp.weixin.qq.com/s/WYUhcvTKqjSIznxJC4bhsQ

文章来源：mp.weixin.qq.com

作者：CSDN

发布时间：2024/8/12 10:43

语言：中文

总字数：2499字

预计阅读时间：10分钟

评分：85分

标签：AI 图像生成,Flux,图像鉴别工具,AI 发展趋势,技术伦理

以下为原文内容

本内容来源于用户推荐转载，旨在分享知识与观点，如有侵权请联系删除联系邮箱 media@ilingban.com

最近，在 Stable Diffusion 和 Midjourney 长期占据霸主地位的图像生成领域中，有一个新的巨头正在崛起：Flux。

这款由 Black Forest Labs（即 Stable Diffusion 的原始团队）开发的文本到图像模型，以其庞大的规模和卓越的表现力，正逐步成为文生图模型领域的领军者——前几天被疯狂刷屏的这张极其逼真的“TED 演讲者”图片，就是基于 Flux 训练的 LoRA 模型所生成的。

自 8 月初发布以来，Flux 已在开发者和创意工作者之间引起了巨大轰动。许多人在尝试过 Flux 之后，相继发出“根本分不清到底是真人和 AI”的惊叹。

然而 AI 的魔法，看来还是要用 AI 来打败：昨日，前谷歌搜索创始人之一 Deedy Das 在 X 上宣布，他全程用 Claude 编写了一个辨别图片是否由 AI 生成的工具，其关键在于“提高饱和度”。

完全由 Claude 编写的 AI 鉴别神器？

以最近很火的这张“TED 演讲者”图片为例，Deedy Das 将其上传至这个工具后，原本看似极其逼真的 AI 人像瞬间就暴露了其“真容”：相当诡异的牙齿部分，麦克风和胸牌上的色块也不太正常。

Deedy Das 指出，与下面的真实人像图片相比，显然后者的牙齿部分很正常，提高饱和度后的整体色块也更为均匀且一致。

Deedy Das 还强调，工具代码完全由 AI 模型 Claude 编写，尤其它还是在原始图像数据上编写饱和度代码的，都不用使用外部库。目前，该工具处于公开可用状态（https://claude.site/artifacts/6890e3d7-e65e-41ff-a7d4-3ccb38040b46），感兴趣的人可以去试试。除此之外，Deedy Das 还附上了工具源代码：https://t.co/v6nmtLrezW。

接下来，我们试两张网友用 Flux 生成的 AI 图像，来看看这个工具的具体效果如何：

从结果来看，如果辨别图片是否由 AI 生成的标准是奇怪的牙齿和不和谐的色块，那么这个工具确实将这两张 AI 图片识别出来了。

正当许多人以为，终于出现了个“神器”能准确辨别 AI 图片、不用担心再被 AI 欺骗的时候，有位用户突发奇想，借用 Deedy Das 的 X 头像图片试了试，结果出现了突兀的色块——难道他的头像照片也是 AI 生成的？

看到这个结果，Deedy Das 自己也哭笑不得，解释道：“这可能是图片压缩造成的。我刚用原始图片上试了试，并没有这些没有色块补丁。”

基于这个发现，后来 Deedy Das 在原帖下补充，理论上该工具可以检测 AI 图片，但它对 JPG 压缩后的真实图像会有误判，因此它可能不太适用于辨别社交媒体上的几乎所有图片，因为那些图片普遍都经过压缩：“经过 JPG 压缩的真实图片，整体色块的一致性会被破坏。”

对此 Deedy Das 表示，之后他会想办法构建一个针对最大饱和度图像的分类器，以此来分辨 JPG 压缩图像和 AI 图像。

AI 文生图模型的发展，实在太快

虽然 Deedy Das 承诺会想办法，但我们无法得知他具体会在何时实现——而且就目前来看，AI 文生图模型的发展，实在是太快了。

如开头所说，本月初 Stable Diffusion 背后的原始团队发布了全新的图像生成模型 Flux.1。据介绍，Flux.1 包含开发者版、快速版、专业版三种模型：

● Flux.1 [dev]：基础模型，以非商业许可方式开源，供社区在此基础上构建。

● Flux.1 [schnell]：基础模型的精简版，运行速度提高了 10 倍。Apache 2 授权。

● Flux.1 [pro]：仅通过 API 提供的封闭源代码版本。

根据 Flux 官网公布的数据显示，Flux.1 的 ELO 评分（一种在国际象棋等竞技游戏中广泛使用的评分方法，主要用于计算比赛对手实力等级）已超越 Midjourney-V6.0 和 Stable Diffusion3-Ultra 等主流模型，就算是较小规模的 Flux.1 [schnell] 在性能上也超越了 Midjourney-V6.0 和 Dall-E 3 HD 等更大的模型。

基于以上数据，不少开发者都认为：或许，未来 Flux.1 将会是替代 MidJourney 和 Stable Diffusion 的终极 AI 图像生成工具。

若与 MidJourney 进行对比，Flux.1 在许多方面都具备优势。首先是开源，与 MidJourney 不同，Flux.1 的开源性质使得开发者可以轻松地对其进行修改和扩展，允许深度自定义、集成到各种应用程序中，还能根据需要修改模型。其次是卓越的图像质量，Flux.1 能提供既详细又逼真的高保真输出，图像质量在很多评分中都超过了 MidJourney。最后是可扩展性和性能，拥有 120 亿参数的 Flux.1 能够处理复杂且大规模的图像生成任务，适用于广泛的应用。

凭借着以上功能和优势，Flux.1 仅发布一周有余，就在网上引发了大规模的 AI 生图热潮，其逼真程度令人担忧：“AI 正在失控”。下面图片均由 Flux.1 生成，试问谁能一眼看出这些是 AI 生成的？