AI 领域的《猫鼠游戏》，盘点那些打假“AI 内容”的强大产品，这款检测器已经突破 400 万用户_AI阅读总结

包阅导读总结

1. `GPTZero`、`AI 内容检测`、`困惑度检测`、`突发性检测`、`端到端模型`

2. GPTZero 是一款 AI 内容检测产品，用户超 400 万。其采用多层方法和端到端深度学习模型，核心技术包括困惑度检测、突发性检测等，利用 LLM 模型生成原理或弱点突破检测，还推出教育模型，构建强大且能改进的检测模型。

– GPTZero 已突破 400 万用户

– 工作原理

– 采用多层方法和端到端深度学习模型

– 核心技术包括困惑度检测和突发性检测

– 困惑度检测

– 衡量模型对文本的“困惑”程度

– 人类文本可预测性差，困惑度高；AI 生成文本可预测性强，困惑度低

– 突发性检测

– 指文本中困惑度的变化

– 人类写作模式会改变，AI 有“印记”，突发性低

– 其他检测方式

– GPTZeroX 逐句分类模型，分析句子由 AI 创建的概率

– 专属教育领域模型，数据含更多学生作业，适合区分 ESL 和 AI 编写文本

– 互联网文本搜索追溯内容源头

– GPTZero 盾防御绕过检测的工具

– 训练模型

– 用大量文本语料库、教育数据集、合成 AI 数据集训练，构建可改进的强大模型

思维导图：

文章地址：https://mp.weixin.qq.com/s/Fp0dQjgIlBK-EpFG3Q6HUQ

文章来源：mp.weixin.qq.com

作者：SenseAI

发布时间：2024/8/14 1:20

语言：中文

总字数：6429字

预计阅读时间：26分钟

评分：87分

标签：AI内容检测,GPTZero,多模态内容检测,OpenAI,图像识别

以下为原文内容

本内容来源于用户推荐转载，旨在分享知识与观点，如有侵权请联系删除联系邮箱 media@ilingban.com

02.

GPTZero 的工作原理

AI 在某些领域的文本生成效果已经达到了真假难辨的程度，GPTZero 是如何构建自己的检测模型来对抗 LLM 模型的快速迭代呢？

GPTZero 模型采用了多层方法和端到端深度学习模型，核心技术包括困惑度检测、突发性检测等。核心都是利用目前 LLM 模型的生成原理或者弱点来进行突破检测。

困惑度检测

困惑度检测衡量了模型对文本的“困惑”或“惊讶”程度，人类编写的文本通常具有更高的困惑度，因为它的可预测性较差，而 AI 生成的文本往往具有较低的困惑度，因为它根据 AI 模型的训练更容易预测。

GPTZero开发了一款类似于 ChatGPT 的 LLM，在文本中的每个单词之后，模型都会提出下一个单词的建议，它会检查建议是否与文本中的实际情况相符，若相符则说明困惑度较低，可能是AI生成的。

突发性检测

突发性检测是指整个文本中困惑度的变化。作为人类，我们倾向于改变我们的写作模式。从哲学上讲，我们的短期记忆会激活并阻止我们重复写类似的东西。

相反，语言模型具有显著的“AI 印记”，它们的写作水平与 AI 非常相似。虽然一个人很容易偶然写出类似 AI 的句子，但人们往往会在整个文档中改变他们的句子结构和措辞。另一方面，模型会公式化地使用相同的规则来选择句子中的下一个单词，从而导致突发性较低。

GPTZero基于数据积累的检测模型

GPTZeroX 是一个逐句分类模型，允许混合文本突出显示。该模型在文档的更大背景下分析文本中的每个句子，并确定每个句子由 AI 创建的概率。

GPTZero 还推出了一个专属教育领域的教育模型，该模型使用的数据比常规模型包含更多学生作业，提高了检测教育用途 AI 的准确性。该模型也非常适合区分 ESL 和 AI 编写的文本。

除此之外，互联网文本搜索也被 GPTZero 视为一种追溯内容源头的方式，模型的这一部分会检查文本和互联网档案中是否存在此文本。与其他 AI 检测服务不同，GPTZero 会确保常用文本不会被错误分类。

GPTZero 盾是一层防御其他试图利用 AI 检测器的工具，GPTZero 维护着一个数据库，其中包含绕过 AI 检测的最常见方法，例如同形字和空格攻击等。

基于这些不同的技术栈，GPTZero 使用深度学习算法构建了一个端到端的 ML 管道，使用来自网络的大量文本语料库、来自合作伙伴的教育数据集以及从一系列语言模型（包括最近的 Llama 和 GPT4）生成的合成 AI 数据集进行训练，从而构建出一个可以随着AI改进而改进的强大模型。

GPTZero 端到端模型的检测原理