Posted in

AI 领域的《猫鼠游戏》,盘点那些打假“AI 内容”的强大产品,这款检测器已经突破 400 万用户_AI阅读总结 — 包阅AI

包阅导读总结

1. `GPTZero`、`AI 内容检测`、`困惑度检测`、`突发性检测`、`端到端模型`

2. GPTZero 是一款 AI 内容检测产品,用户超 400 万。其采用多层方法和端到端深度学习模型,核心技术包括困惑度检测、突发性检测等,利用 LLM 模型生成原理或弱点突破检测,还推出教育模型,构建强大且能改进的检测模型。

3.

– GPTZero 已突破 400 万用户

– 工作原理

– 采用多层方法和端到端深度学习模型

– 核心技术包括困惑度检测和突发性检测

– 困惑度检测

– 衡量模型对文本的“困惑”程度

– 人类文本可预测性差,困惑度高;AI 生成文本可预测性强,困惑度低

– 突发性检测

– 指文本中困惑度的变化

– 人类写作模式会改变,AI 有“印记”,突发性低

– 其他检测方式

– GPTZeroX 逐句分类模型,分析句子由 AI 创建的概率

– 专属教育领域模型,数据含更多学生作业,适合区分 ESL 和 AI 编写文本

– 互联网文本搜索追溯内容源头

– GPTZero 盾防御绕过检测的工具

– 训练模型

– 用大量文本语料库、教育数据集、合成 AI 数据集训练,构建可改进的强大模型

思维导图:

文章地址:https://mp.weixin.qq.com/s/Fp0dQjgIlBK-EpFG3Q6HUQ

文章来源:mp.weixin.qq.com

作者:SenseAI

发布时间:2024/8/14 1:20

语言:中文

总字数:6429字

预计阅读时间:26分钟

评分:87分

标签:AI内容检测,GPTZero,多模态内容检测,OpenAI,图像识别


以下为原文内容

本内容来源于用户推荐转载,旨在分享知识与观点,如有侵权请联系删除 联系邮箱 media@ilingban.com

02.

GPTZero 的工作原理

AI 在某些领域的文本生成效果已经达到了真假难辨的程度,GPTZero 是如何构建自己的检测模型来对抗 LLM 模型的快速迭代呢?


GPTZero 模型采用了多层方法和端到端深度学习模型,核心技术包括困惑度检测、突发性检测等。核心都是利用目前 LLM 模型的生成原理或者弱点来进行突破检测。

困惑度检测

困惑度检测衡量了模型对文本的“困惑”或“惊讶”程度,人类编写的文本通常具有更高的困惑度,因为它的可预测性较差,而 AI 生成的文本往往具有较低的困惑度,因为它根据 AI 模型的训练更容易预测。

GPTZero开发了一款类似于 ChatGPT 的 LLM,在文本中的每个单词之后,模型都会提出下一个单词的建议,它会检查建议是否与文本中的实际情况相符,若相符则说明困惑度较低,可能是AI生成的。

突发性检测

突发性检测是指整个文本中困惑度的变化。作为人类,我们倾向于改变我们的写作模式。从哲学上讲,我们的短期记忆会激活并阻止我们重复写类似的东西。

相反,语言模型具有显著的“AI 印记”,它们的写作水平与 AI 非常相似。虽然一个人很容易偶然写出类似 AI 的句子,但人们往往会在整个文档中改变他们的句子结构和措辞。另一方面,模型会公式化地使用相同的规则来选择句子中的下一个单词,从而导致突发性较低。


GPTZero基于数据积累的检测模型

GPTZeroX 是一个逐句分类模型,允许混合文本突出显示。该模型在文档的更大背景下分析文本中的每个句子,并确定每个句子由 AI 创建的概率。


GPTZero 还推出了一个专属教育领域的教育模型,该模型使用的数据比常规模型包含更多学生作业,提高了检测教育用途 AI 的准确性。该模型也非常适合区分 ESL 和 AI 编写的文本。


除此之外,互联网文本搜索也被 GPTZero 视为一种追溯内容源头的方式,模型的这一部分会检查文本和互联网档案中是否存在此文本。与其他 AI 检测服务不同,GPTZero 会确保常用文本不会被错误分类。


GPTZero 盾是一层防御其他试图利用 AI 检测器的工具,GPTZero 维护着一个数据库,其中包含绕过 AI 检测的最常见方法,例如同形字和空格攻击等。


基于这些不同的技术栈,GPTZero 使用深度学习算法构建了一个端到端的 ML 管道,使用来自网络的大量文本语料库、来自合作伙伴的教育数据集以及从一系列语言模型(包括最近的 Llama 和 GPT4)生成的合成 AI 数据集进行训练,从而构建出一个可以随着AI改进而改进的强大模型。


GPTZero 端到端模型的检测原理