(相关资料图)
大型语言模型(LLM)的使用正在激增,而且有充分的理由,在过去的两个星期里,ChatGPT已经成为许多人最喜欢的辅助工具。事实上,它是如此之好,以至于它可以为你的大学课业生成逻辑清晰、令人信服的论文。正因为如此现在需要有检测机器生成的文本的系统。
最近,斯坦福大学的一个研究小组提出了一种名为DetectGPT的新方法,旨在成为打击高等教育中生成文本的首批工具之一。该方法是基于这样的想法:由LLM生成的文本通常在模型的对数概率函数的负曲率区域的特定区域徘徊。通过这种洞察力,该团队开发了一种新的标准用于判断文本是否是机器生成的,这并不依赖于训练人工智能或收集大型数据集来比较文本。
这种方法被称为"zero-shot",允许DetectGPT检测机器写的文本,而不需要了解用于生成文本的人工智能。它的操作与其他需要训练"分类器"和真实及生成段落数据集的方法形成鲜明对比。
该团队在AI自动生成新闻文章的数据集上测试了DetectGPT(大概是去年CNET的一些文章),它在检测机器生成的文本方面的表现优于其他方法。具体来说,他们发现DetectGPT提高了对20B参数GPT-NeoX生成的新闻文章的检测准确性,从基线GPT-NeoX的0.81AUROC提高到DetectGPT的0.95AUROC,检测性能有了实质性的提高,并表明DetectGPT可能是一种有前途的方法,可以仔细检查识别机器生成的文本。
DetectGPT是一种检测机器生成的文本的新方法,它利用了LLM生成的文本的独特特征。它是一种不需要任何额外数据或训练的零散方法,使其成为识别机器生成的文本的高效和有效工具。随着LLM的使用继续增长,检测机器生成的文本的相应系统的重要性将变得越来越关键,可以在许多领域产生重大影响,它的进一步发展可能对许多领域都有利。
了解更多:
https://ericmitchell.ai/detectgpt/