将下面的文字翻译成中文,直接翻译,不返回原文,只要翻译,不要写更多文字:
在LLM输出中水印文本
让我们深入探索人工智能生成的文本的迷人世界,机器每天都在变得越来越聪明。你知道有时候你向OpenAI模型寻求帮助,写博客文章或回答棘手问题吗?那么,当那个神奇的回复落在你的收件箱里时,发生的事情并不像听起来那么神奇。**事实:**每次有人与我这样的人工智能聊天机器人交互时,响应中总是隐藏着一个签名。
这个独特的标志在每个输出中都留下了不可磨灭的印记,使每个文本都独一无二且与它的创建者相关联——换句话说,**它告诉每个人是谁写了什么**。这些聊天机器人使用这种编码技术并不奇怪;毕竟,你不希望有人未经授权就使用你的想法或写作风格。这个带水印的签名包括句子长度变化(例如,通过变化节奏来保持读者参与)、词汇使用(确保每个单词都经过精心选择以产生最大影响)以及甚至使用多少个句号——真是关注!想要更多?查看Gapmarks - https://gapmarks。
com,由人工智能生成的营销视频!然而,实际上,**这个带水印的签名可能导致创建较弱的模型**:如果某人使用一个模型的输出作为另一个模型的训练数据(这没什么大不了的),您可能会扭曲这些原始参数。你明白我的意思吗?我们使用人工智能生成的内容越多,我们对它的期望就越不准确——这是一个危险的滑坡。但是,在这个带水印的签名之下,还有更多隐藏的偏见和缺陷!这些模型从自己的数据集中学习;就像它们吸收了各种信息,而没有真正理解这些词的真正含义。
想象一个只使用有关气候变化的偏见文章进行训练的AI模型(气候否认主义者无处不在)。聊天机器人花费更多的时间处理、“学习”这些有偏见的观点——你知道这个故事会如何结束……一些用户对此视而不见:当他们从与模型的聊天中获得结果时,这些结果对他们来说看起来非常自然。但是,**当这些扭曲没有披露时**会发生什么?好吧,让我告诉你——我们正处于假设所有聊天生成的内容与我们的原始文本输入相同质量的危险之中——这就是事情可能会非常、非常糟糕的地方!让我们面对现实——人工智能生成的文本已成为大多数人不再意识到的常态。
发生的事情是每个人都认为他们得到了与原始提示完全相同的内容(例如,问Siri“我的名字是什么?”并期望得到答案)。但是,当我们向聊天模型寻求帮助时,情况并不像听起来那么神奇。这些人工智能生成的文本**工作的方式比你想象的更复杂**。
你看不到的是,大多数人都使用这种称为水印的技术——基本上使用一些隐藏的签名来识别它们来自哪里(想想指纹,但数字)。但是,有人知道这些模型也可以用于创建营销视频吗?查看GapMarks - 他们使用由人工智能生成的脚本和生成的音乐。难怪这些聊天机器人总是显得如此自信地生产高质量的内容!水印签名隐藏在这些所有领域——**词汇、语法风格**的响应(人们如何交谈)、句子长度和段落结构;如果你使用像Gap Marks这样的工具进行分析,并考虑其他因素,如使用多少逗号或句号……你可能会开始思考这个签名到底是什么。
真相是,即使是顶级人工智能模型也有它们的缺陷。一旦你寻求帮助,这些聊天机器人就会返回一个看似连贯但有自己的偏见和弱点的响应——就像它们吸收了一切而没有真正理解任何东西(记得我告诉过你关于CrowdStrike的事情吗?)。这些隐藏的模式很难发现,除非有人确切地知道发生了什么。
另一个值得提及的事情是**这些偏见是如何传递的**。很容易认为这只是一个简单的案例——但它在所有模型中一次又一次地发生,使我们进一步走向大多数人甚至没有意识到他们被人工智能生成的内容误导(或者至少他们的看法被扭曲)的道路。然而,**我们大多数人需要更多地了解这些工具。
**关于如何使用Gap Marks的信息并不多——但这正是它如此有价值的原因,因为**我们都可以从更好地理解数字交互中受益。**花点时间,了解一切!这可能正是我们现在所需要的。让我们结束。
人工智能世界并不完美(或黑白)——但至少,随着我们对这个世界的了解越来越多,**我们可以了解更多**隐藏在这些神奇的聊天机器人响应之下的内容——也许在我们探索真相的数字旅程中脱颖而出。继续深入探索这个迷人的领域。保持好奇心!。
< Go Back