ChatGPT 等聊天机器人的工作原理

虽然大型语言模型看起来很智能，但它们本质上只是预测下一个单词——就像手机的文本建议一样。

如今，数百万人可以使用 ChatGPT 等人工智能技术。Apple Intelligence 将 ChatGPT 集成到其平台后，任何拥有 iPhone、iPad 或 Mac 的用户都可以提出复杂的问题，而无需访问单独的应用程序或网站。

这种期待已久的整合可能会引发诸如 ChatGPT 如何工作之类的问题。

什么是聊天机器人？

ChatGPT 由 OpenAI 运营，是一款人工智能聊天机器人，类似于谷歌的 Gemini、Anthropic 的 Claude 或 Meta AI。这些聊天机器人使用一种名为“大型语言模型”的人工智能。它们能够理解文本并生成听起来像人类的单词。

“现在说这些几乎无聊透顶，”瑞士的人工智能和机器人科学家丹尼尔·杜加斯（Daniel Dugas）说道。他撰写了一篇关于早期人工智能GPT模型的可视化解释。“我能和我的电脑对话，并且进行半连贯的对话，这真是太不可思议了。”

“作为一名工程师，我立即被推向了这样的方向：好吧，我们如何制造类似智能的东西？”杜加斯说。

虽然大型语言模型看起来很智能，但它们本质上只是预测下一个单词——就像手机的文本建议一样。

但实际情况要复杂得多。

ChatGPT 的工作原理

大型语言模型需要基于海量数据进行训练，这些数据涵盖书籍、社交媒体以及互联网上的大部分内容。法学硕士（LLM）能够绘制出与人脑类似的词语关系图。

就拿这句话来说，“不要把所有的鸡蛋都放在一个鸡蛋里。”一旦你把它输入法学硕士论文并点击发送，很多事情就会重复发生——就在几分之一秒内。

第一步：标记化和编码

想象一下这个过程就像一条流水线。流水线的第一步是将句子转换成计算机肯定能理解的东西：数字。

“不要把所有鸡蛋放在一个地方”这句话被分解成所谓的“token ID”，这些 ID 根据 AI 模型的不同而不同。现在这句话变成了 [91418, 3006, 722, 634, 27226, 306, 1001]

您可以使用OpenAI 的工具测试标记化。

第二步：嵌入

接下来，根据上下文扩展得到的数字向量。

例如，“蛋”这个词有很多不同的含义和内涵。如果要用数学方法表达这个词，一种方法是把它画在“鸡”和“幼崽”之间的图上。在二维图上，这很简单。

但“蛋”的含义却千差万别。“蛋”可以是成语的一部分，可以是早餐的食材，可以是与复活节相关的物品，也可以是一种形状。绘制这些图形需要一个无限向量的多个维度。我们无法想象，但计算机可以计算。

在句子“不要把所有的鸡蛋放在一个里面”中，单词 egg 可能是 [27226]。

对于“我早餐吃了一个鸡蛋”这句话，单词“egg”可能是[16102]。这完全取决于上下文。这些上下文调整基于所有训练和词汇关系的神经网络，并将这些变化嵌入到向量中。

第三步：Transformer 架构

向量沿着装配线向下移动到“变压器架构”。它是一系列层，可以对数字向量进行更多调整。

基于之前的训练，AI 已经学习并决定了哪些词更有分量。例如，在“不要把所有鸡蛋放在一个”这句话中，“鸡蛋”这个词比“一个”更重要。

对数字向量的调整会反复进行，以确保上下文和含义接近训练的所有内容。

第四步：输出

最后，结果在装配线上反向运行，将数字向量重新转换为一个单词：篮子。

“不要把所有的鸡蛋放在一个篮子里。”

这是高级词汇预测吗？这是智能吗？有极限吗？

“有些论文说，这个模型永远无法创作音乐，或者永远无法回答数学问题，”杜加斯说。“而这些理论在过去五年里基本上被彻底击垮了。”

随着大型语言模型的不断发展，重要的是要了解它们的功能，并知道如何与它们合作，而不是为它们服务。即使是基本的了解，也能帮助人们利用、驾驭和规范这项可能被一些人视为革命性的技术。

ChatGPT中文