人工智能是否真正能够理解语言?

本文最初发表于广达杂志社。 一张图片胜过千言万语,但一个单词又能抵得上多少个数字呢?这个问题可能听起来很傻,但它恰好是大型语言模型(法学硕士)的基...

本文最初发表于广达杂志社。

一张图片胜过千言万语,但一个单词又能抵得上多少个数字呢?这个问题可能听起来很傻,但它恰好是大型语言模型(法学硕士)的基础,并且通过它们,人工智能的许多现代应用都是如此。

每个法学硕士都有自己的答案。在meta的开源Llama 3模型中,单词被分成由4096个数字表示的令牌;GPT-3的一个版本是12288。单独来看,这些长长的数字列表——被称为“嵌入”——只是难以理解的数字链。但同时,它们对单词之间的数学关系进行编码,这些关系看起来出奇地像意思。

单词嵌入背后的基本思想已经有几十年的历史了。要在计算机上模拟语言,首先从字典中取出每个单词,并列出它的基本特征——有多少由你决定,只要每个单词都是相同的。“你几乎可以把它想象成一个20问游戏,”在布朗大学和谷歌DeepMind研究语言模型的计算机科学家埃莉·帕夫利克(Ellie Pavlick)说。“动物、蔬菜、物体——这些特征可以是人们认为对区分概念有用的任何东西。”然后为列表中的每个特征分配一个数值。例如,dog这个词在“毛茸茸的”上得分很高,但在“金属的”上得分很低。结果将把每个单词的语义关联及其与其他单词的关系嵌入到一个唯一的数字串中。

研究人员曾经手工指定这些嵌入,但现在它们是自动生成的。例如,神经网络可以被训练成根据网络自己定义的特征对单词(或者,技术上讲,被称为“标记”的文本片段)进行分组。帕夫利克说:“也许有一种特征能很好地区分名词和动词,而另一种特征则能区分在句号后出现的单词和在句号后不出现的单词。”

这些机器学习嵌入的缺点是,与20个问题的游戏不同,每个数字列表中编码的许多描述是人类无法解释的。帕夫利克说:“这似乎是一个大杂烩。”“神经网络可以以任何有用的方式组成特征。”

但是,当一个神经网络被训练在一个叫做语言建模的特殊任务上时——这里涉及到预测序列中的下一个单词——它学到的嵌入绝不是任意的。就像铁屑在磁场下排列一样,这些值的设置方式使得具有相似关联的单词在数学上具有相似的嵌入。例如,狗和猫的嵌入将比狗和椅子的嵌入更相似。

这种现象使嵌入看起来很神秘,甚至很神奇:神经网络以某种方式将原始数字转化为语言意义,“就像把稻草纺成金子一样,”帕夫利克说。“文字算术”的著名例子——国王减去男人加上女人大致等于女王——只会增强嵌入的光环。它们似乎是LLM“知道”的丰富而灵活的知识库。

但这些所谓的知识与我们在字典中找到的东西完全不同。相反,它更像是一张地图。如果您将每个嵌入想象为由其他嵌入共享的高维地图上的一组坐标,您将看到某些模式弹出。某些词会聚集在一起,就像郊区拥抱大城市一样。同样,狗和猫的坐标会比狗和椅子更相似。

但与地图上的点不同的是,这些坐标只指向彼此,而不指向任何潜在的领土,就像纬度和经度数字表示地球上的特定地点一样。相反,狗或猫的嵌入更像是星际空间中的坐标:除了它们碰巧离其他已知点有多近之外,没有任何意义。

那么,为什么狗和猫的嵌入如此相似呢?这是因为他们利用了语言学家几十年前就知道的东西:在相似的语境中使用的单词往往具有相似的意思。在“我雇了一个宠物保姆来喂我的____”这个序列中,下一个单词可能是狗或猫,但可能不是椅子。你不需要字典来判断,只需要统计数据。

嵌入——基于这些统计数据的上下文坐标——是LLM如何找到一个好的起点来进行下一个单词的预测,而不依赖于定义。

某些词在特定的语境中比其他词更合适,有时精确到没有其他词可以代替。(想象一下,当你完成“法国现任总统的名字是____”这句话的时候)根据许多语言学家的说法,人类之所以能很好地辨别这种契合感,很大程度上是因为我们不只是把单词和单词联系起来——我们实际上知道它们指的是什么,就像地图上的领土一样。语言模型不会,因为嵌入不是那样工作的。

然而,作为语义的代理,嵌入被证明是非常有效的。这也是大型语言模型迅速上升到人工智能前沿的原因之一。当这些数学对象以一种与我们的期望相吻合的方式组合在一起时,感觉就像智慧;当他们不这样做时,我们称之为“幻觉”。然而,对于法学硕士来说,没有什么不同。它们只是一串数字,在空间里消失了。

本文来自作者[慕儿]投稿,不代表kzshn号立场,如若转载,请注明出处:https://blog.kzshn.cn/jyfx/202508-5121.html

(1)

文章推荐

  • 超级明星克鲁尼与皮特在孤独的‘狼’兄弟影片中斗嘴与玩乐

    周日,乔治·克鲁尼和布拉德·皮特在威尼斯为他们的新电影《狼》举行了一场公开的“爱的盛宴”,他们开玩笑、调侃,并主持了一场公开的“爱的盛宴”。这部备受瞩目的影片由两位好莱坞顶级男主角主演,是为期10天的威尼斯电影节的亮点之一。这两位演员在红毯上的表现

    2025年07月16日
    12
  • 议会投诉系统将迎来重大改革

    适用于新南威尔士州地方议会的“从根本上被破坏”的行为准则即将进行改革,因为官员们指责一堆琐碎的投诉使该体系陷入困境。所有文章都来自我们的网站和应用程序让直接到你的收件箱互动填字游戏,数独和琐事的所有文章从其他在你的地区邦政府已经发布了一份讨

    2025年07月21日
    12
  • 道奇队以11比4战胜落基队,夺得西部冠军,大谷秀平轰出第54支本垒打并成功盗垒第57个垒

      丹佛(美联社)——周五晚上,大谷秀平(ShoheiOhtani)在比赛中击出了本赛季的第54支全垒打,这是一记重要的三分安打,同时他也成功盗垒,成为本赛季的第57个垒。洛杉矶道奇队以11-4战胜了科罗拉多落基山队,赢得了美国国家联盟西部冠军。这位道奇队的

    2025年07月23日
    9
  • 辛普森与妮可·布朗·辛普森的孩子们究竟经历了什么?

      “世纪审判”,“梦之队”,“如果不合适,你必须无罪释放”——辛普森审判的口号和描述早已在公众意识中取代了案件的实质。再加上喜剧演员的俏皮话、随意的引用以及一次又一次的恶搞,整个事件看起来就像一场流行文化的奇观。然而,在所有的笑声和评论背后,仍然有一个事实,那

    2025年07月28日
    11
  • 贝纳通时装零售商拟进行重组以应对持续亏损

      消息人士称,意大利贝纳通家族正准备解决其同名服装零售商日益严重的亏损问题,包括在四年后与首席执行官马西莫·雷农分道扬镳。一位知情人士告诉路透社,该服装集团董事会预计将于周二开会,讨论2023年约2.3亿欧元的净亏损,其中包括减值。相比之下,该公司在2022年净亏损8100万欧元,营

    2025年07月30日
    9
  • 玩家攻略宝典“微乐河南麻将斗地主有挂吗”附开挂脚本详细步

    >亲,微乐河南麻将斗地主有挂吗这款游戏原来确实可以开挂,详细开挂教程1、起手看牌2、随意选牌3、控制牌型4、注明,就是全场,公司软件防封号、防检测、 正版软件、非诚勿扰。2022首推。全网独家,诚信可靠,无效果全额退款,本司推出的多功能作&nb

    2025年08月14日
    15
  • 巨人队的丹尼尔·琼斯连续三周缺阵,泰勒将对阵喷气机

      东卢瑟福,新泽西州(美联社)——巨人队四分卫丹尼尔·琼斯将因颈部受伤连续缺席第三场比赛,泰罗德·泰勒将在周日大都会人寿体育场对阵喷气机队的比赛中首发。巨人队教练布莱恩·达波尔周五表示,琼斯和替补跑卫加里·布莱特维尔(腿筋受伤)将缺席周日的比赛。自从琼斯在10月8日对阵迈阿密热火的比赛

    2025年08月15日
    11
  • 玩家必读“微乐麻将感开挂怎么查”详细分享开挂

    网上科普有关微乐麻将感开挂怎么查”话题很是火热,小编也是针对微乐麻将的技术支持和安全性寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。您好,微乐麻将感开挂怎么查这款游戏可以开挂的,确实是有挂的,通过微信【游戏】很

    2025年08月16日
    8
  • 探索釜山国际电影节:房间音的魅力导览

    釜山国际电影节是亚洲最受欢迎、最具活力的电影盛会之一。凭借其迷人的红地毯,众多国际电影阵容和风景如画的海边环境,它吸引了来自世界各地的电影爱好者,电影制作人和记者。然而,在炫目的背后,是一种复杂的、杂乱无章的体验,可能很难驾驭。在BIFF生

    2025年08月18日
    4
  • 生活成本压力下,澳大利亚人饮食习惯的转变与健康研究

      最新的研究指出,生活成本的上升正在迫使注重饮食的澳大利亚人选择更为经济的蛋白质来源。这项由营养和食品追踪应用MyFitnessPal委托的研究显示,36%的受访者表示他们在每周购物中不太可能购买红肉,而33%的受访者则不愿意购买蛋白质棒和

    2025年08月19日
    4

发表回复

本站作者后才能评论

评论列表(4条)

  • 慕儿
    慕儿 2025年08月20日

    我是kzshn号的签约作者“慕儿”!

  • 慕儿
    慕儿 2025年08月20日

    希望本篇文章《人工智能是否真正能够理解语言?》能对你有所帮助!

  • 慕儿
    慕儿 2025年08月20日

    本站[kzshn号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 慕儿
    慕儿 2025年08月20日

    本文概览:本文最初发表于广达杂志社。 一张图片胜过千言万语,但一个单词又能抵得上多少个数字呢?这个问题可能听起来很傻,但它恰好是大型语言模型(法学硕士)的基...

    联系我们

    邮件:kzshn号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们