OpenAI推出全新‘0’模型,进一步推动人工智能向人类思维方式靠近

OpenAI发布了一款名为“01”的人工智能模型,旨在更像人类一样进行推理。 在复杂的任务中,尤其是在科学、编码和数学方面,O...

  • OpenAI发布了一款名为“01”的人工智能模型,旨在更像人类一样进行推理。
  • 在复杂的任务中,尤其是在科学、编码和数学方面,O1比以前的模型表现得更好。
  • 专家们仍持怀疑态度,认为人工智能离实现通用智能还有很长的路要走。
感谢您的报名!转到时事通讯偏好

人类智能和人工智能之间的界限变得越来越窄。

OpenAI在周四发布了o1,这是该公司在一篇博客文章中表示,“旨在花更多时间思考,然后做出反应”的一系列新人工智能模型中的第一个。

与以前的模型相比,新模型可以处理复杂的任务,并且可以解决科学、编码和数学方面更困难的问题。从本质上讲,它们比现有的人工智能聊天机器人更像人类。

本文仅对Business Insider订阅者开放。成为业内人士,现在就开始阅读。有账户吗?.

虽然OpenAI的前几代模型在SAT和统一律师资格考试(Uniform Bar Examination)等标准化考试中表现出色,但该公司表示,01更进了一步。它的表现“类似于博士生在物理、化学和生物学方面具有挑战性的基准任务。”

例如,它在国际数学奥林匹克的资格考试中以很大的优势击败了gpt - 40——OpenAI在5月份推出的一个多模态模型。该公司表示,gpt - 40只正确解决了13%的考试问题,而01的得分为83%。

他们推理能力的急剧提升,部分来自于一种被称为“思维链”的提示技巧。OpenAI表示,o1“学会了识别和纠正错误。它学会把棘手的步骤分解成更简单的步骤。当当前的方法不起作用时,它会学会尝试不同的方法。”

这并不是说与早期的型号相比,没有一些权衡。OpenAI指出,虽然人类测试者更喜欢在数据分析、编码和数学等需要大量推理的类别中使用gpt - 40的反应,但在个人写作等自然语言任务中,gpt - 40仍然胜出。

长期以来,OpenAI的主要任务一直是创造通用人工智能(AGI),这是一种模仿人类能力的人工智能形式。今年夏天,当o1仍在开发中时,该公司公布了一个新的五级分类系统,用于跟踪其实现这一目标的进展。据报道,公司高管告诉员工,o1已接近第二级,即具有人类水平解决问题的“推理者”。

宾夕法尼亚大学沃顿商学院(University of Pennsylvania’s Wharton School)教授莫里克(Ethan Mollick)已经使用了o1一个多月,他说,该模型的好处或许最能体现在它解决填字游戏的方式上。对于大型语言模型来说,填字游戏通常很难解决,因为“它们需要迭代解决:尝试和拒绝许多相互影响的答案,”莫里克在他的Substack上写道。大多数大型语言模型“每次只能在它们的答案中添加一个标记/单词”。

但当莫里克要求01解决一个填字游戏时,它在回答之前思考了“整整108秒”。他说,该书的思想既“具有启发性”,又“令人印象深刻”,即使它们并不完全正确。

有关的故事

然而,其他人工智能专家并不那么相信。

纽约大学认知科学教授加里·马库斯告诉商业内幕网,该模型是“令人印象深刻的工程”,但不是一个巨大的飞跃。他说:“我相信它会像往常一样被炒得沸沸扬扬,但绝对不会接近AGI。”

自从OpenAI去年发布GPT-4以来,它一直在发布连续的迭代版本,以寻求发明AGI。今年4月,GPT-4 Turbo向付费用户开放。其中一个更新包括生成“更具对话性”的回复的能力。

该公司在7月份宣布,它正在测试一款名为SearchGPT的人工智能搜索产品,只面向有限的用户群体。

本文来自作者[问玉]投稿,不代表kzshn号立场,如若转载,请注明出处:https://blog.kzshn.cn/wiki/202508-3631.html

(3)

文章推荐

  • 勒索者银行账户关闭的影响

    她说:“我们与澳大利亚交易报告和分析中心(AUSTRAC)和金融机构密切合作,使澳大利亚成为一个有组织犯罪分子试图从我们年轻人的性勒索中获利的敌对环境。”警方认为,一系列因素导致了性勒索报告的减少。施耐德说:“公众意识的提高,

    2025年07月10日
    13
  • 最新研究揭示:美国宇航局的罗曼号有潜力探测400颗地球质量的流浪行星

    美国国家航空航天局和日本大阪大学的科学家们进行的一项新研究表明,流浪行星——在太空中不受恒星束缚而漂移的世界——的数量远远超过围绕恒星运行的行星。结果表明,美国宇航局定于2027年5月发射的南希·格蕾丝·罗马太空望远镜可能会发现400颗地球质量的流浪行星。事实上,这项新研究已经确定了一个这样的候选者

    2025年07月18日
    12
  • 营养师指出,特定的面食烹饪方式有助于减轻体重

    食物鉴赏家表示,我们可能完全错误地食用了意大利面,它不仅不会导致体重增加,反而有助于减肥。意大利面是一种受人喜爱的碳水化合物主食,通常与米饭和面包放在一起。然而,随着减肥趋势的转变,消除碳水化合物是否是减肥的关键这个问题仍然存在争议。一位专家在接受《星期日泰晤士报》采

    2025年07月26日
    11
  • 提升NPC效率,促进经济稳健发展

    卡拉奇:目前有关纳亚巴基斯坦证书(NPC)的金融策略需要紧急关注,特别是以人民币计价的证书的利率。目前,一年期投资利率为21.5%,明显高于巴基斯坦国家银行(SBP)的政策利率或17.5%的一年期国库券拍卖利率。这种差异创造了一个低效的套利机会,让海外巴基斯坦人

    2025年07月30日
    10
  • 英国最实惠购房地:被称为“混凝土荒地”的地方

    众所周知,目前要登上英国住房市场的阶梯并不容易。上个月,平均房价几乎达到了历史新高,9月份达到293,399英镑,仅略低于2022年6月创下的293,507英镑的历史新高。但如果你想以尽可能低的价格买自己的房子,西约克郡的一个地方可能是关键。

    2025年08月09日
    11
  • 科技通报“沐沐福建麻将怎么开挂”(其实是有挂)

    亲,沐沐福建麻将怎么开挂这款游戏原来确实可以开挂,详细开挂教程1、起手看牌2、随意选牌3、控制牌型4、注明,就是全场,公司软件防封号、防检测、 正版软件、非诚勿扰。2022首推。全网独家,诚信可靠,无效果全额退款,本司推出的多功能作 弊辅助

    2025年08月13日
    11
  • 科技通报“九九万州麻将怎么开挂”附开挂脚本详细步骤

    亲,九九万州麻将怎么开挂这款游戏原来确实可以开挂,详细开挂教程1、起手看牌2、随意选牌3、控制牌型4、注明,就是全场,公司软件防封号、防检测、 正版软件、非诚勿扰。2022首推。全网独家,诚信可靠,无效果全额退款,本司推出的多功能作 弊辅助

    2025年08月14日
    10
  • 查到实测辅助“宝宝浙江麻将有挂吗”确实真的有挂

    宝宝浙江麻将有挂吗是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义手机打牌系统规律,只需要输入自己想要的开挂功能,一键便可以生成出手

    2025年08月14日
    11
  • 介绍一款“奇迹陕西麻将有没有挂”(必胜开挂神

    您好:奇迹陕西麻将有没有挂这款游戏是可以开挂的,软件加微信【添加图中微信】确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂,实际上这款游戏确实是有挂的,添加客服微信

    2025年08月14日
    11
  • 教程解析“微信雀神麻将小程序怎样开挂”原来确实有挂

    微信雀神麻将小程序怎样开挂是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加入我们(QQ群聊)免费测试,先看效果下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义手机打牌系统规律,只需要输

    2025年08月16日
    2

发表回复

本站作者后才能评论

评论列表(4条)

  • 问玉
    问玉 2025年08月16日

    我是kzshn号的签约作者“问玉”!

  • 问玉
    问玉 2025年08月16日

    希望本篇文章《OpenAI推出全新‘0’模型,进一步推动人工智能向人类思维方式靠近》能对你有所帮助!

  • 问玉
    问玉 2025年08月16日

    本站[kzshn号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 问玉
    问玉 2025年08月16日

    本文概览:OpenAI发布了一款名为“01”的人工智能模型,旨在更像人类一样进行推理。 在复杂的任务中,尤其是在科学、编码和数学方面,O...

    联系我们

    邮件:kzshn号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们