DeepSeek"自言自语"式思考为何让美国公司争相效仿

马上注册，结交更多好友

您需要登录才可以下载或查看，没有账号？立即注册

x

2月10日消息，中国人工智能初创公司DeepSeek近期超越ChatGPT，登顶应用商店人工智能应用榜首。其成功的一大关键在于引入了AI领域的最新热门创意——一款在回答用户问题前会“思考”的聊天机器人。
DeepSeek的“深度思考”（DeepThink）模式在回答每个问题前都会显示“思考中……”的提示，随后生成一连串的推理过程，仿佛在与自己对话，最终得出答案。这些“自言自语”的思考过程还带有类似“等等”“嗯”“啊哈”这样的口语化表达，增强了对人类思维方式的模拟。
这一模式的推出迅速引发热潮，美国AI公司也在争相效仿，试图超越DeepSeek。这种“推理式”AI助手在某些任务上的确更准确，但它们的类人化思考过程也可能掩盖自身的局限性。
AI的“自言自语”推理技术（又称“思维链”（Chain of Thought）推理），在2023年底成为人工智能领域的新趋势。当时，OpenAI和谷歌推出的AI工具，在解决数学和编程问题时通过逐步推理获得了更高的测试成绩。
然而，这一新型AI助手起初并未向大众开放。OpenAI于2023年12月发布了o1系统，每月收费200美元，并未公开其内部推理机制。而DeepSeek的“思考”应用不仅免费提供，还开放了其背后的R1推理模型，这在开发者群体中引发了极大的关注和讨论。
艾伦人工智能研究所（AI2）研究员内森·兰伯特（Nathan Lambert）表示：“人们迫不及待地想将这种新方法应用到各种场景中。”
自DeepSeek崛起并导致美国科技股大跌的两周内，OpenAI迅速调整策略，在ChatGPT中免费开放部分推理技术，并推出了基于该技术的新工具“深度研究”（Deep Research），该工具能够通过网络搜索自动撰写报告。
与此同时，谷歌也不甘落后，于上周宣布其竞争产品“Gemini 2.0 Flash Thinking Experimental”正式面向消费者开放，并通过其AI应用Gemini免费提供。
亚马逊的云计算部门AWS则宣布，正大力投资“自动推理（Automated Reasoning）”技术，以增强用户信任。
OpenAI随后调整了ChatGPT的界面，使其也能向用户展示类似DeepSeek的“思维链”推理过程。
AI公司Anthropic的首席执行官达里奥·阿莫代伊（Dario Amodei）在一篇关于DeepSeek亮相对中美AI竞争影响的文章中预测，美国科技企业很快将投入数亿至数十亿美元，推动AI推理技术的升级。
科技行业希望，这一技术不仅能提升数学和编程能力，还能拓展至更广泛的领域，打造更接近人类思维方式的通用人工智能（AGI）。
OpenAI首席执行官山姆·奥特曼（Sam Altman）在上月的博客文章中表示：“我们现在有信心知道如何构建AGI（通用人工智能）。”
谷歌Gemini副总裁萧茜茜（Sissie Hsiao）也表示，推理模型代表了一种AI发展的范式转变。她指出：“推理模型揭开了生成式人工智能的神秘面纱——通过展示其‘思考过程’，使其更加透明、可信，同时也能更好地完成复杂任务。”
OpenAI发言人尼科·费利克斯（Niko Felix）则表示：“我们希望让更多用户了解推理模型的能力及其运作方式，以创造更优质的产品。用户反馈表明，理解AI如何推理生成答案，不仅有助于更明智的决策，也能增强对AI回答的信任。”
“撞墙”
硅谷对推理技术的热衷，源于对大语言模型下一次突破的追求。这类技术正是ChatGPT及同类人工智能产品的核心驱动力。
过去，OpenAI的成功推动了整个科技行业围绕一个简单的范式达成共识：向更庞大的人工智能模型投入更多数据和计算能力，以提升其智能水平。然而，近年来，这一公式的效果开始趋于停滞。
大语言模型在数学、科学和逻辑等行业基准测试中的提升速度不再像过去那样迅猛，而互联网上可用于训练的公开数据也基本被挖掘殆尽。
面对这一挑战，谷歌、OpenAI 和Anthropic 等公司开始转向优化现有人工智能模型，以进一步挖掘其潜能。
一个备受关注的方法是“思维链”（Chain of Thought）技术，它让人工智能在回答问题时，将问题拆解成多个逻辑步骤，而非直接生成最终答案。这一技术也是 DeepSeek 等公司所采用的推理方法的一部分，其核心思路是让模型花费更多时间和计算资源来推理，从而提高回答的准确性。
这一策略已被证明是有效的，尤其是在结合“强化学习”技术后，人工智能的推理能力得到了进一步提升。强化学习通过在大量试错过程中奖励正确答案，引导人工智能系统不断优化自身行为，这也是计算机能够掌握围棋等复杂游戏的关键。
这一方法特别适用于数学、逻辑和编程等领域，因为计算机可以验证最终答案的正确性。然而，仍然缺乏关于人类如何通过推理解决问题的数据支持。
起初，研究人员尝试雇用人工标注员，记录他们在回答问题时的推理过程。但这一方法既缓慢又成本高昂，难以大规模推广。
随着人工智能技术的进步，研究人员发现，AI 现在可以自己生成大量类似人类推理过程的“思维链”示例。经过不断优化，研究人员逐步减少了对人工干预的依赖，实现了 AI 自主推理的突破。
DeepSeek 在今年1月发布的技术报告中表示，其早期推理模型 R1-Zero 仅通过增加试错轮次，便能够自动形成更长的“思维链”，而无需特别创建额外数据。
艾伦人工智能研究所的研究员内森·兰伯特表示：“实际上，你是在搭建一个沙盒，让模型在其中自行调整行为。”
尽管人工智能在推理技术上的突破引发了广泛热议，但一些专家认为，公众的热情可能掩盖了对其局限性的深入探讨。
亚利桑那州立大学计算机科学教授苏巴拉奥·坎巴姆帕蒂（Subbarao Kambhampati）指出，目前仍无法确定“思维链”是否真正反映了人工智能系统的信息处理方式。
他的研究表明，在面对实际应用场景，如规划与调度任务时，人工智能模型的推理能力可能会崩溃。此外，当前实验室在训练这些模型时，往往更关注最终答案的准确性，而非推理过程的合理性，使得推理质量难以量化。
以 DeepSeek 的 R1模型为例，其技术论文指出，在早期版本中，当“思维链”同时包含中文和英文时，模型生成的最终答案更准确。然而，研究人员最终选择了一个全英文的自言自语模型，仅仅因为用户更偏好这种呈现方式。
对此，坎巴姆帕蒂教授表示，企业应该让人工智能按照最能提高答案准确性的方式“自言自语”，而不是刻意优化“思维链”以迎合人类用户。他强调：“摆脱这种拟人化的处理方式更为重要，因为它并不会影响模型的实际能力。”
然而，人工智能行业的发展方向似乎正与这一观点相悖。自 DeepSeek 崛起以来，硅谷的多个推理模型都采用了类似设计，鼓励用户相信 AI 的“思维过程”类似于人类推理。
在 ChatGPT 的主页上，“推理”模式按钮被放置在聊天框的显眼位置。奥特曼在社交媒体上表示，“思维链”功能让 AI 能够“展示其思考过程”。
研究实验室 Cohere for AI 负责人萨拉·胡克（Sara Hooker）指出，对于普通用户而言，这种设计让他们感觉自己正在“洞察算法的运作方式”。但实际上，这种“自言自语”并非真正的透明度，而是优化 AI 性能的一种手段。
宾夕法尼亚大学沃顿商学院的人工智能研究教授伊桑·莫利克（Ethan Mollick）补充道，这种 AI 展示“内心独白”的方式可能会引发用户的情感共鸣。他认为，相较于 ChatGPT 稳重平淡的回答风格，DeepSeek R1则显得“极度友好，甚至迫切希望取悦用户”。
他进一步指出：“如今，我们正在见证一个奇怪的现象——硬核计算机科学与市场营销正在融合，甚至连开发者们自己可能都难以区分两者的界限。”（小小）

菲龙网编辑部7

本文来自

科技新闻

菲龙网编辑部7发布过的帖子

DeepSeek"自言自语"式思考为何让美国公司争相效仿

马上注册，结交更多好友

浏览过的版块

站长推荐 /1