收起左侧
发新帖

DeepSeek"自言自语"式思考为何让美国公司争相效仿

时间:2025-2-11 09:20 0 76 | 复制链接 |

马上注册,结交更多好友

您需要 登录 才可以下载或查看,没有账号?立即注册

x
2月10日消息,中国人工智能初创公司DeepSeek近期超越ChatGPT,登顶应用商店人工智能应用榜首。其成功的一大关键在于引入了AI领域的最新热门创意——一款在回答用户问题前会“思考”的聊天机器人。
DeepSeek的“深度思考”(DeepThink)模式在回答每个问题前都会显示“思考中……”的提示,随后生成一连串的推理过程,仿佛在与自己对话,最终得出答案。这些“自言自语”的思考过程还带有类似“等等”“嗯”“啊哈”这样的口语化表达,增强了对人类思维方式的模拟。
这一模式的推出迅速引发热潮,美国AI公司也在争相效仿,试图超越DeepSeek。这种“推理式”AI助手在某些任务上的确更准确,但它们的类人化思考过程也可能掩盖自身的局限性。
AI的“自言自语”推理技术(又称“思维链”(Chain of Thought)推理),在2023年底成为人工智能领域的新趋势。当时,OpenAI和谷歌推出的AI工具,在解决数学和编程问题时通过逐步推理获得了更高的测试成绩。
然而,这一新型AI助手起初并未向大众开放。OpenAI于2023年12月发布了o1系统,每月收费200美元,并未公开其内部推理机制。而DeepSeek的“思考”应用不仅免费提供,还开放了其背后的R1推理模型,这在开发者群体中引发了极大的关注和讨论。
艾伦人工智能研究所(AI2)研究员内森·兰伯特(Nathan Lambert)表示:“人们迫不及待地想将这种新方法应用到各种场景中。”
自DeepSeek崛起并导致美国科技股大跌的两周内,OpenAI迅速调整策略,在ChatGPT中免费开放部分推理技术,并推出了基于该技术的新工具“深度研究”(Deep Research),该工具能够通过网络搜索自动撰写报告。
与此同时,谷歌也不甘落后,于上周宣布其竞争产品“Gemini 2.0 Flash Thinking Experimental”正式面向消费者开放,并通过其AI应用Gemini免费提供。
亚马逊的云计算部门AWS则宣布,正大力投资“自动推理(Automated Reasoning)”技术,以增强用户信任。
OpenAI随后调整了ChatGPT的界面,使其也能向用户展示类似DeepSeek的“思维链”推理过程。
AI公司Anthropic的首席执行官达里奥·阿莫代伊(Dario Amodei)在一篇关于DeepSeek亮相对中美AI竞争影响的文章中预测,美国科技企业很快将投入数亿至数十亿美元,推动AI推理技术的升级。
科技行业希望,这一技术不仅能提升数学和编程能力,还能拓展至更广泛的领域,打造更接近人类思维方式的通用人工智能(AGI)。
OpenAI首席执行官山姆·奥特曼(Sam Altman)在上月的博客文章中表示:“我们现在有信心知道如何构建AGI(通用人工智能)。”
谷歌Gemini副总裁萧茜茜(Sissie Hsiao)也表示,推理模型代表了一种AI发展的范式转变。她指出:“推理模型揭开了生成式人工智能的神秘面纱——通过展示其‘思考过程’,使其更加透明、可信,同时也能更好地完成复杂任务。”
OpenAI发言人尼科·费利克斯(Niko Felix)则表示:“我们希望让更多用户了解推理模型的能力及其运作方式,以创造更优质的产品。用户反馈表明,理解AI如何推理生成答案,不仅有助于更明智的决策,也能增强对AI回答的信任。”
“撞墙”
硅谷对推理技术的热衷,源于对大语言模型下一次突破的追求。这类技术正是ChatGPT及同类人工智能产品的核心驱动力。
过去,OpenAI的成功推动了整个科技行业围绕一个简单的范式达成共识:向更庞大的人工智能模型投入更多数据和计算能力,以提升其智能水平。然而,近年来,这一公式的效果开始趋于停滞。
大语言模型在数学、科学和逻辑等行业基准测试中的提升速度不再像过去那样迅猛,而互联网上可用于训练的公开数据也基本被挖掘殆尽。
面对这一挑战,谷歌、OpenAI 和Anthropic 等公司开始转向优化现有人工智能模型,以进一步挖掘其潜能。
一个备受关注的方法是“思维链”(Chain of Thought)技术,它让人工智能在回答问题时,将问题拆解成多个逻辑步骤,而非直接生成最终答案。这一技术也是 DeepSeek 等公司所采用的推理方法的一部分,其核心思路是让模型花费更多时间和计算资源来推理,从而提高回答的准确性。
这一策略已被证明是有效的,尤其是在结合“强化学习”技术后,人工智能的推理能力得到了进一步提升。强化学习通过在大量试错过程中奖励正确答案,引导人工智能系统不断优化自身行为,这也是计算机能够掌握围棋等复杂游戏的关键。
这一方法特别适用于数学、逻辑和编程等领域,因为计算机可以验证最终答案的正确性。然而,仍然缺乏关于人类如何通过推理解决问题的数据支持。
起初,研究人员尝试雇用人工标注员,记录他们在回答问题时的推理过程。但这一方法既缓慢又成本高昂,难以大规模推广。
随着人工智能技术的进步,研究人员发现,AI 现在可以自己生成大量类似人类推理过程的“思维链”示例。经过不断优化,研究人员逐步减少了对人工干预的依赖,实现了 AI 自主推理的突破。
DeepSeek 在今年1月发布的技术报告中表示,其早期推理模型 R1-Zero 仅通过增加试错轮次,便能够自动形成更长的“思维链”,而无需特别创建额外数据。
艾伦人工智能研究所的研究员内森·兰伯特表示:“实际上,你是在搭建一个沙盒,让模型在其中自行调整行为。”
尽管人工智能在推理技术上的突破引发了广泛热议,但一些专家认为,公众的热情可能掩盖了对其局限性的深入探讨。
亚利桑那州立大学计算机科学教授苏巴拉奥·坎巴姆帕蒂(Subbarao Kambhampati)指出,目前仍无法确定“思维链”是否真正反映了人工智能系统的信息处理方式。
他的研究表明,在面对实际应用场景,如规划与调度任务时,人工智能模型的推理能力可能会崩溃。此外,当前实验室在训练这些模型时,往往更关注最终答案的准确性,而非推理过程的合理性,使得推理质量难以量化。
以 DeepSeek 的 R1模型为例,其技术论文指出,在早期版本中,当“思维链”同时包含中文和英文时,模型生成的最终答案更准确。然而,研究人员最终选择了一个全英文的自言自语模型,仅仅因为用户更偏好这种呈现方式。
对此,坎巴姆帕蒂教授表示,企业应该让人工智能按照最能提高答案准确性的方式“自言自语”,而不是刻意优化“思维链”以迎合人类用户。他强调:“摆脱这种拟人化的处理方式更为重要,因为它并不会影响模型的实际能力。”
然而,人工智能行业的发展方向似乎正与这一观点相悖。自 DeepSeek 崛起以来,硅谷的多个推理模型都采用了类似设计,鼓励用户相信 AI 的“思维过程”类似于人类推理。
在 ChatGPT 的主页上,“推理”模式按钮被放置在聊天框的显眼位置。奥特曼在社交媒体上表示,“思维链”功能让 AI 能够“展示其思考过程”。
研究实验室 Cohere for AI 负责人萨拉·胡克(Sara Hooker)指出,对于普通用户而言,这种设计让他们感觉自己正在“洞察算法的运作方式”。但实际上,这种“自言自语”并非真正的透明度,而是优化 AI 性能的一种手段。
宾夕法尼亚大学沃顿商学院的人工智能研究教授伊桑·莫利克(Ethan Mollick)补充道,这种 AI 展示“内心独白”的方式可能会引发用户的情感共鸣。他认为,相较于 ChatGPT 稳重平淡的回答风格,DeepSeek R1则显得“极度友好,甚至迫切希望取悦用户”。
他进一步指出:“如今,我们正在见证一个奇怪的现象——硬核计算机科学与市场营销正在融合,甚至连开发者们自己可能都难以区分两者的界限。”(小小)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

扫码添加微信客服
快速回复 返回列表 返回顶部