跳到正文
Qimuai Blog
AI模型

大白话解释DeepSeekR1究竟厉害在什么地方

齐木 · · 约 4 分钟 · 1076 字

前些天在咖啡馆听见两个程序员吵架,一个说:“现在的AI就像我那个永远不带草稿纸的侄子!“另一个拍桌:“所以要用CoT啊!“我差点把拿铁喷在MacBook上——这年头连AI都要带草稿纸了?

后来才知道,他们说的”草稿纸”就是最近让DeepSeek-R1爆火的思维链(Chain-of- Thought)。这玩意儿有多重要?打个比方,就像给数学天才配了个随身纠错本,让AI从”直接报答案的赌气学霸”变成”边写步骤边嘀咕的靠谱课代表”。

去年我测试某AI写菜谱,让它设计道”不用烤箱的生日蛋糕”。结果收到份《微波炉水泥制作指南》:饼干碎拌黄油叫”大地基岩层”,酸奶混吉利丁称”云朵冻土层”。最后温馨提示:“冷藏后硬度可达莫氏3.5级,建议搭配角磨机食用。”

现在用上CoT的AI完全是另一个物种。让它写同款菜谱,你能看见”思维草稿”在滚动: 1. 确认核心需求:无烤箱、有庆生属性
2. 解构传统蛋糕:替代烘烤→冷藏成型
3. 规避常见翻车点:慕斯易塌→加芒果增稠
4. 增加仪式感方案:奥利奥碎当”蜡烛底座”
5. 安全警告:提醒吉利丁用量,避免做成果冻锤

整个过程像看老师傅带徒弟,每个决策都有来龙去脉。最妙的是当你说”家里没有吉利丁”,它不会摆烂,而是顺着思维链回溯到第三步,给出Plan B:“可以用15g寒天粉替代,但凝固时间需缩短1/3”。

这种”可追溯的思考”正在改变游戏规则。

CoT究竟是什么?

“transformer”、“马尔可夫链”、“熵值”等专业术语你可能不懂,但没关系,我用日常生活中的例子来类比这些概念。

CoT如何帮助模型一步步思考,就像人解决复杂问题时的过程。比如,做数学题时先分解步骤,再逐步解决。

我举个做饭的例子来解释,保证你秒懂!

假设你要教一个特别聪明的厨房小白做红烧肉,有两种教法:

传统方法(非CoT):
直接把菜谱给他:“五花肉500克,老抽2勺,冰糖10颗…小火炖40分钟”
结果可能:他手忙脚乱,要么糖放多了,要么火候不对

CoT方法(思维链):

  1. 第一步:先教他判断肉质
    ”你看这块肉,肥瘦有几层?三层均匀的才是好五花肉”

  2. 第二步:解释原理
    ”为什么要先焯水?是为了去掉血沫和腥味,就像洗澡要先冲水再打肥皂”

  3. 第三步:分阶段指导
    ”现在闻到焦糖香了吗?这时候要马上倒热水,不然糖会发苦”

  4. 第四步:实时纠错
    ”汤汁收得太快?可能火太大了,先关小火,加点黄酒补救”

这样教出来的效果:

  • 小白不仅会做红烧肉,还能举一反三做东坡肉
  • 遇到突发状况(比如烧焦了)知道怎么调整
  • 下次自学糖醋排骨也能摸到门道

这就是CoT的厉害之处:

  1. 像剥洋葱一样把复杂问题拆解成步骤
  2. 每个步骤都告诉你”为什么这么做”
  3. 能中途自我检查(“这里是不是有焦味?”)
  4. 最终不仅得到答案,还掌握了解决问题的方法

现在很多AI客服答非所问,就是因为缺少这种”分步骤想清楚”的能力。用了CoT之后,AI就像有个虚拟的草稿纸,会把思考过程写在”心里”,比如:

用户问:"明天上海飞东京的航班几点便宜?"
AI内心活动:
1. 先确定用户出发日期是明天
2. 检查东京有羽田和成田两个机场
3. 查找各航空公司价格
4. 发现早班机便宜但需要凌晨打车
5. 建议:"春秋航空9:15浦东飞羽田的航班最优惠,但需注意成田机场离市区较远"

本文就到这里。

同标签继续读

回到首页
评论加载中...

当前文章已关联到 Discussion #29