前些天在咖啡馆听见两个程序员吵架,一个说:“现在的AI就像我那个永远不带草稿纸的侄子!“另一个拍桌:“所以要用CoT啊!“我差点把拿铁喷在MacBook上——这年头连AI都要带草稿纸了?
后来才知道,他们说的”草稿纸”就是最近让DeepSeek-R1爆火的思维链(Chain-of- Thought)。这玩意儿有多重要?打个比方,就像给数学天才配了个随身纠错本,让AI从”直接报答案的赌气学霸”变成”边写步骤边嘀咕的靠谱课代表”。
去年我测试某AI写菜谱,让它设计道”不用烤箱的生日蛋糕”。结果收到份《微波炉水泥制作指南》:饼干碎拌黄油叫”大地基岩层”,酸奶混吉利丁称”云朵冻土层”。最后温馨提示:“冷藏后硬度可达莫氏3.5级,建议搭配角磨机食用。”
现在用上CoT的AI完全是另一个物种。让它写同款菜谱,你能看见”思维草稿”在滚动:
1. 确认核心需求:无烤箱、有庆生属性
2. 解构传统蛋糕:替代烘烤→冷藏成型
3. 规避常见翻车点:慕斯易塌→加芒果增稠
4. 增加仪式感方案:奥利奥碎当”蜡烛底座”
5. 安全警告:提醒吉利丁用量,避免做成果冻锤
整个过程像看老师傅带徒弟,每个决策都有来龙去脉。最妙的是当你说”家里没有吉利丁”,它不会摆烂,而是顺着思维链回溯到第三步,给出Plan B:“可以用15g寒天粉替代,但凝固时间需缩短1/3”。
这种”可追溯的思考”正在改变游戏规则。
CoT究竟是什么?
“transformer”、“马尔可夫链”、“熵值”等专业术语你可能不懂,但没关系,我用日常生活中的例子来类比这些概念。
CoT如何帮助模型一步步思考,就像人解决复杂问题时的过程。比如,做数学题时先分解步骤,再逐步解决。
我举个做饭的例子来解释,保证你秒懂!
假设你要教一个特别聪明的厨房小白做红烧肉,有两种教法:
传统方法(非CoT):
直接把菜谱给他:“五花肉500克,老抽2勺,冰糖10颗…小火炖40分钟”
结果可能:他手忙脚乱,要么糖放多了,要么火候不对
CoT方法(思维链):
-
第一步:先教他判断肉质
”你看这块肉,肥瘦有几层?三层均匀的才是好五花肉” -
第二步:解释原理
”为什么要先焯水?是为了去掉血沫和腥味,就像洗澡要先冲水再打肥皂” -
第三步:分阶段指导
”现在闻到焦糖香了吗?这时候要马上倒热水,不然糖会发苦” -
第四步:实时纠错
”汤汁收得太快?可能火太大了,先关小火,加点黄酒补救”
这样教出来的效果:
- 小白不仅会做红烧肉,还能举一反三做东坡肉
- 遇到突发状况(比如烧焦了)知道怎么调整
- 下次自学糖醋排骨也能摸到门道
这就是CoT的厉害之处:
- 像剥洋葱一样把复杂问题拆解成步骤
- 每个步骤都告诉你”为什么这么做”
- 能中途自我检查(“这里是不是有焦味?”)
- 最终不仅得到答案,还掌握了解决问题的方法
现在很多AI客服答非所问,就是因为缺少这种”分步骤想清楚”的能力。用了CoT之后,AI就像有个虚拟的草稿纸,会把思考过程写在”心里”,比如:
用户问:"明天上海飞东京的航班几点便宜?"
AI内心活动:
1. 先确定用户出发日期是明天
2. 检查东京有羽田和成田两个机场
3. 查找各航空公司价格
4. 发现早班机便宜但需要凌晨打车
5. 建议:"春秋航空9:15浦东飞羽田的航班最优惠,但需注意成田机场离市区较远"
本文就到这里。