大模型基础（四）：强化学习入门-从斯金纳箱到大模型推理 - wenha

Wait 5 sec.

【摘要】2025年图灵奖颁给了强化学习的奠基人Richard Sutton和Andrew Barto。为什么强化学习如此重要？它如何从训练老鼠变成训练大模型？这篇文章带你一探究竟。一、一个老鼠实验引发的革命 1.1 斯金纳箱：强化学习的源头 1930年代，心理学家斯金纳做了一个著名实验：实验过程：把一阅读全文