零基础认识大语言模型(LLM)工作原理(4.Attention:模型是怎么看懂上下文的?) - GuZhenYin

Wait 5 sec.

【摘要】第四章 Attention(注意力机制):模型是如何“看懂上下文”的? 最近正好有空,打算抽时间复盘总结一下这些年零零散散学习的AI知识. 下面是目录 零基础认识大语言模型(LLM)工作原理目录 - GuZhenYin - 博客园 在上一章中,我们知道 Transformer 做了三件事: 把文字变 阅读全文