手撕 Transformer (5):模型构建 - 茴香豆的茴

Wait 5 sec.

【摘要】前置知识:嵌入层和位置编码、编码器的实现、解码器和输出部分的实现。 之前的文章已经把构建 Transformer 所需的所有组件构建完了,这篇文章开始构建整个编码器-解码器结构。 1 编码器-解码器的代码实现 class EncoderDecoder(nn.Module): def __init__ 阅读全文