微调LLM前你需要了解的一些概念 - royalrover

Wait 5 sec.

【摘要】1. LLM 到底在做什么大语言模型的核心任务很朴素：给定前面的 token，预测下一个 token。例如输入：法国的首都是模型要预测：巴黎训练时，模型会不断看到类似样本：输入：法国的首都是目标：巴黎如果模型给“巴黎”的概率高，loss 就小；如果模型把“伦敦”预测得阅读全文