NLP杂货店
RoPE旋转编码已经成为大模型的基础建设…
继续预训练不可避免会遇到灾难遗忘问题,以…
MoE模型已经成为大模型不可或缺的一环。…
本项目来源:从头预训练一只超迷你 LLa…
大模型的生成策略有常见的以下几种: 贪婪…
本文根据nanoGPT的思路,使用Ope…
1 简介 LMDeploy 由 MMDe…
NLP领域不同于传统的机器学习领域拥有非…
LLaMA架构的设计可以说是引领了整个开…
目前来说主流的RLHF方向分为两大类: …