Mixtral-MOE工业落地1-AutoDL平台使用和专家模型训练

NLP小讲堂 2024-03-09 20:41:54

课时名称	课时知识点
Mixtral-MOE工业落地1-AutoDL平台使用和专家模型训练	Mixtral-MOE工业落地1-AutoDL平台使用和专家模型训练1

...全文

48 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

LLaMA Factory 是一个简单易用且高效的大型语言模型（Large Language Model）训练与微调平台。通过 LLaMA Factory，可以在无需编写任何代码的前提下，在本地完成上百种预训练模型的微调，框架特性包括：模型种类：LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi 等等。

很多小伙伴想在本地进行尝试微调，但是因为代码能力有限以及对微调过程中的各种知识了解不够深入，遇到了各种问题。因此很多小伙伴求助我能不能出一期零代码、纯本地微调的教程。所以今天这一期，我们来使用目前最热门的本地微调工具：`LLaMA Factory` 配合 `Easy DataSet `一站式完成从数据集准备到模型微调的全流程。另外为了帮助大家更好的学习理解，在这个系列的课程中，我也会穿插讲解一些大模型的基础理论，所以这个教程比较长，我们将拆分成几个部分来讲解，课程大纲如下：

LLaMA Factory 是一个简单易用且高效的大型语言模型（Large Language Model）训练与微调平台。

本报告综合LLM大模型微调领域的技术演进趋势与实践案例，系统梳理微调基础理论、技术方法、数据工程、训练策略、评估体系、行业应用、伦理安全及工具链等核心内容，构建从技术原理到落地实践的完整分析框架。报告以参数高效微调、数据工程、伦理安全为三大核心板块，其中参数高效微调技术（如LoRA、QLoRA、AdaLoRA等）通过冻结预训练模型大部分参数，仅微调少量适配器参数，显著降低计算资源需求；数据工程聚焦数据质量标准（去重、降噪、领域聚焦）、预处理流程（对话模板构建、多语言数据增强）及隐私保护机制；

LLaMA Factory 是一个简单易用且高效的大型语言模型（Large Language Model）训练与微调平台。通过 LLaMA Factory，可以在无需编写任何代码的前提下，在本地完成上百种预训练模型的微调

张岳升的课程社区_NO_1

1

社区成员

99

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章