打开网易新闻 查看精彩图片

介绍

从零构建大模型是一本基于PyTorch框架的实战指南,摒弃了对现成库的依赖,引导读者从零开始亲手构建功能强大的大语言模型。本书由畅销书作家塞巴斯蒂安·拉施卡撰写,从基础知识讲起,由内而外地剖析大模型核心原理,并通过清晰的文字、图表和实例,系统讲解模型各组成部分的规划与实现、数据集的准备、通用语料预训练及任务定制微调的全过程。

书中不仅详细阐述了如何利用人工反馈确保模型遵循指令、加载预训练权重等关键技术,还特别设置了DeepSeek彩蛋章节,深入解析推理模型的构建与优化策略。通过理论与实践的结合,本书旨在帮助读者在掌握LLM理论知识的同时,获得从零打造大模型的完整实战能力。

目录

第1章:理解大型语言模型

第2章:处理文本数据

第3章:编码注意力机制

第4章:从零开始实现 GPT 模型

第5章:在无标注数据上进行预训练

第6章:进行文本分类的微调

第7章:进行遵循指令的微调

扫码回复“大模型神书”

如果你想写大模型论文,但却没有合适的idea,我收集整理了来自QS前50名校大佬的大模型研究思路!这些idea都是从顶会论文中提炼出来的精华,冲刺CVPR/NIPS也不在话下!

打开网易新闻 查看精彩图片

领取福利

科研资料大放送:

1.《申博咨询规划一次》

2.《1000+热门idea合集》

3.《往期大牛热点分析直播课》

4.《全方向顶会顶刊论文合集》

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

扫码免费领取科研大礼包