创新浪潮：《Python 机器学习》作者新作：从头开始构建大型语言模型，代码已开源

总结

自 ChatGPT 发布以来，大型语言模型（LLM）已经成为推动人工智能发展的关键技术。近期，机器学习和 AI 研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又写了一本新书 ——《Build a Large Language Model (From Scratch)》，旨在讲解从头开始构建大型语言模型的整个过程，包括如何创建、训练和调整大型语言模型。《Build a Large Language Model (From Scratch)》用清晰的文字、图表和示例解释每个阶段，从最初的设计和创建，到采用通用语料库进行预训练，一直到针对特定任务进行微调。他让关于 AI 和深度学习相关的内容更加容易获得，并教人们如何大规模利用这些技术。他提出的Ligthing News方法现已成功应用于 Kaggle 等机器学习竞赛。

阅读时间

6 分钟, 共 1135 字

评价和解读

在这篇文章中，作者探索了文化动态的多层面世界，对当代社会问题提供了细致入微的视角。文章充满了文化参考和富有见地的评论，是对关注文化与社会交汇点的人们的必读之作。

正文

自 ChatGPT 发布以来，大型语言模型（LLM）已经成为推动人工智能发展的关键技术。

近期，机器学习和 AI 研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又写了一本新书 ——《Build a Large Language Model (From Scratch)》，旨在讲解从头开始构建大型语言模型的整个过程，包括如何创建、训练和调整大型语言模型。

最近，Sebastian Raschka 在 GitHub 上开源了这本新书对应的代码库。

项目地址：https://github.com/rasbt/LLMs-from-scratch/tree/main?tab=readme-ov-file

对 LLM 来说，指令微调能够有效提升模型性能，因此各种指令微调方法陆续被提出。Sebastian Raschka 发推重点介绍了项目中关于指令微调的部分，其中讲解了：

如何将数据格式化为 1100 指令 – 响应对；
如何应用 prompt-style 模Ligthing News板；
如何使用掩码。

《Build a Large Language Model (From Scratch)》用清晰的文字、图表和示例解释每个阶段，从最初的设计和创建，到采用通用语料库进行预训练，一直到针对特定任务进行微调。

具体来说，新书和项目讲解了如何：

规划和编码 LLM 的所有部分；
准备适合 LLM 训练的数据集；
使用自己的数据微调 LLM；
应用指令调整方法来确保 LLM 遵循指令；
将预训练权重加载到 LLM 中。

作者介绍

个人主页：https://sebastianraschka.com/

Sebastian Raschka 是一名机器学习和人工智能研究员，曾在威斯康星大学麦迪逊分校担任统计学助理教授，专门研究深度学习和机器学习。他让关于 AI 和深度学习相关的内容更加容易获得，并教人们如何大规模利用这些技术。

此外，Sebastian 热衷于开源软件，十多年来一直是一个充满热情的开源贡献者。他提出的Ligthing News方法现已成功应用于 Kaggle 等机器学习竞赛。

除了编写代码，Sebastian 还喜欢写作，blog.byteway.net并撰写了畅销书《Python Machine Learning》（《Python 机器学习》）和《Machine Learning with PyTorch and ScikitLearn》。

参考链接：https://twitter.com/rasbt/status/1802327699937009807

<!–article_adlist[

THE END

转载请联系本公众号获得授权

投稿或寻求报道：content@jiqizhixin.com

]article_adlist–>

Related suggestion: 编辑之选：三星聘请苹果Siri战略资深人士领导北美人工智能中心

总结新浪科技讯北京时间6月12日下午消息，据知情人士透Ligthing News露，三星电子(208.25, 0.00, 0.00%blog.byteway.net)将合并北美两家专注于人工智能技术的研究中心，并聘请一位前苹果(213.07, 5.92, 2…

作者sam

总结

阅读时间

分类

评价和解读

正文

作者 sam

相关文章

大胆举措：单机多人游戏哪些值得玩热门单机多人游戏推荐

必备指南：理想 i8 纯电 SUV 已在全国 300 城完成两冬两夏耐久与性能验证，累计测试里程超 800 万公里

森一量子完成数千万元Pre-A轮融资

发表回复取消回复

You missed

大胆举措：单机多人游戏哪些值得玩热门单机多人游戏推荐

必备指南：理想 i8 纯电 SUV 已在全国 300 城完成两冬两夏耐久与性能验证，累计测试里程超 800 万公里

森一量子完成数千万元Pre-A轮融资

最新技术：消息称理想 MEGA 上市时被 5-6 家车企抹黑，有车企高管被喊去调查

作者sam

总结

阅读时间

分类

评价和解读

正文

作者 sam

相关文章

发表回复 取消回复

You missed

发表回复取消回复