ISBN/价格: | 978-7-111-73956-2:CNY99.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | ChatGPT原理与架构/.程戈著 |
出版发行项: | 北京:,机械工业出版社:,2024.05 |
载体形态项: | 210页:;+图:;+24cm |
丛编项: | 智能系统与技术丛书 |
一般附注: | CMP BOOKS |
提要文摘: | 本书共分11章内容:第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2-5章讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制描述了GPT系列的架构演进;第6-8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9-10章首先讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。 |
题名主题: | 人工智能 应用 自然语言处理 软件工具 |
中图分类: | TP391 |
个人名称等同: | 程戈 著 |
记录来源: | CN JCXA 20240910 |