| 暂存书架(0) | 登录

首记录 上一条 1 / 13 下一条 尾记录 MARC状态:审校 文献类型:中文图书 浏览次数:21

题名/责任者:
深度剖析DeepSeek大模型:原理、开发与优化部署/丁小晶, 崔远编著
出版发行项:
北京:机械工业出版社,2025.04
ISBN及定价:
978-7-111-77922-3/CNY119.00
载体形态项:
XII, 312页:图;24cm
丛编项:
AIGC与大模型技术丛书
个人责任者:
丁小晶 编著
个人责任者:
崔远 编著
学科主题:
人工智能
中图法分类号:
TP18
一般附注:
机工IT
责任者附注:
丁小晶, 资深大模型AI应用技术专家与管理者, 拥有超过15年的计算机及A1领域经验、5年团队管理经验的技术创新与项目管理复合型人才, 精通大模型技术及多语言编程, 致力于AI大模型的应用和创新。崔远, 毕业于兰州大学, 副教授, 主攻人工智能 (Al)、自然语言处理 (NLP) 和深度学习等计算机前沿技术, 并致力于教学研究, 承担多门专业核心课程的教学工作。曾获公派赴佐治亚理工学院 (GT) 和不列颠哥伦比亚大学 (UBC) 深造。主持市厅级课题3项, 发表专业论文8篇及专著1部。多次荣获校级“优秀教师”称号及“教学优秀奖”, 在学术和教育领域均取得显著成就。
提要文摘附注:
本书共分为12章, 首先介绍大模型的基础知识与发展历程, 从神经网络的起源到大规模预训练模型的演化, 再到Transformer、BERT与GPT等模型架构的深入剖析, 帮助读者理解大模型的技术基石。其次详细解析了DeepSeek-R1及其Zero版本在强化学习与模型架构上的核心技术, 包括混合专家模型、动态学习率调度、分布式训练及高效推理优化策略等。再次聚焦于模型训练与开发实践, 介绍API调用、上下文拼接、模型微调、知识蒸馏等关键技术, 并结合DeepSeek实际案例展示其在数学推理、代码生成等领域的应用。最后着重探讨了大模型在商业化落地场景中的高级应用, 如FIM补全、多轮对话、业务代码自动化生成以及基于云部署的智能推荐搜索系统等。
全部MARC细节信息>>
索书号 条码号 年卷期 校区—馆藏地 书刊状态 还书位置
TP18/308 B00861561   西校区—自然书库(西校区)     可借 自然书库(西校区)
TP18/308 B00861562   西校区—自然书库(西校区)     可借 自然书库(西校区)
显示全部馆藏信息
借阅趋势

同名作者的其他著作(点击查看)
-->
姓名:
手机号:
送 书 地:
收藏到: 管理书架