无锡城市职业技术学院图书馆书目检索系统

| 暂存书架(0) | 登录

MARC状态:订购  文献类型:中文图书 浏览次数:13 

题名/责任者:
从零构建大模型:算法、训练与微调/梁楠著
出版发行项:
北京:清华大学出版社,2025.4
ISBN及定价:
978-7-302-68561-6/CNY99.00
载体形态项:
296页;24cm
其它题名:
算法、训练与微调
个人责任者:
梁楠
学科主题:
人工智能
中图法分类号:
TP18
提要文摘附注:
本书共12章, 涵盖了Transformer模型的基础理论, 如Seq2Seq模型、分词、嵌入层和自注意力机制等关键概念; 并深入剖析了GPT模型的核心实现与文本生成过程, 以及BERT模型的预训练和微调技术。同时, 也对ViT (视觉Transformer) 模型的架构、训练方法, 以及高阶微调策略如AdapterTuning和P-Tuning进行了详尽讲解。此外, 还系统地介绍了数据处理、数据增强、模型性能优化( 包括混合精度训练和分布式训练) 、对比学习、对抗训练、自适应优化器、动态学习率调度, 以及模型蒸馏与剪枝技术等多个方面。
使用对象附注:
本书特别适合希望系统掌握大模型构建、训练和优化的技术人员和研究者, 也适合对自然语言处理、计算机视觉等领域的大模型开发有兴趣的学习者
全部MARC细节信息>>
此书刊没有复本
此书刊可能正在订购中或者处理中
显示全部馆藏信息
借阅趋势

您可能感兴趣的图书(点击查看)
同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架