从零构建大模型在线阅读
会员

从零构建大模型

(美)塞巴斯蒂安·拉施卡
开会员,本书免费读 >

计算机网络人工智能13.8万字

更新时间:2025-05-07 11:44:47 最新章节:看完了

立即阅读
加书架
下载
听书

书籍简介

本书是关于如何从零开始构建大模型的指南,由畅销书作家塞巴斯蒂安·拉施卡撰写,通过清晰的文字、图表和实例,逐步指导读者创建自己的大模型。在本书中,读者将学习如何规划和编写大模型的各个组成部分、为大模型训练准备适当的数据集、进行通用语料库的预训练,以及定制特定任务的微调。此外,本书还将探讨如何利用人工反馈确保大模型遵循指令,以及如何将预训练权重加载到大模型中。
品牌:人邮图书
译者:覃立波 冯骁骋 刘乾
上架时间:2025-04-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

(美)塞巴斯蒂安·拉施卡
主页

最新上架

  • 会员
    近年来,在自然语言处理领域,基于预训练语言模型的方法已形成全新范式。本书内容分为基础知识、预训练语言模型,以及实践与应用3个部分,共9章。第一部分全面、系统地介绍自然语言处理、神经网络和预训练语言模型的相关知识。第二部分介绍几种具有代表性的预训练语言模型的原理和机制(涉及注意力机制和Transformer模型),包括BERT及其变种,以及近年来发展迅猛的GPT和提示工程。第三部分介绍了基于Lang
    徐双双编著计算机12.7万字
  • 会员
    本书以第一人称视角,讲述AI的来龙去脉,表达AI的技术原理。从历史到未来,跨越百年时空;从理论到实践,解读AI大爆炸;从技术到哲学,穿越多个维度;从语言到绘画,落地实战演练。ChatGPT的诞生,引发了奇点降临,点亮了AGI(通用人工智能),并涉及大模型、深度神经网络、Transformer、AIGC、涌现效应等一系列技术前沿。
    量子学派@ChatGPT计算机8.6万字
  • 本书分两篇,为读者提供基于制造业视角的大模型理论与应用指南。基础篇深入大模型理论层面,主要介绍大模型的基础知识、构建路径、价值对齐策略,同时涉及多模态与AIGC技术、提示词工程的相关知识。应用篇则聚焦于大模型的实践应用层面,主要讲解垂直制造领域微调、RAG等构建技术,AIAgent的原理与应用,以及大模型压缩与部署策略,并且通过具体案例来展示大模型在工业制造及设备运维等方面的应用,最后对大模型进行
    郭秉义计算机18.3万字
  • 会员
    本书围绕“公平、隐私与保障、可靠与安全、包容、负责、透明”六个人工智能需要遵循的原则,诠释当代青少年对负责任的人工智能的认识和思考。
    王岭主编计算机7.1万字
  • 会员
    本书从技术和规制两个角度入手,以人工智能治理的法律、公共政策以及伦理规范等相关社会行为和社会关系的规则建立和运行为主要思考方向和研究进路,在梳理人工智能发展情况、欧盟及其他国家人工智能立法与政策发布现状的基础上,对人工智能治理的基础、基本路径及我国人工智能产业、政策与规制思路进行了全面和有益的探索。
    杨晓雷主编计算机23.9万字
  • 会员
    本书内容从技能线和工具线展开介绍。其中,技能线介绍了虚拟数字人的技术原理、商业价值、创建工具等基础内容,以及AI文案、AI绘画、虚拟数字人及其直播、AI视频博主、AI带货主播、AI培训讲师等实操案例。工具线介绍了ChatGPT、StableDiffusion、腾讯智影、剪映等工具的使用方法,并通过实例介绍了使用这些工具制作数字人的技巧。
    木白编著计算机7.1万字
  • 会员
    DeepSeek是一种基于Transformer架构的生成式AI(ArtificialIntelligence)大模型,融合了MoE架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型DeepSeek-V3的核心技术及其在实际开发中的深度应用。全书分三部分共12章,涵盖理论解析、技术实现和应用实践。本书通过深度讲解与实用案例相结合
    未来智能实验室 代晶编著计算机17.1万字
  • 会员
    青少年人工智能编程水平测试涵盖从数学逻辑到计算思维、从拖曳程序模块到程序编写、从数学建模到算法设计等多学科知识,能够对学生的多学科知识综合运用能力做出评价;能够通过设计的具体解决方案,对学生的计算思维、创造性思维等能力做出评价;在具体的解决方案中,能够通过设计算法模型和实现算法,对学生掌握和运用编程的能力做出评价。本书结合生活中的实例,系统地介绍了不同进制之间的转换、函数参数的作用域、枚举算法、二
    陈杰编著计算机2万字
  • 会员
    本书分为4章,共20章。其中第1篇为基础算法篇,从第1章到第9章,讲述排序、查找、线性结构、树、散列、图、堆栈等基本数据结构算法;第2篇为机器学习算法篇,从第10章到第14章,讲述分类算法、回归算法、聚类算法、降维算法和集成学习算法;第3篇为强化学习算法篇,从第15章到第16章,讲述基于价值的强化学习算法和基于策略的强化学习算法;第4篇为深度学习算法篇,从第17章到第19章,讲述神经网络模型算法、
    唐宇迪 史卫亚 罗召勇 李琳 侯惠芳编著计算机0字