【新书】大语言模型如何工作？200页pdf

了解 GPT、Gemini 等大型语言模型的原理（通俗易懂）

《How Large Language Models Work》（大型语言模型的工作原理）将多年关于大型语言模型（LLMs）的专家研究成果，转化为一本可读性强、内容聚焦的入门读物，帮助你掌握这些令人惊叹的系统。书中清晰解释了 LLM 的工作机制，介绍了优化与微调方法，以及如何构建高效、可靠的 AI 应用流程和管道。

**你将在本书中学到：

如何测试与评估 LLM * 如何使用人类反馈、监督微调和检索增强生成（RAG）技术 * 如何降低错误输出、高风险失误和自动化偏差的风险 * 如何构建人机交互系统 * 如何将 LLM 与传统机器学习方法相结合

本书由 Booz Allen Hamilton 的顶尖机器学习研究人员撰写，包括研究员 Stella Biderman、AI/ML 研究总监 Drew Farris 和新兴 AI 研究总监 Edward Raff。他们用通俗易懂的语言，深入浅出地讲解了 LLM 和 GPT 技术的运作原理，适合所有读者阅读和理解。

技术背景介绍

大型语言模型为“人工智能”中的“I”（智能）赋予了实质含义。通过连接来自数十亿文档中的词语、概念与模式，LLM 能够生成类似人类的自然语言回应，这正是 ChatGPT、Claude 和 Deep-Seek 等工具令人惊艳的原因所在。在这本内容翔实又富有趣味的书中，来自 Booz Allen Hamilton 的全球顶尖机器学习研究人员将带你探讨 LLM 的基本原理、机遇与局限，并介绍如何将 AI 融入组织与应用中。

图书内容简介

《How Large Language Models Work》将带你深入了解 LLM 的内部运作机制，逐步揭示从自然语言提示到清晰文本生成的全过程。书中采用平实语言，讲解 LLM 的构建方式、错误成因，以及如何设计可靠的 AI 解决方案。同时你还将了解 LLM 的“思维方式”、如何构建基于 LLM 的智能体与问答系统，以及如何处理相关的伦理、法律与安全问题。

**书中内容包括：

如何定制 LLM 以满足具体应用需求 * 如何降低错误输出和偏差风险 * 破解 LLM 的常见误解 * LLM 在语言处理之外的更多能力

适读人群

无需具备机器学习或人工智能相关知识，初学者亦可放心阅读。

作者简介

Edward Raff 是 Booz Allen Hamilton 的新兴 AI 总监，领导该公司机器学习研究团队。他在医疗、自然语言处理、计算机视觉和网络安全等多个领域从事 AI/ML 基础研究，著有《Inside Deep Learning》。Raff 博士已在顶级 AI 会议发表超过 100 篇研究论文，是 Java Statistical Analysis Tool 库的作者，美国人工智能促进协会资深会员，曾两度担任“应用机器学习与信息技术大会”及“网络安全人工智能研讨会”主席。他的研究成果已被全球多个杀毒软件厂商采纳并部署。 Drew Farris 是一位资深软件开发者与技术顾问，专注于大规模分析、分布式计算与机器学习。曾在 TextWise 公司工作，开发结合自然语言处理、分类与可视化的文本管理与检索系统。他参与多个开源项目，包括 Apache Mahout、Lucene 和 Solr，并拥有雪城大学信息学院的信息资源管理硕士学位与计算机图形学学士学位。 Stella Biderman 是 Booz Allen Hamilton 的机器学习研究员，同时担任非营利研究机构 EleutherAI 的执行董事。她是开源人工智能的重要倡导者，参与训练了多个世界领先的开源 AI 模型。Biderman 拥有佐治亚理工学院计算机科学硕士学位，以及芝加哥大学的数学与哲学学士学位。

目录一览

大局观：LLM 是什么？ 1. 分词器：LLM 如何“看”世界 1. Transformer：输入如何变成输出 1. LLM 是如何学习的 1. 如何约束 LLM 的行为 1. 超越自然语言处理 1. 对 LLM 的误解、局限与能力 1. 如何用 LLM 设计解决方案 1. 构建与使用 LLM 的伦理问题

成为VIP会员查看完整内容

相关内容

大语言模型

关注 62

大语言模型是基于海量文本数据训练的深度学习模型。它不仅能够生成自然语言文本，还能够深入理解文本含义，处理各种自然语言任务，如文本摘要、问答、翻译等。2023年，大语言模型及其在人工智能领域的应用已成为全球科技研究的热点，其在规模上的增长尤为引人注目，参数量已从最初的十几亿跃升到如今的一万亿。参数量的提升使得模型能够更加精细地捕捉人类语言微妙之处，更加深入地理解人类语言的复杂性。在过去的一年里，大语言模型在吸纳新知识、分解复杂任务以及图文对齐等多方面都有显著提升。随着技术的不断成熟，它将不断拓展其应用范围，为人类提供更加智能化和个性化的服务，进一步改善人们的生活和生产方式。

【新书】检索增强生成（RAG）入门指南

专知会员服务

28+阅读 · 6月25日

【新书】百页大语言模型新书，209页pdf

专知会员服务

102+阅读 · 2月4日

【新书】大语言模型在生产中的应用：从语言模型到成功产品

专知会员服务

71+阅读 · 1月21日

【新书】实践大型语言模型：语言理解与生成

专知会员服务

66+阅读 · 2024年10月1日