AI项目实战(1)前言

《AI Agent 实战》系列 · 前言

Posted by Ryan on 2026-06-23
Estimated Reading Time 8 Minutes
Words 2.3k In Total
Viewed Times

为什么会有这本书

2024 到 2026 年,AI 领域发生了一件影响深远的事:大模型从"会聊天",迈进了"会做事"

这个变化看似只是一小步——从对话框里答问题,到能独立完成多步任务——背后却是整个技术范式的重构。Tool Calling、Agent、MCP、RAG、Harness、Skill、记忆系统、Multi-Agent,这些名词如雨后春笋冒出来,很多读者一边追新概念、一边又困惑:怎么把它们组合起来,做成一个能在生产环境跑起来的真实系统?

市面上的 AI 教程大致分两类:

  • 概念书:把每个名词讲一遍,但读完不知道怎么动手。
  • 代码片段:能跑,但都是 Demo 级,离生产差着十万八千里——没有架构、没有测试、没有部署、没有错误处理、没有观测。

这本书想补上中间这块空缺。

它的写作目标只有一个:让读者跟着十个真实项目,亲手把 AI Agent 技术从"知道"变成"做到",并且做到的代码能直接用于生产


这本书写给谁

如果你是以下任何一类读者,本书都为你而写:

  • AI 应用开发者:已经会调 OpenAI / Claude API,但不知道怎么把零散的能力组合成一个完整产品
  • 后端工程师:想转型 AI 方向,需要一套从工程师视角看清整个 Agent 技术栈的实战路径
  • 技术负责人 / 架构师:要带团队做 AI 项目,需要清晰的项目模板、技术选型依据和工程规范
  • 产品经理 / 创业者:想理解一个 AI Agent 产品的完整生命周期,从需求到上线
  • 进阶学习者:读过 Agent 原理书(比如《从「会聊天」到「会做事」》),想要把理论转化为肌肉记忆

不需要你是大模型专家,但需要你具备:

  • Python 基本功(看懂类、装饰器、异步即可)
  • 命令行基本操作(pip、git、curl)
  • 一颗愿意动手敲代码的心

这本书与上一本的关系

如果说上一本《从「会聊天」到「会做事」:一文读懂 AI Agent、MCP、Harness、Skill 等核心技术》是地图,告诉你这片技术疆域有哪些山头、河流、路径;那么这本书就是实地探险手册——带着你一座一座山头去爬、一条一条河去蹚。

维度 上一本(理论篇) 这一本(实战篇)
目标 理解原理 落地实施
内容 是什么、为什么 怎么做、怎么部署
主线 从「会聊天」到「会做事」 从单兵到团队
代码 教学示例 生产级代码
篇幅 ~1.6 万字 ~20-26 万字

没读过上一本也能读懂这一本——本书第 1 章会把所有核心概念快速过一遍。但如果你对原理还有困惑,回去读上一本会让本书的体验更连贯。


这本书的写作原则

我给自己定了五条硬性原则,希望它们能让本书与众不同:

1. 严格对齐官方文档,不胡说

AI 框架更新极快。LangChain v1.0 发布后,很多老教程里的 create_react_agent 已被官方标注为 deprecated。本书凡涉及具体 API,都以写作时官方最新文档为准,并明确标注版本号与官方来源链接。看到的代码不是网上抄来的,是从官方文档校对过的。

2. 代码可直接用于生产

每个项目都包含完整的工程要素:

  • 配置管理(不硬编码 Key)
  • 日志(统一格式,便于排查)
  • 错误处理(工具调用失败、模型超时、上下文溢出)
  • 测试(单元测试 + 集成测试)
  • 部署(Docker + 环境变量)
  • 可观测性(执行过程可视化)

不是 Demo 截图,是能跑、能改、能上线的工程级代码。

3. 每个项目独立成章,七段式结构

每章固定七段:

  1. 产品需求说明书(PRD)
  2. 产品功能设计书
  3. 技术设计说明书
  4. 代码实现
  5. 测试
  6. 发布部署
  7. 本章小结

这不是为了套模板,而是因为——这就是真实工业界做一个 AI 项目的标准流程。读完十章,你不仅会做技术,也会做产品、做项目。

4. 一条主线贯穿全书

十个项目不是十个孤立的故事,而是同一条主线上的十个里程碑:从"会用工具的单 Agent"逐步进化到"能协作的智能体团队"。每章开篇会回扣这条主线,告诉你"我们现在到了哪一步、要解决什么、要去哪里"。

5. 通俗讲技术,让晦涩概念活起来

技术要严谨,但表达可以不晦涩。每个新概念上来先打比方、给场景,再展开技术原理。让初学者读得进去,让老手读得有共鸣。


全书结构鸟瞰

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
前言(你现在的位置)

1 章 起点:在动手之前,先看清全图
— 主线、核心概念、技术基准、阅读路径

2 章 通用脚手架:搭建一个能跑十个项目的工程底座
— 全书复用的 AgentCore、配置、日志、API、前端

──────── 单 Agent 阶段(让一个 Agent 越来越能干) ────────

3 章 项目一:智能客服 Agent 主讲:Tool + Prompt
4 章 项目二:企业知识库问答 Agent 主讲:RAG(LangGraph + LlamaIndex)
5 章 项目三:代码审查 Agent 主讲:Harness 循环 + Skill
6 章 项目四:数据分析 Agent 主讲:MCP(自建 Server)
7 章 项目五:AI 视频生成 Agent 主讲:多模态工具编排
8 章 项目六:一站式代码开发 Agent 主讲:复杂 Harness 闭环(写-测-修)

──────── Multi-Agent 阶段(让 Agent 组成团队) ────────

9 章 项目七:多智能体内容创作平台 主讲:Multi-Agent + 共享记忆
10 章 项目八:多智能体研究分析平台 主讲:并行研究 + 辩论 + 综合
11 章 项目九:全能个人助理 Agent 主讲:MCP + 短长记忆 + Skill
12 章 项目十:自主任务规划 Agent 主讲:全能力集大成

──────── 收尾 ────────

13 章 统一前端管理平台:十个项目的可视化调用台
14 章 生产级最佳实践:成本、延迟、安全、评估、可观测
附录 环境清单、API 速查、术语表、参考文献

配套代码仓库

本书所有代码都在一个开源仓库里:

git@github.com:tigergo001/ai-agent-book-projects.git

仓库结构:

1
2
3
4
5
ai-agent-book-projects/
├── backend/ # 后端代码(10 个项目 + 公共脚手架 + FastAPI)
├── frontend/ # 前端代码(统一可视化管理台)
├── docs/ # 书稿源文件(每章一个 md)
└── docker-compose.yml # 一键启动

强烈建议:边读边在本地把代码跑起来。本书第 1 章会带你把环境配好;之后每读完一章,你都能在前端管理台里看到刚学的项目实际运行起来——这种"读完即可见"的体验,是纯纸质书做不到的。


如何使用本书

三种阅读模式

模式 适合谁 怎么读
通读模式 系统学习者 从前言到附录顺序读,每章都跑代码
选读模式 有针对性需求 读完前言+第 1 章+第 2 章后,跳读你最关心的项目章节
跳读模式 老手回顾 直接看每章的「技术设计说明书」+ 代码清单

每章七段,按需取用

每个项目章节固定七段式。如果你是产品经理,重点看 X.1(PRD)、X.2(功能设计);如果你是开发者,重点看 X.3(技术设计)、X.4(代码);如果你是架构师,X.6(部署)和 X.7(小结:常见坑)值得细品。

验收路径

每读完一章,做这三件事,知识就真正属于你:

  1. 跑通代码:把仓库代码 clone 下来,配好 Key,让前端管理台能调用本章项目
  2. 改一个东西:替换一个工具、改一段 Prompt、加一个测试用例——任何主动改动都会让你比"只读不动手"理解深一倍
  3. 画一张图:合上书,凭记忆画出本章项目的架构图。画不出来的部分,就是你还没真正理解的部分

致读者

这本书的成书过程很特别——它本身就是一个 AI Agent 与人协作的产物。但每一行代码、每一段技术原理,都经过了与官方文档的严格对照与本地环境的真实验证。我们不希望读者读完一本"看着很美但跑不通"的书。

如果你在阅读或运行代码中发现任何问题,欢迎到仓库 issues 区反馈。技术日新月异,欢迎一起把这本书持续迭代下去。

现在,请翻到第 1 章。我们一起,从看清全图开始。

——作者
2026 年 6 月


如果您喜欢此博客或发现它对您有用,则欢迎对此发表评论。 也欢迎您共享此博客,以便更多人可以参与。 如果博客中使用的图像侵犯了您的版权,请与作者联系以将其删除。 谢谢 !