大模型面试题

公众号@小林面试笔记AI Agent大约 13 分钟约 4025 字

大家好，我是小林。

2026 年开始，AI Agent 开发的浪潮真正席卷整个互联网行业。

不光是 AI 算法、AI 应用工程师这些「天生 AI」的岗位，面试题越问越深；连后端开发、前端开发、数据开发这些原本跟 AI 隔了一道墙的岗位，面试官也开始或多或少地问起 AI 题了。比如：

「你的项目里有没有用过 LLM？怎么用的？」
「假如让你做一个 Agent，你会怎么设计？」
「RAG 工作流程是怎样的？」
「MCP 和 SKills 有什么区别？」

这些问题已经悄悄出现在各种岗位的面试里。AI 时代，每个工程师都得懂点大模型，不然很容易掉队。

为了让林友们在 AI 时代不掉队，我从去年开始花了非常多的心思整理这套大模型面试题。

这套题做了四件跟一般八股文不一样的事：

题目全部来自大厂真实面经。字节、阿里、快手、腾讯这些公司里被反复问到的高频题，不是我编的，也不是网上抄的八股。
每道题开头都有一段「面试现场复盘」。模拟真实对话让你看看「这道题答不好会被怼成什么样」，先感受一下「答不好的代价」，再学知识印象会深得多。
每道题都配通俗易懂的手绘风格配图。复杂的架构、流程、对比，光靠文字读起来累，配上图一下子就清楚了，记忆也会更深。
每道题都从根子上讲透原理。目标不是让你背标准答案，而是让你不管面试官怎么换问法、怎么追问，都能自己推导出来。

目前一共四个专题，Agent 面试专题，RAG 面试专题，工具调用 面试专题，大模型工程 面试专题，下面分别说说各覆盖了哪些内容。

Agent 面试专题

Agent 现在是 AI 工程里最热的方向，面试里出现频率非常高，但也是最容易答得「听起来没问题、其实没说到点上」的方向。这个专题从最基础的概念一路讲到多 Agent 协作，把面试里最常被追问的几个维度都覆盖到了。

从基础到进阶大概分四块。

第一块是概念和架构，先把 Agent 到底是什么、和普通 LLM 调用有什么本质区别搞清楚，再拆 Agent 的核心组件，以及 Workflow、Agent、Tools 三个概念怎么区分，这是后面所有问题的地基，一定要答利索。

第二块是设计范式，重点就是 ReAct、Plan-and-Execute、Reflection 这三种，每种解决什么问题、有什么代价、适合哪种场景，这是面试里最高频的考点，也是最容易答得半对不对的地方。

第三块是工程实践，这一块问的都是你真正做过 Agent 才会遇到的问题，比如复杂任务怎么拆分、记忆模块怎么设计、规划能力怎么实现、反思机制具体怎么跑，还有一道「为什么有时候要手搓 Agent 而不用框架」，能答好这道题说明你真的踩过坑。

第四块是多 Agent，从什么是 Multi-Agent 讲起，到 Single-Agent 和 Multi-Agent 怎么选，再到多 Agent 之间怎么通信（消息传递还是共享状态）、路由怎么做（静态规则还是 LLM 动态决策），这块是做过复杂系统才会深入思考的问题，答好了印象分很高。

📖 专题完整介绍：Agent 面试专题首页

RAG 面试专题

RAG 是把外部知识接入大模型最主流的方案，现在几乎所有 AI 应用里都有它的影子，面试里肯定绕不开。这个专题从 RAG 的基础原理一路讲到工程落地，覆盖了整条链路。

第一块是基础，先把 RAG 是什么、解决了大模型哪些根本问题讲清楚，然后对比 RAG 和微调各自该用在什么场景，这是面试开场的必考题，得答出层次来。

第二块是索引构建，文档怎么切割（Chunking）、粒度怎么定、语义被切断了怎么办、Embedding 是什么怎么选、向量数据库怎么选型、怎么用，这一块是 RAG 系统搭起来之前必须搞定的事，问题看着简单，但每道深入问下去都有坑。

第三块是检索优化，这是最容易在面试里拉开差距的部分。一般人能说出「向量检索」，但 Query Rewrite 是什么、为什么要做、多路召回怎么设计、各种检索优化策略是什么、有哪些更复杂的 RAG 范式（比如 Self-RAG、Corrective RAG）、图数据库什么时候用，这些点很多人答不上来，但这恰恰是面试官最爱深挖的地方。

第四块是生产落地，幻觉怎么规避、效果怎么量化、知识库怎么动态更新，最后一道「RAG 落地最难的地方」是个开放题，没有标准答案，但能答好这道题的人，面试官基本就认可你真的做过 RAG 系统了。

📖 专题完整介绍：RAG 面试专题首页

LLM 工具调用面试专题

做 AI 应用光让模型能聊天是不够的，你得让它能「干活」，能查数据库、能调 API、能操作文件，这些背后就是工具调用。

Function Calling、MCP、Agent Skill 这些概念现在面试问得越来越多，但很多人对它们的理解还停留在「都是调工具的」这个层面，一追问就分不清谁是谁了。涵盖 Function Calling 原理与训练、MCP 协议架构、FC 与 MCP 对比选型、Agent Skill 知识封装、A2A 协议、通信协议对比、LLM 网关等面试题。

也是按模块来聊。前三道是 Function Calling 基础，FC 到底是什么、模型怎么学会调工具的、训练过程是怎样的，这是整个工具调用体系的地基，很多人只知道「模型能调工具」，但说不清模型输出的是什么格式、谁决策谁执行，面试官一追问就露馅。

第 4 到第 5 题是 MCP 协议，MCP 是什么、由哪几部分组成。MCP 现在是 AI 工具生态最热门的话题，理解了 MCP 的架构和组成，后面的对比和选型才有基础。

第 6 到第 8 题是 FC 与 MCP 的对比和选型，两者到底有什么区别、什么场景该用哪个、为什么有些推理模型不支持 MCP。这块最容易拉开差距，大部分人只会单独解释概念，说不清它们的关系和选型依据。

第 9 到第 11 题是 Agent Skill，Skill 是什么、和 MCP 有什么区别、FC/Skill/MCP 三者到底是什么关系。Skill 是 Anthropic 推出并开放为跨平台标准的概念，把使用工具完成任务的知识和流程打包成可复用模块，和 MCP 提供的工具能力形成互补。理解了这三层架构（FC 是语言、MCP 是工具箱、Skill 是操作手册），你对整个工具调用体系就有全局视角了。

第 12 题是 A2A 协议，A2A 是什么、跟 MCP 有什么区别。A2A 是 Google 推出的 Agent 间协作协议，属于进阶内容。第 13 到第 15 题是 通信协议，MCP 的通信方式、SSE 和 WebSocket 的区别、WebRTC 在 AI 对话场景里的角色，偏底层实现，面试官有时会从 MCP 架构往下追问到通信协议层。最后第 16 题聊 LLM 网关，偏工程实践，做过线上项目的同学答起来会很有优势。

📖 专题完整介绍：LLM 工具调用面试专题首页

大模型工程面试专题

LLM 现在基本是 AI 工程的「地基」了，不管你做的是 Agent、RAG 还是工具调用，上面跑的都是 LLM。所以只要你面 AI 工程方向的岗位，LLM 底层原理几乎都会被问，问得也越来越深。

这个专题聚焦的是「大模型本身」的底层技术，整理了 22 道高频题，按六块组织。

前 5 道是认知与基础原理，LLM 是什么、Transformer 架构、MHA 优化（MQA/GQA/Flash Attention）、位置编码（RoPE 等）、分词器。这五道是底层原理的地基，搞不清楚后面所有的东西都讲不透。

第 6-11 道是训练全景与微调，从「大模型怎么训练出来」这个全景题开始，展开 Scaling Law、微调方案（LoRA/QLoRA）、Post-Training 家族（RLHF/DPO/GRPO/拒绝采样）、DPO vs PPO 对比。这一块偏理论，Agent 开发短期可以略读。

第 12-15 道是推理与生成，讲清楚解码策略（贪心、Beam Search、采样）、采样参数（温度/Top-P/Top-K）、KV Cache + Prompt Caching、量化（INT4/AWQ/GPTQ）。这一块是部署优化的核心，Agent 调用次数多，Prompt Caching 能省 90% 输入 token 费用。

第 16-18 道是应用与 Prompt 工程，讲 Prompt 怎么写好（五要素 + 进阶技巧）、CoT 怎么用、幻觉为什么会出现以及怎么缓解。这一块是所有 LLM 应用岗的必问基础。

第 19-20 道是架构演进与部署，MoE 混合专家模型（DeepSeek V3 为什么便宜）、推理框架对比（vLLM / SGLang / TGI / llama.cpp 怎么选）。

最后 21-22 道是评测与选型，学术 Benchmark 的局限、业务测试集怎么建、实际项目选型逻辑，「你们项目为什么选这个模型不选那个」是几乎每场面试都会有的开放题。

📖 专题完整介绍：大模型工程面试专题首页

对了，大模型面试题会在「公众号@小林面试笔记题」持续更新，林友们赶紧关注起来，别错过最新干货哦！