2026 AI 名词词典（工程实践版）：从 Vibe Coding 到可落地研发体系

参考灵感：https://linux.do/t/topic/1664794
说明：本文保留“词汇+注解+项目地址”的表达形式，但去掉 LinuxDo 社区特定黑话，聚焦通用 AI 研发语境，并补充 X/Twitter 上 2026 年高频工程话题。

为什么要做这份词典

2026 年大家都在说 AI，但很多讨论混在一起：模型名、工具名、协议名、工作流名、公司名、甚至社区梗。信息密度高，但可执行度低。

这份词典目标很明确：

只收录对研发团队“可执行”的词；
每个词给一个工程化注解；
配一个项目地址，方便直接开工；
最后给出一套 Vibe Coding 代码规则体系（可直接落地）。

一、2026 高频 AI 词汇（工程语境）

1）Agent 与编程执行层

词汇
注解（工程视角）
项目地址

Vibe Coding
人定义目标和边界，AI 迭代执行（写码→测试→修复→提交）的开发方式
https://github.com/openclaw/openclaw

AI Coding Agent
在代码库内可自主规划与执行的代理，不只是“聊天补全”
https://github.com/All-Hands-AI/OpenHands

Claude Code
终端原生 coding agent，强调代码库理解和任务执行
https://github.com/anthropics/claude-code

Codex CLI
面向终端任务的代码代理形态（多用于自动化开发流）
https://platform.openai.com/docs

Multi-Agent Workflow
多代理分工协作：实现、测试、审查、文档并行
https://github.com/microsoft/autogen

Agent Orchestration
代理调度与状态编排（谁在何时做什么）
https://github.com/langchain-ai/langgraph

2）协议与互操作层

词汇
注解（工程视角）
项目地址

MCP (Model Context Protocol)
大模型与外部工具/数据源的标准连接层，降低工具集成成本
https://modelcontextprotocol.io

Tool Calling
模型结构化调用外部工具的能力，是“能做事”前提
https://platform.openai.com/docs/guides/function-calling

A2A / Agent2Agent
代理之间任务交接与协同（跨系统协作关键）
https://developers.googleblog.com/

API Gateway for LLM
统一模型接入、鉴权、限流、观测、路由
https://github.com/BerriAI/litellm

Model Router
按成本/时延/质量动态分流到不同模型
https://openrouter.ai

3）RAG 与数据层

词汇
注解（工程视角）
项目地址

RAG
检索增强生成，用外部知识提高回答准确性
https://docs.llamaindex.ai

Agentic RAG
由代理自动完成检索策略、重写查询、证据合并
https://github.com/langchain-ai/langchain

Vector DB
向量检索底座，支撑语义搜索和记忆召回
https://qdrant.tech

Embedding
文本向量化，决定检索语义质量
https://platform.openai.com/docs/guides/embeddings

Reranker
对初筛结果二次排序，提高命中质量
https://www.cohere.com/rerank

Memory Layer
会话长期记忆/用户偏好沉淀层（多会话连续性）
https://github.com/mem0ai/mem0

4）推理与部署层

词汇
注解（工程视角）
项目地址

Inference Stack
模型推理服务全链路（调度、批处理、缓存）
https://github.com/vllm-project/vllm

Local LLM
本地模型运行（隐私与可控性优先）
https://ollama.com

Distillation
大模型知识蒸馏到小模型，换取低成本推理
https://huggingface.co/docs

Quantization
量化压缩，降低显存与推理成本
https://github.com/ggml-org/llama.cpp

Speculative Decoding
用小模型草拟+大模型验证，提高生成速度
https://arxiv.org/abs/2302.01318

5）评测与治理层

词汇
注解（工程视角）
项目地址

Evals
体系化评估模型/提示词/工作流，不靠“感觉”
https://github.com/promptfoo/promptfoo

LLM Observability
请求、成本、延迟、失败率、质量追踪
https://langfuse.com

Guardrails
输出约束与安全策略（敏感内容、越权操作）
https://github.com/guardrails-ai/guardrails

Hallucination Control
降低幻觉：检索证据、引用约束、评测回归
https://www.deepeval.com

Human-in-the-Loop
人类只介入高风险节点，不做全程手工执行
https://www.pinecone.io/learn/human-in-the-loop/

二、X/Twitter 上 2026 年常见讨论关键词（建议重点跟踪）

下面这些词在 2026 年工程讨论里出现频率高，而且对“能不能落地”影响最大：

agentic workflow
MCP server
tool-use reliability
eval-driven development
model routing
long-context memory
cost per successful task
human-in-the-loop gate
autonomous code loop
rollback-safe deployment

建议检索语句（可直接用）：

"agentic workflow" "MCP" "coding"
"eval-driven" "LLM" "production"
"model router" "cost" "latency"
"AI coding agent" "commit" "CI"

三、模型与公司（2026 工程选型视角）

版本更新很快，建议以官方发布为准。这里给的是“选型维度”，不是固定榜单。

公司
常见模型族（示例）
工程侧常见定位

OpenAI
GPT / Codex 系列
通用能力强，工具生态成熟

Anthropic
Claude 系列
代码与长上下文表现稳定

Google
Gemini 系列
多模态能力与生态整合强

xAI
Grok 系列
实时话题与平台联动强

Meta
Llama 系列
开源生态与自部署友好

DeepSeek
DeepSeek 系列
性价比与中文工程语境受关注

Zhipu/智谱
GLM 系列
中文场景与本土生态集成

四、如果我们来构建研发体系：推荐四层架构

1）Policy 层（规则）

Commit 规范
PR 模板
测试门禁
安全边界
发布与回滚策略

2）Execution 层（AI 执行）

编码代理
测试代理
修复代理
文档代理

3）Gate 层（自动裁判）

测试不过不合并
安全不过不合并
高风险目录需人工确认

4）Delivery 层（可控交付）

小步发布
监控告警
一键回滚
复盘留痕

五、Vibe Coding 代码规则体系（v1.0，可直接落地）

提交格式强约束：type(scope): summary
单提交单主题：一次只解决一类问题
小步提交：优先 20~80 行粒度，便于回滚
先测试后合并：CI 不通过禁止入主干
Bug 必有用例：先复现再修复
高风险目录加门禁：auth/payment/security 双重审核
AI 产出必须可追溯：保留提示词、测试结果、评测结果
发布必须可回滚：每次上线都有回退路径
失败自动转工单：把异常转成可追踪任务
按周复盘规则，不复盘情绪：持续优化规则体系

结语

“2026 AI 名词”不应该只是术语收藏夹，而应该变成团队的操作手册。

真正的差距不在于你会不会某个模型名词，而在于：

你有没有把它放进可执行流程；
你有没有把流程变成可验证、可回滚、可演进的系统。

一句话总结：

别只追新词，先把规则体系搭起来。