参考灵感:https://linux.do/t/topic/1664794
说明:本文保留“词汇+注解+项目地址”的表达形式,但去掉 LinuxDo 社区特定黑话,聚焦通用 AI 研发语境,并补充 X/Twitter 上 2026 年高频工程话题。

为什么要做这份词典
2026 年大家都在说 AI,但很多讨论混在一起:模型名、工具名、协议名、工作流名、公司名、甚至社区梗。信息密度高,但可执行度低。
这份词典目标很明确:
- 只收录对研发团队“可执行”的词;
- 每个词给一个工程化注解;
- 配一个项目地址,方便直接开工;
- 最后给出一套 Vibe Coding 代码规则体系(可直接落地)。
一、2026 高频 AI 词汇(工程语境)
1)Agent 与编程执行层
词汇
注解(工程视角)
项目地址
Vibe Coding
人定义目标和边界,AI 迭代执行(写码→测试→修复→提交)的开发方式
https://github.com/openclaw/openclaw
AI Coding Agent
在代码库内可自主规划与执行的代理,不只是“聊天补全”
https://github.com/All-Hands-AI/OpenHands
Claude Code
终端原生 coding agent,强调代码库理解和任务执行
https://github.com/anthropics/claude-code
Codex CLI
面向终端任务的代码代理形态(多用于自动化开发流)
https://platform.openai.com/docs
Multi-Agent Workflow
多代理分工协作:实现、测试、审查、文档并行
https://github.com/microsoft/autogen
Agent Orchestration
代理调度与状态编排(谁在何时做什么)
https://github.com/langchain-ai/langgraph
2)协议与互操作层
词汇
注解(工程视角)
项目地址
MCP (Model Context Protocol)
大模型与外部工具/数据源的标准连接层,降低工具集成成本
https://modelcontextprotocol.io
Tool Calling
模型结构化调用外部工具的能力,是“能做事”前提
https://platform.openai.com/docs/guides/function-calling
A2A / Agent2Agent
代理之间任务交接与协同(跨系统协作关键)
https://developers.googleblog.com/
API Gateway for LLM
统一模型接入、鉴权、限流、观测、路由
https://github.com/BerriAI/litellm
Model Router
按成本/时延/质量动态分流到不同模型
https://openrouter.ai
3)RAG 与数据层
词汇
注解(工程视角)
项目地址
RAG
检索增强生成,用外部知识提高回答准确性
https://docs.llamaindex.ai
Agentic RAG
由代理自动完成检索策略、重写查询、证据合并
https://github.com/langchain-ai/langchain
Vector DB
向量检索底座,支撑语义搜索和记忆召回
https://qdrant.tech
Embedding
文本向量化,决定检索语义质量
https://platform.openai.com/docs/guides/embeddings
Reranker
对初筛结果二次排序,提高命中质量
https://www.cohere.com/rerank
Memory Layer
会话长期记忆/用户偏好沉淀层(多会话连续性)
https://github.com/mem0ai/mem0
4)推理与部署层
词汇
注解(工程视角)
项目地址
Inference Stack
模型推理服务全链路(调度、批处理、缓存)
https://github.com/vllm-project/vllm
Local LLM
本地模型运行(隐私与可控性优先)
https://ollama.com
Distillation
大模型知识蒸馏到小模型,换取低成本推理
https://huggingface.co/docs
Quantization
量化压缩,降低显存与推理成本
https://github.com/ggml-org/llama.cpp
Speculative Decoding
用小模型草拟+大模型验证,提高生成速度
https://arxiv.org/abs/2302.01318
5)评测与治理层
词汇
注解(工程视角)
项目地址
Evals
体系化评估模型/提示词/工作流,不靠“感觉”
https://github.com/promptfoo/promptfoo
LLM Observability
请求、成本、延迟、失败率、质量追踪
https://langfuse.com
Guardrails
输出约束与安全策略(敏感内容、越权操作)
https://github.com/guardrails-ai/guardrails
Hallucination Control
降低幻觉:检索证据、引用约束、评测回归
https://www.deepeval.com
Human-in-the-Loop
人类只介入高风险节点,不做全程手工执行
https://www.pinecone.io/learn/human-in-the-loop/
二、X/Twitter 上 2026 年常见讨论关键词(建议重点跟踪)
下面这些词在 2026 年工程讨论里出现频率高,而且对“能不能落地”影响最大:
agentic workflowMCP servertool-use reliabilityeval-driven developmentmodel routinglong-context memorycost per successful taskhuman-in-the-loop gateautonomous code looprollback-safe deployment
建议检索语句(可直接用):
"agentic workflow" "MCP" "coding""eval-driven" "LLM" "production""model router" "cost" "latency""AI coding agent" "commit" "CI"

三、模型与公司(2026 工程选型视角)
版本更新很快,建议以官方发布为准。这里给的是“选型维度”,不是固定榜单。
公司
常见模型族(示例)
工程侧常见定位
OpenAI
GPT / Codex 系列
通用能力强,工具生态成熟
Anthropic
Claude 系列
代码与长上下文表现稳定
Google
Gemini 系列
多模态能力与生态整合强
xAI
Grok 系列
实时话题与平台联动强
Meta
Llama 系列
开源生态与自部署友好
DeepSeek
DeepSeek 系列
性价比与中文工程语境受关注
Zhipu/智谱
GLM 系列
中文场景与本土生态集成
四、如果我们来构建研发体系:推荐四层架构
1)Policy 层(规则)
- Commit 规范
- PR 模板
- 测试门禁
- 安全边界
- 发布与回滚策略
2)Execution 层(AI 执行)
- 编码代理
- 测试代理
- 修复代理
- 文档代理
3)Gate 层(自动裁判)
- 测试不过不合并
- 安全不过不合并
- 高风险目录需人工确认
4)Delivery 层(可控交付)

- 小步发布
- 监控告警
- 一键回滚
- 复盘留痕
五、Vibe Coding 代码规则体系(v1.0,可直接落地)
- 提交格式强约束:
type(scope): summary - 单提交单主题:一次只解决一类问题
- 小步提交:优先 20~80 行粒度,便于回滚
- 先测试后合并:CI 不通过禁止入主干
- Bug 必有用例:先复现再修复
- 高风险目录加门禁:auth/payment/security 双重审核
- AI 产出必须可追溯:保留提示词、测试结果、评测结果
- 发布必须可回滚:每次上线都有回退路径
- 失败自动转工单:把异常转成可追踪任务
- 按周复盘规则,不复盘情绪:持续优化规则体系
结语
“2026 AI 名词”不应该只是术语收藏夹,而应该变成团队的操作手册。
真正的差距不在于你会不会某个模型名词,而在于:
- 你有没有把它放进可执行流程;
- 你有没有把流程变成可验证、可回滚、可演进的系统。
一句话总结:
别只追新词,先把规则体系搭起来。