2025-12-26 · 生活
32
生活 · 2025-12-26

AI工程师英文学习小抄

AI工程师英文学习小抄

一、词符切分

Tokenization (n. 词符切分):把句子切成一个个小零件

术语
含义

token
语言的小积木

Byte-pair Encoding
聪明的字节对编码方法

Byte Latent Transformer
补丁比词符扩展得更好

二、矢量化

Vectorization (n. 矢量化):把文字、图片、声音都变成数字

模型
说明

BERT
深度双向转换器的语言理解大师

IMAGEBIND
一个嵌入空间捆绑所有模态

SONAR
句子级别的多模态表示

FAISS
海量数据相似性搜索库

三、基础设施

Infrastructure (n. 基础设施):AI系统的地基

工具
用途

TensorFlow
谷歌的机器学习框架

Milvus DB
向量搜索专用数据库

Ray
分布式应用框架

四、核心架构

Core Architecture (n. 核心架构):AI的大脑设计

技术
说明

Attention is All You Need
注意力机制时代的宣言

FlashAttention
像闪电一样快的注意力算法

Multi-Query Attention
多查询注意力

Grouped-Query Attention
分组查询注意力

五、混合专家

Mixture of Experts (n. 混合专家):多个"专家"模型各显神通

模型
特点

Sparsely-Gated MoE
稀疏激活的混合专家层

GShard
谷歌的分片训练技术

Switch Transformers
带开关的Transformer

六、人类反馈强化学习

RLHF (Reinforcement Learning from Human Feedback):让AI懂礼貌、会说话

论文
内容

Deep RL with Human Feedback
AI的情商培养皿

Fine-Tuning LMs with RLHF
用人类反馈微调模型

七、思维链

Chain of Thought (n. 思维链):让AI一步一步思考

技术
说明

CoT Prompting
激发大模型推理能力

Demystifying Long CoT
揭秘长思维链推理过程

八、推理能力

Reasoning (n. 推理):衡量AI智能的重要标准

论文
核心观点

Transformer Reasoning Capabilities
探索推理能力上限

Scale model test times > scale parameters
测试次数比参数量更重要

九、模型优化

Optimizations (n. 优化):让模型跑得更快、吃得更少

技术
效果

1.58-bit LLMs
极致压缩,所有大模型都在1.58比特内

FlashAttention-3
更快更准,支持异步和低精度

Speculative Decoding
推测性解码,加速生成

十、知识蒸馏

Distillation (n. 蒸馏):把大模型的知识提炼给小模型

方法
说明

Distilling Knowledge in NN
祖师爷的配方

BYOL - Distilled
自学成才还能当老师

十一、状态空间模型

SSMs (State Space Models):Transformer的新兴挑战者

模型
特点

RWKV
Transformer时代重新发明RNN

Mamba
像曼巴蛇一样快速

LoLCATs
低秩线性化

十二、模型竞赛

Competition Models (n. 竞争模型):AI界的奥林匹克

赛事
说明

Google Math Olympiad
数学AI挑战

Competitive Programming with LRM
编程竞赛

十三、炒作与质疑

Hype Makers & Breakers (n. 吹鼓手与泼冷水):理性看待AI

观点
代表

语言不等于智能
Language is not intelligence

区分交流与智能
Separating communication from intelligence

十四、图像Transformer

Image Transformers (n. 图像转换器):让AI看懂图片

模型
说明

Image is 16x16 word
把图像当文字处理

CLIP
文字和图像手拉手

十五、视频Transformer

Video Transformers (n. 视频转换器):理解动态视觉

模型
用途

ViViT
专为视频打造的视觉Transformer

VideoJAM
Facebook的AI视频生成

十六、实际案例

Case Studies (n. 案例研究):AI在真实世界的应用

公司
应用

Meta
自动改进单元测试

OpenAI
o1系统、Swarm集群

Netflix
个性化推荐基础模型

Uber
queryGPT查询优化


参考链接
- 原文:https://docs.80aj.com/docs/AI%20%E5%B7%A5%E7%A8%8B%E5%B8%88%E7%9A%84%E5%A5%87%E5%B9%BB%E6%BC%82%E6%B5%81%EF%BC%9A%E4%B8%80%E4%BB%BD%E5%B8%A6%E6%A2%97%E7%9A%84%E8%8B%B1%E6%96%87%E5%AD%A6%E4%B9%A0%E5%B0%8F%E6%8A%84.html

目录 最新
← 左侧翻上一屏 · 右侧翻下一屏 · 中间唤出菜单