AI开发核心术语详解：从Embedding到Fine-tuning

在AI应用开发的实践中，开发者会频繁遇到Embedding、Token、Temperature、Fine-tuning等专业术语。这些概念不仅是理解大语言模型（LLM）工作原理的基础，更是构建高质量AI应用的关键。本文将系统梳理这些核心概念，帮助你建立完整的技术认知体系。

一、Embedding（嵌入）：让计算机理解语义

1.1 什么是Embedding？

Embedding是将离散的文本、图像或其他数据转换为连续向量空间中的低维稠密向量的技术。简单来说，它把人类可理解的语义信息，转化为计算机可计算的数学表示。

例如，单词king和queen在向量空间中的距离，会比king和apple更近。这种语义关系的数学化表示，是RAG、语义搜索等技术的核心基础。

1.2 Embedding的核心特性

语义相似性：语义相近的文本，其向量距离也更近
维度压缩：通常将高维稀疏数据压缩到数百或数千维
可计算性：支持余弦相似度、欧氏距离等数学运算

1.3 实战：文本相似度计算


from openai import OpenAI
import numpy as np
client = OpenAI()
def get_embedding(text, model="text-embedding-3-small"):
response = client.embeddings.create(input=text, model=model)
return response.data[0].embedding
def cosine_similarity(a, b):
return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))
计算语义相似度
text1 = "机器学习是人工智能的一个分支"
text2 = "深度学习属于机器学习的范畴"
text3 = "今天的天气真好"
emb1 = get_embedding(text1)
emb2 = get_embedding(text2)
emb3 = get_embedding(text3)
print(f"文本1 vs 文本2: {cosine_similarity(emb1, emb2):.4f}")  # ~0.85
print(f"文本1 vs 文本3: {cosine_similarity(emb1, emb3):.4f}")  # ~0.25

二、Token：AI世界的最小单位

2.1 Token的本质

Token是LLM处理文本的最小单位。不同于我们理解的字或词，Token是模型训练时定义的子词单元（subword）。例如：

英文："unhappiness" → ["un", "happiness"] → 2个Token
中文："人工智能" → ["人", "工", "智", "能"] → 4个Token（大致）
标点符号：每个标点通常也是独立的Token

2.2 Token的影响

场景	Token影响
API计费	按输入+输出的Token总数收费
上下文窗口	模型能处理的最大Token数（如128K）
响应长度	max_tokens参数限制输出长度

2.3 Token优化技巧

精简Prompt：删除冗余描述，使用更简洁的表达
结构化输出：要求JSON格式，减少无意义的开场白
上下文压缩：对历史对话进行摘要，而非完整保留

三、Temperature与Top-p：控制创造力的旋钮

3.1 Temperature（温度）

Temperature控制模型输出的随机性，取值范围通常为0-2：

Temperature = 0：确定性输出，总是选择概率最高的Token。适合代码生成、数据提取等需要精确结果的场景。
Temperature = 0.7：平衡模式，既有创造性又保持连贯。适合通用对话、内容创作。
Temperature = 1.5+：高创造性，输出更发散。适合头脑风暴、创意写作。

3.2 Top-p（Nucleus Sampling）

Top-p是另一种采样策略，它从累积概率达到p的最小Token集合中采样：

Top-p = 0.1：只考虑前10%概率质量的Token，输出保守
Top-p = 0.9：考虑90%概率质量的Token，输出多样
Top-p = 1.0：考虑所有Token，最自由

3.3 实战：不同参数的效果对比


import openai
client = openai.OpenAI()
prompt = "请用一句话描述人工智能的未来："
for temp in [0, 0.7, 1.5]:
response = client.chat.completions.create(
model="gpt-4",
messages=[{"role": "user", "content": prompt}],
temperature=temp,
max_tokens=50
)
print(f"Temperature={temp}: {response.choices[0].message.content}")
输出示例：
Temperature=0: 人工智能的未来是实现人机协作，提升人类生产力和生活质量。
Temperature=0.7: 人工智能的未来充满无限可能，它将深度融入各行各业。
Temperature=1.5: 人工智能的未来或许是硅基生命与碳基智慧的共舞...

四、Fine-tuning（微调）：让模型更懂你

4.1 什么时候需要Fine-tuning？

Fine-tuning通过在特定数据集上继续训练，让模型学习特定的输出风格或领域知识。适合以下场景：

特定风格：需要模型模仿特定的写作风格或品牌语气
领域专精：法律、医疗等专业领域的精确回答
格式统一：需要严格遵循特定JSON格式或标记语言
成本优化：用更短的Prompt达到同样的效果

4.2 Fine-tuning vs Prompt Engineering

维度	Prompt Engineering	Fine-tuning
成本	低，按调用付费	高，训练+部署费用
灵活性	高，随时调整	低，需重新训练
效果上限	受限于上下文长度	可深度定制
适用场景	通用任务、快速迭代	高频、标准化任务

4.3 Fine-tuning数据准备


{
  "messages": [
    {"role": "system", "content": "你是一个专业的客服助手，用简洁友好的语气回答。"},
    {"role": "user", "content": "我的订单什么时候发货？"},
    {"role": "assistant", "content": "您好！您的订单#12345预计明天发货，发货后会有短信通知。如有其他问题随时联系~"}
  ]
}

五、RLHF：让AI更懂人类偏好

RLHF（Reinforcement Learning from Human Feedback，基于人类反馈的强化学习）是现代LLM对齐人类价值观的核心技术。其流程包括：

预训练：在大规模语料上学习语言规律
SFT（监督微调）：用高质量对话数据训练
奖励模型训练：人类标注者对多个回答排序，训练奖励模型
RL优化：用PPO等算法优化策略，最大化奖励

六、总结：术语速查表

术语	一句话解释	应用场景
Embedding	语义到向量的映射	RAG、语义搜索、推荐
Token	模型处理的最小文本单位	计费、上下文管理
Temperature	控制输出随机性	平衡精确与创意
Top-p	核采样策略	控制输出多样性
Fine-tuning	在特定数据上继续训练	风格定制、领域专精
RLHF	人类反馈强化学习	对齐人类价值观

AI开发核心术语详解：从Embedding到Fine-tuning

AI开发核心术语详解：从Embedding到Fine-tuning

一、Embedding（嵌入）：让计算机理解语义

1.1 什么是Embedding？

1.2 Embedding的核心特性

1.3 实战：文本相似度计算

计算语义相似度

二、Token：AI世界的最小单位

2.1 Token的本质

2.2 Token的影响

2.3 Token优化技巧

三、Temperature与Top-p：控制创造力的旋钮

3.1 Temperature（温度）

3.2 Top-p（Nucleus Sampling）

3.3 实战：不同参数的效果对比

输出示例：

Temperature=0: 人工智能的未来是实现人机协作，提升人类生产力和生活质量。

Temperature=0.7: 人工智能的未来充满无限可能，它将深度融入各行各业。

Temperature=1.5: 人工智能的未来或许是硅基生命与碳基智慧的共舞...

四、Fine-tuning（微调）：让模型更懂你

4.1 什么时候需要Fine-tuning？

4.2 Fine-tuning vs Prompt Engineering

4.3 Fine-tuning数据准备

五、RLHF：让AI更懂人类偏好

六、总结：术语速查表

微信扫一扫分享

Related articles

AI 应用的成本控制与性能优化

AI 工作流编排：多 Agent 协作与状态管理

RAG 检索增强生成：从原理到落地实战

使用 Claude API 构建生产级应用：从入门到上线

Prompt Engineering 进阶：结构化提示与少样本学习

评论 (0)

发表评论

Contents

Subscribe to updates

Popular articles

Redis 缓存三大问题：穿透、击穿与雪崩及解决方案

Laravel Eloquent 关联查询优化：彻底解决 N+1 问题

Laravel 队列系统详解：异步任务、延迟执行与监控

PHP 8 新特性详解：命名参数、联合类型与 Match 表达式

SnowmanNunu 在线工具箱 — 纯前端实用工具