Home 开源项目 Guestbook 专栏 Admin
开源项目:

搜索中...

未找到与 "" 相关的文章

换个关键词试试看

输入关键词搜索文章

支持搜索标题、内容、摘要

AI开发核心术语详解:从Embedding到Fine-tuning

admin · 2026-06-02 09:00 · 人工智能 · AI 开发实战 · 4

AI开发核心术语详解:从Embedding到Fine-tuning

在AI应用开发的实践中,开发者会频繁遇到Embedding、Token、Temperature、Fine-tuning等专业术语。这些概念不仅是理解大语言模型(LLM)工作原理的基础,更是构建高质量AI应用的关键。本文将系统梳理这些核心概念,帮助你建立完整的技术认知体系。


一、Embedding(嵌入):让计算机理解语义

1.1 什么是Embedding?

Embedding是将离散的文本、图像或其他数据转换为连续向量空间中的低维稠密向量的技术。简单来说,它把人类可理解的语义信息,转化为计算机可计算的数学表示。

例如,单词king和queen在向量空间中的距离,会比king和apple更近。这种语义关系的数学化表示,是RAG、语义搜索等技术的核心基础。

1.2 Embedding的核心特性

  • 语义相似性:语义相近的文本,其向量距离也更近
  • 维度压缩:通常将高维稀疏数据压缩到数百或数千维
  • 可计算性:支持余弦相似度、欧氏距离等数学运算

1.3 实战:文本相似度计算


from openai import OpenAI
import numpy as np

client = OpenAI()

def get_embedding(text, model="text-embedding-3-small"): response = client.embeddings.create(input=text, model=model) return response.data[0].embedding

def cosine_similarity(a, b): return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))

计算语义相似度

text1 = "机器学习是人工智能的一个分支" text2 = "深度学习属于机器学习的范畴" text3 = "今天的天气真好"

emb1 = get_embedding(text1) emb2 = get_embedding(text2) emb3 = get_embedding(text3)

print(f"文本1 vs 文本2: {cosine_similarity(emb1, emb2):.4f}") # ~0.85 print(f"文本1 vs 文本3: {cosine_similarity(emb1, emb3):.4f}") # ~0.25


二、Token:AI世界的最小单位

2.1 Token的本质

Token是LLM处理文本的最小单位。不同于我们理解的字或词,Token是模型训练时定义的子词单元(subword)。例如:

  • 英文:"unhappiness" → ["un", "happiness"] → 2个Token
  • 中文:"人工智能" → ["人", "工", "智", "能"] → 4个Token(大致)
  • 标点符号:每个标点通常也是独立的Token

2.2 Token的影响

场景Token影响
API计费按输入+输出的Token总数收费
上下文窗口模型能处理的最大Token数(如128K)
响应长度max_tokens参数限制输出长度

2.3 Token优化技巧

  • 精简Prompt:删除冗余描述,使用更简洁的表达
  • 结构化输出:要求JSON格式,减少无意义的开场白
  • 上下文压缩:对历史对话进行摘要,而非完整保留

三、Temperature与Top-p:控制创造力的旋钮

3.1 Temperature(温度)

Temperature控制模型输出的随机性,取值范围通常为0-2:

  • Temperature = 0:确定性输出,总是选择概率最高的Token。适合代码生成、数据提取等需要精确结果的场景。
  • Temperature = 0.7:平衡模式,既有创造性又保持连贯。适合通用对话、内容创作。
  • Temperature = 1.5+:高创造性,输出更发散。适合头脑风暴、创意写作。

3.2 Top-p(Nucleus Sampling)

Top-p是另一种采样策略,它从累积概率达到p的最小Token集合中采样:

  • Top-p = 0.1:只考虑前10%概率质量的Token,输出保守
  • Top-p = 0.9:考虑90%概率质量的Token,输出多样
  • Top-p = 1.0:考虑所有Token,最自由

3.3 实战:不同参数的效果对比


import openai

client = openai.OpenAI()

prompt = "请用一句话描述人工智能的未来:"

for temp in [0, 0.7, 1.5]: response = client.chat.completions.create( model="gpt-4", messages=[{"role": "user", "content": prompt}], temperature=temp, max_tokens=50 ) print(f"Temperature={temp}: {response.choices[0].message.content}")

输出示例:

Temperature=0: 人工智能的未来是实现人机协作,提升人类生产力和生活质量。

Temperature=0.7: 人工智能的未来充满无限可能,它将深度融入各行各业。

Temperature=1.5: 人工智能的未来或许是硅基生命与碳基智慧的共舞...


四、Fine-tuning(微调):让模型更懂你

4.1 什么时候需要Fine-tuning?

Fine-tuning通过在特定数据集上继续训练,让模型学习特定的输出风格或领域知识。适合以下场景:

  • 特定风格:需要模型模仿特定的写作风格或品牌语气
  • 领域专精:法律、医疗等专业领域的精确回答
  • 格式统一:需要严格遵循特定JSON格式或标记语言
  • 成本优化:用更短的Prompt达到同样的效果

4.2 Fine-tuning vs Prompt Engineering

维度Prompt EngineeringFine-tuning
成本低,按调用付费高,训练+部署费用
灵活性高,随时调整低,需重新训练
效果上限受限于上下文长度可深度定制
适用场景通用任务、快速迭代高频、标准化任务

4.3 Fine-tuning数据准备


{
  "messages": [
    {"role": "system", "content": "你是一个专业的客服助手,用简洁友好的语气回答。"},
    {"role": "user", "content": "我的订单什么时候发货?"},
    {"role": "assistant", "content": "您好!您的订单#12345预计明天发货,发货后会有短信通知。如有其他问题随时联系~"}
  ]
}

五、RLHF:让AI更懂人类偏好

RLHF(Reinforcement Learning from Human Feedback,基于人类反馈的强化学习)是现代LLM对齐人类价值观的核心技术。其流程包括:

  1. 预训练:在大规模语料上学习语言规律
  2. SFT(监督微调):用高质量对话数据训练
  3. 奖励模型训练:人类标注者对多个回答排序,训练奖励模型
  4. RL优化:用PPO等算法优化策略,最大化奖励

六、总结:术语速查表

术语一句话解释应用场景
Embedding语义到向量的映射RAG、语义搜索、推荐
Token模型处理的最小文本单位计费、上下文管理
Temperature控制输出随机性平衡精确与创意
Top-p核采样策略控制输出多样性
Fine-tuning在特定数据上继续训练风格定制、领域专精
RLHF人类反馈强化学习对齐人类价值观

掌握这些核心术语,你就具备了深入AI开发的技术基础。下一篇文章,我们将探讨如何构建真正的多模态AI应用。

微博 Twitter

评论 (0)

暂无评论,来说两句吧!

发表评论

支持 Markdown 语法和 Emoji 😀