LLM API 入门指南
第一次接触 LLM API?这份指南帮你快速了解核心概念
什么是 LLM?
LLM(Large Language Model,大型语言模型)是一种通过大量文本训练的 AI 模型,能够理解和生成自然语言文字。常见的 LLM 包括 OpenAI 的 GPT 系列、Anthropic 的 Claude 系列、Google 的 Gemini 系列等。
什么是 API?
API(Application Programming Interface)是应用程序之间的沟通接口。LLM API 让你可以通过代码呼叫这些模型,取得文字生成、翻译、摘要等功能,而不需要自己训练模型。
Token 是什么?
Token 是 LLM 处理文字的基本单位。大约 1 个中文字 ≈ 1-2 个 tokens,1 个英文单词 ≈ 1 个 token。API 的计费是以 token 数量来计算的。
Input vs Output Tokens
Input tokens 是你传送给模型的文字(例如你的问题),Output tokens 是模型回传的文字(例如回答)。Output 的价格通常是 Input 的 2-4 倍。
Context Window
Context Window 是模型一次能处理的最大 token 数量。例如 128K tokens 大约可以处理一本 100 页的书。超过上限的文字会被截断。
如何选择模型?
选择模型时,需要考虑以下几个因素:
- 任务复杂度:简单任务用便宜模型(如 GPT-4o mini),复杂推理用顶级模型(如 Claude Opus)
- 预算:每百万 tokens 的价格从 $0.05 到 $75 不等,差距可达 1500 倍
- 速度需求:有些模型回应更快(如 Gemini Flash),适合实时互动场景
- Context 需求:长文件处理需要大 context window(128K+)
常见计价方式
LLM API 有多种计价维度:
- Input 价格:每百万 input tokens 的费用
- Output 价格:每百万 output tokens 的费用
- 缓存价格:重复使用相同 prompt 时的折扣价(通常为原价的 50%)
- 批次价格:非即时的批次处理,通常为半价
如何开始使用?
选择一个提供商(如 OpenAI、Anthropic)并注册账号。前往 API Keys 页面建立一组密钥。使用 HTTP 请求或 SDK 呼叫 API。建议从最便宜的模型开始测试,确认需求后再升级。