LLM API 入門指南
第一次接觸 LLM API?這份指南幫你快速了解核心概念
什麼是 LLM?
LLM(Large Language Model,大型語言模型)是一種透過大量文本訓練的 AI 模型,能夠理解和生成自然語言文字。常見的 LLM 包括 OpenAI 的 GPT 系列、Anthropic 的 Claude 系列、Google 的 Gemini 系列等。
什麼是 API?
API(Application Programming Interface)是應用程式之間的溝通介面。LLM API 讓你可以透過程式碼呼叫這些模型,取得文字生成、翻譯、摘要等功能,而不需要自己訓練模型。
Token 是什麼?
Token 是 LLM 處理文字的基本單位。大約 1 個中文字 ≈ 1-2 個 tokens,1 個英文單字 ≈ 1 個 token。API 的計費是以 token 數量來計算的。
Input vs Output Tokens
Input tokens 是你傳送給模型的文字(例如你的問題),Output tokens 是模型回傳的文字(例如回答)。Output 的價格通常是 Input 的 2-4 倍。
Context Window
Context Window 是模型一次能處理的最大 token 數量。例如 128K tokens 大約可以處理一本 100 頁的書。超過上限的文字會被截斷。
如何選擇模型?
選擇模型時,需要考慮以下幾個因素:
- 任務複雜度:簡單任務用便宜模型(如 GPT-4o mini),複雜推理用頂級模型(如 Claude Opus)
- 預算:每百萬 tokens 的價格從 $0.05 到 $75 不等,差距可達 1500 倍
- 速度需求:有些模型回應更快(如 Gemini Flash),適合即時互動場景
- Context 需求:長文件處理需要大 context window(128K+)
常見計價方式
LLM API 有多種計價維度:
- Input 價格:每百萬 input tokens 的費用
- Output 價格:每百萬 output tokens 的費用
- 快取價格:重複使用相同 prompt 時的折扣價(通常為原價的 50%)
- 批次價格:非即時的批次處理,通常為半價
如何開始使用?
選擇一個提供商(如 OpenAI、Anthropic)並註冊帳號。前往 API Keys 頁面建立一組金鑰。使用 HTTP 請求或 SDK 呼叫 API。建議從最便宜的模型開始測試,確認需求後再升級。