LLM API 入門指南

第一次接觸 LLM API?這份指南幫你快速了解核心概念

什麼是 LLM?

LLM(Large Language Model,大型語言模型)是一種透過大量文本訓練的 AI 模型,能夠理解和生成自然語言文字。常見的 LLM 包括 OpenAI 的 GPT 系列、Anthropic 的 Claude 系列、Google 的 Gemini 系列等。

什麼是 API?

API(Application Programming Interface)是應用程式之間的溝通介面。LLM API 讓你可以透過程式碼呼叫這些模型,取得文字生成、翻譯、摘要等功能,而不需要自己訓練模型。

Token 是什麼?

Token 是 LLM 處理文字的基本單位。大約 1 個中文字 ≈ 1-2 個 tokens,1 個英文單字 ≈ 1 個 token。API 的計費是以 token 數量來計算的。

Input vs Output Tokens

Input tokens 是你傳送給模型的文字(例如你的問題),Output tokens 是模型回傳的文字(例如回答)。Output 的價格通常是 Input 的 2-4 倍。

Context Window

Context Window 是模型一次能處理的最大 token 數量。例如 128K tokens 大約可以處理一本 100 頁的書。超過上限的文字會被截斷。

如何選擇模型?

選擇模型時,需要考慮以下幾個因素:

  • 任務複雜度:簡單任務用便宜模型(如 GPT-4o mini),複雜推理用頂級模型(如 Claude Opus)
  • 預算:每百萬 tokens 的價格從 $0.05 到 $75 不等,差距可達 1500 倍
  • 速度需求:有些模型回應更快(如 Gemini Flash),適合即時互動場景
  • Context 需求:長文件處理需要大 context window(128K+)

常見計價方式

LLM API 有多種計價維度:

  • Input 價格:每百萬 input tokens 的費用
  • Output 價格:每百萬 output tokens 的費用
  • 快取價格:重複使用相同 prompt 時的折扣價(通常為原價的 50%)
  • 批次價格:非即時的批次處理,通常為半價

如何開始使用?

選擇一個提供商(如 OpenAI、Anthropic)並註冊帳號。前往 API Keys 頁面建立一組金鑰。使用 HTTP 請求或 SDK 呼叫 API。建議從最便宜的模型開始測試,確認需求後再升級。