LangChain 接入 Claude API 教程：OpenAI 兼容接口配置

安装依赖

LangChain 的 OpenAI 模型集成通常使用 langchain-openai。如果你的服务提供 OpenAI 兼容接口，可以通过自定义 base_url 接入。

pip install langchain langchain-openai

LangChain 配置 Claude API

下面示例使用 ChatOpenAI，把接口指向 ClaudeGPT API 的 OpenAI 兼容地址。模型名请以控制台实际支持列表为准。

import os
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    api_key=os.environ["CLAUDEGPT_API_KEY"],
    base_url="https://b.onerouter.com/openai/v1",
    model="claude-sonnet",
    temperature=0.2,
)

response = llm.invoke("用三句话解释 LangChain 的 Runnable 是什么。")
print(response.content)

环境变量写法

建议把 API Key 放在环境变量里，不要写死在代码仓库。

# macOS / Linux
export CLAUDEGPT_API_KEY="你的 API Key"

# Windows PowerShell
$env:CLAUDEGPT_API_KEY="你的 API Key"

RAG 项目接入建议

LangChain 经常用于 RAG 知识库。RAG 项目成本主要来自检索片段和多轮上下文，建议上线前先控制这几项：

减少单次召回片段数量，不要把无关上下文塞给模型。
把系统提示词压缩成稳定模板，避免每次请求重复长规则。
简单分类、路由、改写任务使用低价模型，最终回答再用 Claude/GPT。
给每个客户或项目单独创建 API Key，方便统计成本。
记录输入 token、输出 token、模型名和错误码。

Agent 场景注意事项

Agent 会多次调用模型，成本和 429 风险更高。建议设置最大迭代次数、工具调用白名单、请求超时和备用模型。不要让 Agent 在无限循环里持续调用 API。

常见错误排查

401 Unauthorized

通常是 API Key 错误、环境变量没有生效或请求头没有带上 Bearer Token。

402 Payment Required

通常是余额不足。建议先用测试额度跑 50-100 条真实样本，再估算月度成本。

429 Rate Limit

通常是并发太高或上游限流。降低并发，增加指数退避重试，并准备备用模型。可参考 Claude API 429 解决办法。

LangChain 接入 Claude API：用 OpenAI 兼容接口调用多模型