安装依赖
LangChain 的 OpenAI 模型集成通常使用 langchain-openai。如果你的服务提供 OpenAI 兼容接口,可以通过自定义 base_url 接入。
pip install langchain langchain-openai
LangChain 配置 Claude API
下面示例使用 ChatOpenAI,把接口指向 ClaudeGPT API 的 OpenAI 兼容地址。模型名请以控制台实际支持列表为准。
import os
from langchain_openai import ChatOpenAI
llm = ChatOpenAI(
api_key=os.environ["CLAUDEGPT_API_KEY"],
base_url="https://b.onerouter.com/openai/v1",
model="claude-sonnet",
temperature=0.2,
)
response = llm.invoke("用三句话解释 LangChain 的 Runnable 是什么。")
print(response.content)
环境变量写法
建议把 API Key 放在环境变量里,不要写死在代码仓库。
# macOS / Linux
export CLAUDEGPT_API_KEY="你的 API Key"
# Windows PowerShell
$env:CLAUDEGPT_API_KEY="你的 API Key"
RAG 项目接入建议
LangChain 经常用于 RAG 知识库。RAG 项目成本主要来自检索片段和多轮上下文,建议上线前先控制这几项:
- 减少单次召回片段数量,不要把无关上下文塞给模型。
- 把系统提示词压缩成稳定模板,避免每次请求重复长规则。
- 简单分类、路由、改写任务使用低价模型,最终回答再用 Claude/GPT。
- 给每个客户或项目单独创建 API Key,方便统计成本。
- 记录输入 token、输出 token、模型名和错误码。
Agent 场景注意事项
Agent 会多次调用模型,成本和 429 风险更高。建议设置最大迭代次数、工具调用白名单、请求超时和备用模型。不要让 Agent 在无限循环里持续调用 API。
常见错误排查
401 Unauthorized
通常是 API Key 错误、环境变量没有生效或请求头没有带上 Bearer Token。
402 Payment Required
通常是余额不足。建议先用测试额度跑 50-100 条真实样本,再估算月度成本。
429 Rate Limit
通常是并发太高或上游限流。降低并发,增加指数退避重试,并准备备用模型。可参考 Claude API 429 解决办法。
相关教程:LlamaIndex 接入 Claude API、Python 调用 Claude API、OpenAI API 国内使用方案。