tokreo AI API 文档
兼容 OpenAI ChatGPT 接口协议,一个 API Key 调用 GPT、Claude、Gemini 等 580+ 主流大模型。本文档覆盖鉴权、快速开始、聊天补全、识图、创作图、Function Calling、结构化输出、推理模型、翻译、OCR、Completion、模型列表等全部接口。
平台介绍
tokreo AI 是一个 AI 接口聚合管理平台,提供统一格式的 API 接口,让您可以用一个 API Key 调用 GPT、Claude、Gemini 等 580+ 主流大模型。
核心特性
- 一个 API Key 调用全部模型,无需分别注册各平台账号
- 完全兼容 OpenAI API 协议,现有代码零修改即可迁移
- 全球直连,无需科学上网,连接速度是官方的 1200 倍
- Token 精确计费,统一单位为 USD / 1M tok
- 完善 API Key 管理系统,支持额度、有效期、模型权限设置
- 实时用量监控,调用数据一目了然
功能对比
| 功能 | tokreo AI | 官方API |
|---|---|---|
| 支持GPT-4等模型 | ✅ 支持各类型 | ❌ 需要账号有4.0权限 |
| 最高调用速度 | ✅ 无限制 | ❌ 需要绑卡付费48小时后 |
| 多账号高并发开发 | ✅ 数百个账号 | ❌ 单个账号API有限制 |
| OpenAI账号要求 | ✅ 无需注册 | ❌ 需要科学上网和绑定国外手机 |
| 额度有效期 | ✅ 永不过期 | ❌ 三个月到期 |
| 风控问题 | ✅ 0封号 | ❌ 随时无故封号 |
| 使用记录查看 | ✅ 实时查看,保留30天 | ❌ 只能看到延迟总消耗 |
| 代理访问要求 | ✅ 无需代理 | ❌ 需要在可支持的地区使用 |
| 计费规则 | 折扣价 | 原价 |
| 接口协议 | ✅ 完全兼容各平台接口协议 | ❌ 仅支持自有协议 |
快速开始
只需四步,即可开始调用大模型接口
-
注册登录
前往 登录页面 注册账户,登录即送算力,充值 1 人民币 = 1 美元 -
创建令牌
进入 API令牌管理 页面创建 API 令牌 -
选择模型
进入 模型广场 选择模型 -
工具接入
将模型接入到 Codex、Claude Code、OpenClaw 等工具中,详见下方 工具接入教程
Python 示例
cURL 示例
Node.js 示例
API 令牌创建教程
1、进入管理页面
进入 API令牌管理 页面创建 API 令牌。
2、创建令牌
点击"添加令牌"按钮创建新的 API 令牌。
新手建议
建议新手直接创建一个 auto API 令牌,分组选择"自动选择"分组。自动选择分组系统会根据每个模型的不同,自动选择即兼顾稳定性又兼顾性价比的渠道。其他参数默认即可。
老手建议
老手可以根据自己对稳定性和性价比的需要再自己组合分组,根据需要设置其他参数。
3、复制令牌使用
创建完成后直接复制令牌,填入工具的 API Key 字段即可使用。
工具接入教程
支持的工具列表
| 工具 | 说明 |
|---|---|
| Codex | AI编程工具,分组需选择 Codex专属 |
| Claude Code | Anthropic 官方编程助手 |
| OpenClaw | 开源 AI 编程工具 |
| Hermes Agent | AI Agent 工具 |
| OpenCode | 开源代码助手 |
| Trae | 字节跳动 AI 编程工具 |
| Gemini CLI | Google Gemini 命令行工具 |
| WorkBuddy | 工作助手工具 |
| Cherry Studio | 桌面端 AI 客户端 |
| 其他工具 | 按下方通用教程自行接入 |
通用工具接入教程
- 找到工具的自定义模型设置入口
- 按下表填写相关字段
| 参数名 | 参数值 | 说明 |
|---|---|---|
| API 协议 | OpenAI Completions / OpenAI | 接口协议类型,建议选 OpenAI Completions,所有对话模型都兼容 |
| API Base URL | https://api.tokreo.com 或 https://api.tokreo.com/v1 | 接口请求基础地址,有些工具需要带 /v1,有些不需要 |
| API Key | sk-xxxxxxxx | 接口授权令牌,在控制台创建后复制 |
| Model Name | gpt-4o、claude-opus-4-7 等 | 模型名称,在模型广场选择后复制 |
创建聊天补全(非流式)
本接口为兼容 OpenAI ChatGPT 的聊天非流式接口。所有支持对话的模型都可以使用该接口。
鉴权方式
在 Header 添加参数 Authorization,其值为在 Bearer 之后拼接 Token:
请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| model | string | 必填 | 要使用的模型名称,如 gpt-4o、claude-3-5-sonnet 等 |
| messages | array[object] | 必填 | 对话消息列表,每条包含 role 和 content |
| temperature | number | 可选 | 采样温度,0-2 之间。较高值(如0.8)使输出更随机,较低值(如0.2)更确定。建议改变此参数或 top_p,但不要同时改变 |
| top_p | number | 可选 | 核采样参数,0.1 表示只考虑前10%概率质量的标记。建议改变此参数或 temperature,但不要同时改变 |
| n | integer | 可选 | 为每个输入消息生成多少个聊天补全选择,默认1 |
| stream | boolean | 可选 | 是否流式输出,默认 false。设置后以 SSE 形式发送增量,以 data: [DONE] 结尾 |
| stop | string/array | 可选 | 最多4个序列,API将停止进一步生成标记,默认null |
| max_tokens | integer | 可选 | 聊天补全中生成的最大标记数,默认inf。总长度受模型上下文长度限制 |
| presence_penalty | number | 可选 | -2.0到2.0之间,正值根据是否出现在文本中惩罚新标记,增加谈论新主题的可能性 |
| frequency_penalty | number | 可选 | -2.0到2.0之间,默认0。正值根据存在频率惩罚新标记,降低重复可能性 |
| logit_bias | object | 可选 | 修改指定标记出现的可能性,接受标记ID到偏差值(-100到100)的映射 |
| user | string | 可选 | 代表最终用户的唯一标识符,帮助监控和检测滥用 |
| response_format | object | 可选 | 指定模型输出格式。{"type": "json_object"} 启用JSON模式,确保输出有效JSON |
| seed | integer | 可选 | Beta功能。指定后系统尽最大努力确定性采样,相同种子和参数重复请求应返回相同结果 |
| tools | array | 可选 | 模型可调用的工具列表,目前只支持函数工具 |
| tool_choice | object | 可选 | 控制模型调用哪个函数。none=不调用,auto=自动选择,或指定函数名强制调用 |
请求示例
响应示例
创建聊天补全(流式)
与非流式接口相同的 URL 和参数,只需设置 "stream": true,响应将以 SSE(Server-Sent Events)形式逐步返回。
请求示例
创建聊天识图
使用支持视觉的模型(如 gpt-4o)识别图片内容。支持 URL 和 Base64 两种图片传入方式。
URL 方式传入图片
Base64 方式传入图片
创建聊天创作图
使用支持图片生成的模型(如 gpt-4o-image-vip)通过对话方式生成或编辑图片。
请求示例
尺寸[4:3]、尺寸[16:9] 等可控制生成图片比例Function Calling
让模型调用外部函数,获取实时数据或执行操作。兼容 OpenAI Function Calling 协议。
请求示例
创建结构化输出
使用 response_format 参数的 json_schema 类型,确保模型输出严格遵循指定的 JSON Schema。
请求示例
控制推理模型努力程度
对于推理模型(如 o4-mini),可通过 reasoning_effort 参数控制推理深度。
reasoning_effort 可选值
| 值 | 说明 |
|---|---|
| low | 低努力,快速响应,适合简单问题 |
| medium | 中等努力,平衡速度和质量 |
| high | 高努力,深度推理,适合复杂问题 |
请求示例
翻译接口(qwen-mt-turbo)
使用 qwen-mt-turbo 模型进行高质量机器翻译,支持自动语言检测。
请求示例
OCR 识别(deepseek-ocr)
使用 deepseek-ocr 模型进行图片文字识别,支持 URL 和 Base64 图片。
请求示例
DeepSeek 思考程度控制
DeepSeek V3.1 等深度思考模型支持通过 thinking 字段控制是否开启深度思考能力。
thinking.type 可选值
| 值 | 说明 |
|---|---|
| enabled | 强制开启深度思考能力 |
| disabled | 强制关闭深度思考能力 |
| auto | 模型自行判断是否进行深度思考 |
请求示例
stream_options 参数
| 参数 | 类型 | 说明 |
|---|---|---|
| include_usage | boolean | 设为 true 时,在流式消息最后的 data: [DONE] 之前会传输一个额外的块,包含整个请求的 token 使用统计 |
Completion 接口
文本补全接口,适用于纯文本生成场景。兼容 OpenAI Completions API 格式。
请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| model | string | 必填 | 模型ID |
| prompt | string/array | 必填 | 补全提示文本 |
| max_tokens | integer | 可选 | 最大生成Token数,默认16 |
| temperature | number | 可选 | 生成温度0-2 |
| top_p | number | 可选 | 核采样参数 |
| stream | boolean | 可选 | 是否流式输出 |
| stop | string/array | 可选 | 停止生成的序列 |
请求示例
模型列表
获取当前可用的所有模型列表
请求示例
响应示例
分组说明
令牌分组决定了模型调用的渠道来源和费率。不同分组对应不同的渠道和价格倍率,您可以根据需求选择最适合的分组。
分组类型及特点
| 分组 | 类型 | 费率 | 支持模型 |
|---|---|---|---|
| default(默认) | 混合 ChatGPT(AZ渠道) + Claude(逆向渠道) + MJ(快速模型) + 国产模型 | 官方费率 ×1 | OpenAI, Claude, 国产模型 |
| 企业级高可用 | 国产模型(DeepSeek+Qwen) | 官方费率 ×1 | 国产模型 |
| 优质grok | grok模型(部分grok模型) | 官方费率 ×5 | grok |
| 优质gemini | Gemini(Google渠道)模型 | 官方费率 ×1 | Gemini |
| 官转gemini | Gemini(Google渠道)模型,价格较贵(账号更多) | 官方费率 ×3 | Gemini |
| 纯AZ | ChatGPT模型(AZ渠道) + 国产模型 | 官方费率 ×1.5 | OpenAI, 国产模型 |
| 官转 | ChatGPT(AZ渠道) + ChatGPT(官转渠道) + 国产模型 | 官方费率 ×3 | OpenAI, 国产模型 |
| 官转OPENAI | ChatGPT模型(官转渠道)+AZ渠道 | 官方费率 ×6 | OpenAI |
| 优质官转OPENAI | ChatGPT模型(官转渠道),价格较贵(账号更多) | 官方费率 ×8 | OpenAI |
| 逆向 | 支持GPT + Claude + Gemini + Grok | 官方费率 ×1.4 | OpenAI, Claude |
| 限时特价 | 国产模型 + Gemini(Google渠道) + ChatGPT(AZ渠道) | 官方费率 ×0.6 | Gemini, 国产模型 |
| 官转克劳德2 | Claude(AWS官转渠道) | 官方费率 ×6 | Claude |
| 官转克劳德3 | Claude(AWS官转渠道 + Anthropic官转渠道) | 官方费率 ×12 | Claude |
| 直连克劳德 | Claude(Anthropic官转渠道) | 官方费率 ×16 | Claude |
| Claude code专属 | Claude code | 官方费率 ×1.5 | Claude code |
费率说明
费率表示相对于官方价格的倍数:
- 费率 = 1 时:官方价格 1 刀,平台扣 1 刀
- 费率 = 1.5 时:官方价格 1 刀,平台扣 1.5 刀
- 费率 = 0.6 时:官方价格 1 刀,平台仅扣 0.6 刀(更优惠)
渠道来源说明
| 渠道名称 | 来源 | 特点 |
|---|---|---|
| AZ渠道 | 微软Azure | 通道多、备用足、高并发、无审核、支持FC/TC |
| 官转渠道 | openai.com | ChatGPT官网同款,高速、高并发 |
| Google渠道 | 谷歌官方API | 大额账号、并发高 |
| AWS官转 | 亚马逊 | 官方渠道、支持函数调用 |
| Anthropic官转 | Anthropic官方 | 账号更多、更稳定 |
| 逆向渠道 | ChatGPT官网 | 官网同款、价格优惠 |
如何选择分组
在 控制台 - API令牌 页面创建令牌时,可以指定分组。不同分组适合不同场景:
- 日常使用:选择 default(默认),覆盖模型最广
- 追求性价比:选择 限时特价,费率最低
- 需要稳定官转:选择 官转 或 优质官转OPENAI
- Claude Code 用户:选择 Claude code专属
- Gemini 用户:选择 优质gemini
接口调用地址
所有 API 请求都发送到以下基础地址,具体路径根据接口类型而定。
Base URL
不同工具的 Base URL 配置
| 工具类型 | Base URL | 说明 |
|---|---|---|
| OpenAI SDK (Python) | https://api.tokreo.com/v1 | 需要带 /v1 |
| OpenAI SDK (JS) | https://api.tokreo.com/v1 | 需要带 /v1 |
| curl | https://api.tokreo.com/v1/chat/completions | 完整路径 |
| Claude Code | https://api.tokreo.com | 不带 /v1 |
| Codex | https://api.tokreo.com | 不带 /v1 |
| ChatBox | https://api.tokreo.com | 不带 /v1 |
| Cherry Studio | https://api.tokreo.com | 不带 /v1 |
| NextChat | https://api.tokreo.com | 不带 /v1 |
提示:不同客户端可能需要使用不同的 Base URL,建议依次尝试以上地址。如果接口报错,请先检查 Base URL 是否正确。
邀请奖励活动
邀请好友注册,好友充值即可获得 10% 现金奖励!
参与流程
- tokreo AI 用户免费参与
- 进入 控制台 - 充值 页面复制专属邀请链接
- 分享链接给好友
- 好友通过链接注册账号
- 好友完成前3次充值即可触发奖励
奖励规则
- 好友前3次充值,可获其充值金额 10% 现金奖励
- 邀请人数不限,多邀多赚、上不封顶
- 奖励长期有效
奖励使用
- 直接提现:收益可随时申请提现
- 划转余额:奖励可转入账户余额,抵扣模型调用费用
活动亮点:零成本参与,分享即赚钱 | 奖励可提现、可转余额 | 一键复制链接,分享便捷高效
常见问题
Q: API Key 在哪里获取?
注册账户后,在 控制台 - API令牌 页面创建和管理您的 API Key。
Q: 支持哪些模型?
目前支持 580+ 主流大模型,包括 GPT-4o、Claude Opus 4、Gemini 2.5 Pro、DeepSeek V3 等。完整列表请查看 模型广场。
Q: 计费方式是什么?
Token 用量精确计费,用多少付多少。展示价格单位为 USD / 1M tok,实际结算与扣费按人民币(CNY)执行,具体以控制台账单与余额流水为准,并可在 模型价格 页面查看最新展示价格。
Q: 额度有效期多久?
充值额度永不过期,可放心使用。
Q: 是否兼容 OpenAI SDK?
完全兼容。只需将 base_url 修改为 https://api.tokreo.com/v1,api_key 替换为您的密钥即可,代码无需其他修改。
Q: 如何查看用量?
登录 控制台,在"用量统计"页面可查看详细的调用记录和消耗数据。
Q: 接入工具失败怎么办?
请参考上方 工具接入教程,确认 API 协议、Base URL、API Key、Model Name 填写正确。如仍有问题可联系我们。
Q: 常见HTTP状态码说明
| 状态码 | 含义 | 详细说明 |
|---|---|---|
| 200 | OK | 请求成功 |
| 400 | Bad Request | 请求格式错误或不能被服务器理解,通常是客户端参数错误 |
| 401 | Unauthorized | API Key 验证未通过,请检查密钥是否正确或是否已过期 |
| 403 | Forbidden | 权限不足,可能是令牌无权访问该模型或分组 |
| 404 | Not Found | 请求的资源未找到,请检查接口路径是否正确 |
| 413 | Request Entity Too Large | 请求体太大,请减小请求内容 |
| 429 | Too Many Requests | 请求频率超过限制,请稍后重试 |
| 500 | Internal Server Error | 服务器内部错误,可能是上游服务问题 |
| 502 | Bad Gateway | 上游服务不可用 |
| 503 | Service Unavailable | 服务器暂时不可用,可能是维护或过载 |
Q: AI返回字段中的思考内容是什么?
部分推理模型(如 DeepSeek R1、o3 等)会在响应中返回思考过程,相关字段说明如下:
| 字段 | 类型 | 说明 |
|---|---|---|
reasoning_content | string | 思考信息字段,包含模型的推理过程(DeepSeek R1、o系列等模型返回) |
content | string | 回复信息字段,包含模型的最终回答 |
reasoning | string | Gemini 思考模型返回的思考内容字段 |
示例响应片段: