支持 100+ 模型 · 实时更新价格

302.AI Token 词元计算器

即时估算 GPT、Claude、Gemini 及 100+ AI 模型的 API 费用。精准规划您的 AI 预算 — 完全免费,无需注册。

100+
AI 模型
4
支持货币
3
输入模式
免费
无需注册

Token Calculator

OpenAI模型
gpt-4.5-preview-2025-02-27 Input:75 / Output:150
omnihuman Input:0 / Output:0.15
doubao-bigmodel-recognize Input:0 / Output:0.003
o1-plus Input:0 / Output:0.1
fish-audio Input:20 / Output:0
o1-mini Input:3 / Output:12
hunyuan-role Input:0.57 / Output:1.14
pix Input:0 / Output:0.1
deepseek-chat Input:0.15 / Output:0.3
command-r Input:1 / Output:3
nvidia/llama-3.1-nemotron-70b-instruct Input:0.5 / Output:0.5
ideogram Input:0 / Output:0.01
whisper-v3 Input:0.12 / Output:0
chatgpt-4o-latest Input:5 / Output:15
ERNIE-4.0-8K Input:18.7 / Output:18.7
gpt-3.5-turbo-0125 Input:0.5 / Output:1.5
gpt-4 Input:30 / Output:60
Anthropic模型
wan2.5-i2i-preview Input:0 / Output:0.05
upload-file Input:0 / Output:0.001
qwen2-7b-instruct Input:0.16 / Output:0.22
claude-3-opus-20240229 Input:15 / Output:75
gemini-exp-1121 Input:2.5 / Output:10
claude-3-haiku-20240307 Input:0.5 / Output:2.5
Google模型
dall-e-2-test Input:0.1 / Output:0.4
dall-e-2-test Input:0.075 / Output:0.3
qwen-mt-image Input:0.001 / Output:0
test Input:149084 / Output:271284
test Input:149084 / Output:271284
test Input:149084 / Output:271284
test Input:149084 / Output:271284
hunyuan-pro-test12 Input:2 / Output:0
gemini-2.0-flash-exp Input:0.15 / Output:0.6
o1-all Input:30 / Output:120
asd Input:0.15 / Output:0.6
test1 Input:15129 / Output:0
gpt-4 Input:0 / Output:0.016
gemini-1.5-flash-002 Input:0.037 / Output:0.15
gemini-1.5-pro-002 Input:1.25 / Output:5
国产模型
stable-diffusion Input:0 / Output:0.15
chatgpt-4o-latest Input:5 / Output:15
jina-reranker-v1-base-en Input:0.04 / Output:0.04
qwen-tts-2025-04-10 Input:0.5 / Output:2
gemini-2.5-flash-image-preview Input:3 / Output:30
klingai-image Input:1 / Output:1
gpt-5 Input:1 / Output:1
qwen-image-edit Input:0 / Output:0.01
qwen-image Input:0 / Output:0.01
elevenlabs-music Input:0 / Output:36
cogview-4 Input:0 / Output:0.02
test Input:1.1 / Output:1.1
test Input:1.1 / Output:1.1
test Input:1.1 / Output:1.1
test Input:1.1 / Output:1.1
us.amazon.nova-micro-v1:0 Input:0.035 / Output:0.14
qwen-max Input:18.7 / Output:18.7
qwen-vl-max Input:2.9 / Output:2.9
qwen2.5-math-72b-instruct Input:0.57 / Output:1.7
claude-sonnet-4-5-20250929 Input:3 / Output:15
flux-pro-1.1 Input:0 / Output:0.04
glm-4 Input:15.4 / Output:15.4
glm-4-long Input:0.14 / Output:0.14
glm-4-plus Input:7 / Output:7
qwen-long Input:18.7 / Output:18.7
illuminarty Input:0 / Output:0.01
gpt-4o-mini Input:0.3 / Output:1.2
glm-4v Input:15.4 / Output:15.4
glm-4v-plus Input:1.4 / Output:1.4
ernie-4.0-turbo-8k Input:4.3 / Output:8.6
ernie-4.0-turbo-8k Input:4.3 / Output:8.6
Baichuan4 Input:14.3 / Output:14.3
perplexity Input:0 / Output:0.005
moonshot-v1-8k Input:1.9 / Output:1.9
udio Input:0 / Output:0.1
yi-large Input:0.86 / Output:0.86
ERNIE-4.0-8K Input:0.86 / Output:0.86
test Input:246 / Output:0
test Input:246 / Output:0
test Input:246 / Output:0
test Input:246 / Output:0
yi-vision Input:0.86 / Output:0.86
gpt-image-1 Input:0 / Output:40
midjourney Input:0 / Output:0.1
ChatLaw Input:4.3 / Output:8.6
asdsadasd Input:0.6 / Output:2.2
wanx2.1-t2v-plus Input:0 / Output:0.15
llama3-70b-8192 Input:0.7 / Output:2.8
wan2.2-i2v-flash Input:0 / Output:0.2
veo3-fast Input:0 / Output:0.03
general_v2.0_L Input:0 / Output:0.05
i2i_portrait_photo Input:0 / Output:0.03
gemini-2.5-flash-nothinking Input:0.3 / Output:2.5
elevenlabs-text-to-speech Input:300 / Output:0
Doubao-pro-32k Input:0.12 / Output:0.31
generalv3.5 Input:4.3 / Output:4.3
runway Input:0 / Output:0.5
XuanYuan-70B-Chat-4bit Input:4.3 / Output:8.6
硅基流动
SenseMirage Input:14 / Output:14
jinaai Input:0 / Output:0.04
gpt-4o-realtime-preview-2024-12-17 Input:40 / Output:80
jina-tokenizer Input:0.154 / Output:0.154
aminer Input:0 / Output:0.001
hunyuan-lite Input:0.11 / Output:0.11
hunyuan-standard Input:0.704 / Output:0.792
hunyuan-pro Input:4.73 / Output:15.73
hunyuan-code Input:0.627 / Output:1.254
hunyuan-vision Input:28.6 / Output:28.6
gemini-embedding-001 Input:1.1 / Output:0
doubao-seed-1-6-250615 Input:0.121 / Output:0.33
wanx2.1-i2v-turbo Input:0 / Output:0.05
wan2.2-t2i-flash Input:0 / Output:0.03
wanx2.1-i2v-plus Input:0 / Output:0.15
wan2.2-t2i-plus Input:0 / Output:0.05
wanx2.1-t2i-turbo Input:0 / Output:0.03
wanx2.1-t2i-plus Input:0 / Output:0.05
-etsagpt-4-1106-preview Input:10 / Output:30
hunyuan-vision Input:26 / Output:26
dall-e-3 Input:0.16 / Output:0.22
flux-pro-1.0-finetuned Input:0 / Output:0.06
gemini-2.0-flash-thinking-exp-1219 Input:0.1 / Output:0.5
flux-pro-1.1-ultra-finetuned Input:0 / Output:0.07
dall-e-23 Input:0 / Output:1
flux-pro-1.0-depth Input:0 / Output:0.05
Pro/google/gemma-2-9b-it Input:3 / Output:15
flux-pro-1.0-depth-finetuned Input:0 / Output:0.06
flux-pro-1.0-canny-finetuned Input:0 / Output:0.06
flux-pro-1.0-fill-finetuned Input:0 / Output:0.06
TeleAI/TeleMM Input:0 / Output:1
Qwen/Qwen2.5-72B-Instruct-128K Input:0 / Output:0.06
gpt-3.5-turbo-16k=asd Input:3 / Output:4
yi-lightningasdsad-wqe Input:0.15 / Output:0.15
gpt-4 Input:0 / Output:0
dall-e-3 Input:0 / Output:0.04
dall-e-3 Input:0 / Output:0.08
dall-e-3 Input:0 / Output:0.08
dall-e-3 Input:0 / Output:0.08
dall-e-3 Input:0 / Output:0.12
dall-e-3 Input:0 / Output:0.12
gpt-4 Input:0.59 / Output:0.59
dall-e-2 Input:0 / Output:0
zxc Input:0 / Output:0
as Input:0 / Output:0
asdw[eoi Input:0 / Output:0
claude-3-5-sonnet-qwe Input:3 / Output:15
asdsa Input:0.18 / Output:0.18
专业模型
asdasd Input:0.086 / Output:0.086
sad Input:0.143 / Output:0.143
dall-e-2 Input:0.05 / Output:0.05
gpt-4 Input:100 / Output:200
gpt-4 Input:100 / Output:200
claude-3-7-sonnet-20250219 Input:3 / Output:15
deepseek-r1-302 Input:0.6 / Output:2.3
deepseek-v3-302 Input:0.3 / Output:1.2
fast/deepseek-ai/DeepSeek-R1 Input:0.6 / Output:2.3
fast/deepseek-ai/DeepSeek-V3 Input:0.3 / Output:1.2
intelligent_education_correction_agent Input:0.02 / Output:0.02
glm-4-plus Input:7 / Output:7
doc2x Input:0 / Output:0.005
开源模型
glif Input:0 / Output:0.01
llama3.2-90b Input:2 / Output:2
doubao-seed-translation-250915 Input:0.2 / Output:0.6
unifuncs-read Input:0.01 / Output:0
claude-sonnet-4-20250514 Input:3 / Output:15
seededit_v3.0 Input:0 / Output:0.05
test Input:1.5 / Output:2
test Input:1.5 / Output:2
test Input:1.5 / Output:2
test Input:1.5 / Output:2
pplx-8b-online Input:0.22 / Output:0.22
pplx-70b-online Input:1.1 / Output:1.1
perplexity/llama-3.1-sonar-small-128k-online Input:0.3 / Output:0.3
sami-podcasttts Input:40 / Output:80
doubao-seedream-4-0-250828 Input:0.1 / Output:0
cc-3-5-haiku-20241022 Input:2 / Output:10
test-1 Input:123 / Output:229
xfyun-Real-time Input:0.2 / Output:0.2
gpt-4 Input:0.05 / Output:0
us.amazon.nova-pro-v1:0 Input:0.8 / Output:3.2
其他模型
us.amazon.nova-lite-v1:0 Input:0.06 / Output:0.24
claude-haiku-4-5-20251001 Input:1 / Output:50
hunyuan-pro-test123 Input:2 / Output:0
gpt-4o-realtime-preview Input:10 / Output:10
minimaxi_text2voice Input:30 / Output:0
deepl-zh Input:25 / Output:25
gpt-4o-2024-08-06 Input:2.5 / Output:10
bochaai Input:0 / Output:0.01
netease-youdao/bce-embedding-base_v1 Input:0.02 / Output:0.02
llama3.2-11b Input:0.5 / Output:0.5
对比其他模型
预估费用
知识库

Token 词元相关知识

帮助您有效规划 AI API 用量预算所需了解的全部知识。

什么是 Token?

Token 是 LLM 处理文本的最小单位。在英文中,1 token ≈ 4 个字符,约为 ¾ 个单词。"Hello world!" 大约是 3 个 token。Token 不等同于单词,标点符号和空格也会消耗 Token。

中文与英文的 Token 差异

中文字符密度更高。每个中文字符通常使用 1–2 个 token,而 1 个英文单词平均约 1.3 个 token。这意味着中文文本在每个语义单位上通常比英文更节省 token。

输入与输出费用

大多数服务商对输入和输出 token 分别计费。输出 token 通常比输入 token 贵 2–4 倍,因为文本生成在计算上比读取更耗资源。预算时两者都需考虑。

上下文窗口

上下文窗口是模型在单次请求中能处理的 token 总数(输入 + 输出)。更大的窗口(如 128K、1M)支持更长的文档,但若充分利用,每次调用的费用也更高。

LLM API 费用如何计算?

LLM API 费用 = (输入 Token × 输入价格 + 输出 Token × 输出价格) ÷ 1,000,000。输入和输出 Token 分别计费,输出 Token 通常贵 2–4 倍,因为文本生成在计算上更耗资源。

选择合适的模型

并非每项任务都需要最顶尖的模型。对于分类、摘要或简单问答,小型模型在质量相当的情况下成本低 10–50 倍。根据任务复杂度匹配模型能力。

📊 Word-to-Token 转换指南

不同类型内容的 Token 估算各有差异,使用本指南更精准预测您的 Token 用量。

内容类型Token 比率1,000 词估算说明
🇺🇸 英文文本~1.3 tokens/word≈ 1,300–1,500标准散文、文章、邮件
💻 代码(Python/JS)~2–3 tokens/word≈ 2,000–3,000关键字、运算符、符号都会增加 Token
🀄 中文 / 日文~2+ tokens/char≈ 2,000+每个中日文字符消耗 1–2 个 Token
📝 技术写作~1.5 tokens/word≈ 1,500–1,800专业术语、缩写、数字会增加 Token 数
🗃️ JSON / XML 数据~3–4 tokens/word≈ 3,000–4,000括号、引号、键名均消耗 Token
FAQ

常见问题

关于 LLM API Token 和费用计算的常见问题。

Token 是语言模型处理文本的基本单位。在英文中,1 个 token 大约等于 4 个字符或 ¾ 个单词。例如,"ChatGPT is great!" 大约包含 6 个 token。中文字符通常每个占用 1–2 个 token。大多数 LLM 提供商按每次 API 调用中处理的输入和输出 token 总量收费。
LLM API 费用遵循以下公式:

总费用 = (输入 Token ÷ 1,000,000 × 输入价格) + (输出 Token ÷ 1,000,000 × 输出价格)

输入 token 是您的提示词(指令 + 上下文),输出 token 是模型生成的响应。输出 token 的价格通常比输入高 2–4 倍。302.AI Token 计算器会针对每个所选模型自动完成计算。
302.AI Token 计算器支持 100+ 个模型,包括:
  • OpenAI:GPT-4o、GPT-4o mini、GPT-4 Turbo、o1、o3
  • Anthropic:Claude 3.5 Sonnet、Claude 3 Opus、Claude 3 Haiku
  • Google:Gemini 1.5 Pro、Gemini 1.5 Flash、Gemini 2.0
  • Meta:LLaMA 3.1(8B、70B、405B)
  • Mistral AI:Mistral Large、Mistral Medium、Codestral
  • 以及通过 302.AI 统一 API 接入的更多模型
计算器支持四种货币:
  • USD — 美元(默认)
  • CNY — 人民币
  • JPY — 日元(日本円)
  • RUB — 卢布(Российский рубль)
汇率会定期更新。实际计费时,最终金额以 API 调用时 302.AI 当前汇率为准。
输入 token 是您发送给模型的所有内容:系统提示词、对话历史、用户消息以及任何注入的上下文(如 RAG 文档等)。

输出 token 是模型在响应中生成的 token。由于文本生成在计算上比处理输入更耗资源,输出 token 通常每个 token 费用为输入的 2–4 倍

对于拥有长对话历史的聊天机器人,由于每轮对话都需要重新发送完整上下文,输入 token 会迅速累积。
302.AI 通过单一统一 API 提供 100+ 个模型的访问权限,定价与直接提供商价格持平或更优。额外优势包括:
  • 按需付费,无月度最低消费
  • 无需为每个模型提供商单独开户
  • 所有模型统一 API 格式(兼容 OpenAI)
  • 可访问在您所在地区无法直接使用的模型
  • 内置用量面板和费用追踪
Token 计算器完全免费使用,无需账号。它是一个规划工具,帮助开发者和团队在构建前估算 API 费用。

当您准备好开始使用 API 时,可以免费注册 302.AI,即可按需付费访问所有支持的模型。

准备好使用 302.AI API 了吗?

一个账号即可访问 100+ AI 模型。按需付费,无月度承诺,无供应商锁定。

无月费
100+ 模型统一接入
OpenAI 兼容 API
即时激活