模型管理

LLM 模型配置与参数调优

系统运行正常
+12.4%

8,650

今日总调用

+8.7%

12.5M

今日 Token 消耗

+5.2%

$18.6

今日预估费用

-0.2s

1.6s

平均响应延迟

服务商状态
OpenAI已连接
Anthropic已连接
DeepSeek已连接
通义千问未连接
6 个模型
默认
G

GPT-4o

OpenAI

OpenAI 最新旗舰多模态模型,综合能力最强

推荐多模态

1.8s

平均延迟

99.2%

成功率

1,284

今日调用

输入 $2.5/M输出 $10/M上下文 128K
G

GPT-4o Mini

OpenAI

轻量高效版本,性价比极高,适合高频调用

高性价比快速

0.9s

平均延迟

99.6%

成功率

3,421

今日调用

输入 $0.15/M输出 $0.6/M上下文 128K
C

Claude 3.5 Sonnet

Anthropic

Anthropic 最强推理模型,长文本处理能力突出

长上下文推理强

2.1s

平均延迟

98.9%

成功率

876

今日调用

输入 $3/M输出 $15/M上下文 200K
C

Claude 3 Haiku

Anthropic

Anthropic 最快最轻量模型,延迟极低

极速低成本

0.7s

平均延迟

99.4%

成功率

2,103

今日调用

输入 $0.25/M输出 $1.25/M上下文 200K
D

DeepSeek Chat

DeepSeek

国产高性能对话模型,中文理解能力优秀

中文优化低价

1.5s

平均延迟

98.1%

成功率

654

今日调用

输入 $0.14/M输出 $0.28/M上下文 64K
D

DeepSeek R1

DeepSeek

深度推理模型,适合复杂逻辑分析与代码生成

推理代码

4.2s

平均延迟

97.8%

成功率

312

今日调用

输入 $0.55/M输出 $2.19/M上下文 64K

参数配置

当前模型:GPT-4o

Temperature控制输出随机性
0.7
02
Top P核采样概率阈值
0.90
01
Max Tokens最大输出 Token 数
2048.0
2568192
Presence Penalty降低重复话题倾向
0.0
-22
Frequency Penalty降低重复词语倾向
0.0
-22
System Prompt系统提示词
67 字符建议 100-500 字符

参数建议

• Temperature 0.1-0.3:适合精确问答,减少幻觉

• Temperature 0.7-1.0:适合创意生成,增加多样性

• Max Tokens 建议不超过模型最大输出限制

模型规格

模型名称gpt-4o
服务商OpenAI
模型类型对话模型
上下文窗口128K tokens
最大输出4,096 tokens
输入价格$2.5 / 1M tokens
输出价格$10 / 1M tokens

快速预设