发码
建一个班级,为它批量生成授权码,并设定这个班统一的模型 / 模式 / 思考 / 额度 / 有效期。
查看与管理
所有班级的状态、用量与配置。点「看码」进班级,查看完整授权码、搜索、看每个码的用量明细。
| 班级 | 状态 | 创建时间 | 已发 / 已激活 | 锁定 | 用量可看 | 已用 | 次数 | 到期 |
|---|
网关能中转的全部模型(全局,不属于任何组);单价单位 ¥ / 百万 token。限额三列 = 上游厂商的硬限制(0 = 该口径对此模型不适用),并发监控页的水位条按它算,上游调整时在这改。改完点「保存」即生效。
| 公开名 | 供应商 | 入价 | 出价 | 限并发 | 限 RPM | 限 TPM | 启用 | 默认 |
|---|
班级详情
| 授权码 | 备注 | 用户ID | 手机号 | 状态 | 已激活 | 到期 | 设备 | 额度 / 已用 / 剩余 | 次数 / 字数 |
|---|
已归档
归档的班级只读留底 —— 数据都还在,可「看码」查授权码与用量,需要可「恢复」回主列表。物理删除只能直接动数据库文件。
| 班级 | 创建时间 | 已发 / 已激活 | 锁定 | 已用 |
|---|
授权码用量
| 时间 | 模型 | 输入 | 输出 | 合计字数 | 金额 | 状态 |
|---|
并发监控
盯一件事:离上游限额还有多远。DeepSeek 限「同时在跑的请求数」,通义千问限「每分钟请求数(RPM)+ 每分钟 token(TPM)」;水位逼近限额就该分 key 或限流。
页面停留时每 10 秒自动刷新。「在途」= 此刻正在等上游回答的请求数;RPM / TPM 为分钟级峰值,token 按请求完成时刻计入(口径从宽,不装精确)。水位条 = 24 小时峰值 ÷ 上游限额(每模型按它适用的口径,取占比最高的那项)。
| 模型 | 此刻在途 | 峰值并发 | 最高 RPM | 最高 TPM | 请求数 | 限额水位 |
|---|
每个点取该时段里分钟级的最大值(峰值口径,不摊平)。
每 30 秒采一次(CPU / 内存读 /proc,连接数 = 各模型在途合计),按分钟取峰值;跨度跟上面「历史走势」联动。
账号管理
三级账号:超级管理员(唯一,能建账号)→ 主管(除建号外同超管)→ 班主任(只管被分配的班级)。 每个账号可看「详情」里的操作记录。
班主任只看得到、也只能管被分配的班级;点「分配班级」勾选它负责的班。
| 用户名 | 备注 | 分配班级 | 状态 | 创建时间 |
|---|