Coding Plan:面向 AI 编程工具的套餐,通常按月订阅或按调用次数计费,适合 Claude Code、Cursor、OpenClaw 等交互式编程场景。
Token Plan:面向通用大模型调用的资源套餐,通常按输入/输出 token 或 credit 计费,适合 API 集成、批量任务和后台服务。
为什么他们还敢卖“无限”,因为商业上有个关键事实:大部分用户非常轻。逻辑上是用大量轻用户覆盖少量重用户。
虽然 Coding Plan 看起来可能是“按调用次数”计费,但平台通常不会允许一次调用无限消耗 token。一般会通过以下方式规避:
隐藏 token 限额:限制单次请求、单日、单会话或单位时间 token 消耗
Agent 步数限制:限制连续工具调用、自动循环次数和任务执行时长(一些 Code Agent “达到最大迭代次数”,本质也是成本保护)
上下文窗口限制:对超长上下文进行截断、压缩或动态降级(真正高质量 attention 可能只有前128k,便宜地“假支持”长上下文)
风控识别:识别 24 小时连续调用、批量生成、蒸馏数据构造等非人工使用模式
协议约束:服务条款通常禁止模型训练、蒸馏、批量数据生成等用途
一句话总结:
Coding Plan 是把大模型包装成“编程生产力工具”来卖;Token Plan 是把大模型算力按资源消耗来卖。Coding Plan 看似更便宜,但背后一定有 token、步数、频率和用途限制。