在 2026 年 I/O 开发者大会之后,Google AI Pro 和 AI Ultra 的订阅用户发现 Gemini 的使用限制明显变严了。旧的每日请求次数限制被一套全新的计算资源计费系统所取代,该系统采用“5小时为一个周期”以及“每周总额度”的双重限制。
在 Reddit 的 Gemini 版块中,已经积累了大量用户的抱怨:有些人仅仅发送了 5 条消息,就耗尽了 5 小时周期内一半的额度;还有一部分用户表示已经取消了订阅。与此同时,也有报告指出,在系统高负载时段,用户会被强制切换到速度更快的轻量级模型。
Google 将付费方案的计费逻辑从“按请求次数”改为了“按计算资源消耗”。过去,Gemini 曾是少数按提示词数量(而非像 ChatGPT 和 Claude 那样按 Token 消耗量)计算额度的服务,这种方式对用户来说相对更慷慨。而现在,你可用的额度将直接受到提示词复杂度、调用的功能以及对话轮次长度的影响。
所谓“计算资源限额”,指的是一种不再单纯计算发送请求次数的计费模式,其额度消耗取决于提示词的复杂程度、所选模型与功能,以及对话的持续时间。
该限额每 5 小时重置一次,直到用户触及每周的总额度上限。这种机制实际上是在效仿 Anthropic(Claude 的开发商)的做法:Claude 同样采用 5 小时的时间窗口,且在长对话中 Token 消耗会呈指数级增长,导致用户不得不将任务拆分,并为不同的任务开启新的对话窗口。现在,Gemini 也出现了同样的情况。此外,这种 5 小时的时间窗口机制也推广到了 Google 旗下 Gemini 以外的其他产品,包括 Antigravity 和 Flow。
在 Reddit 的 Gemini 版块中,用户对 Google 突然收紧限额表达了强烈的不满。一位用户表示,在简单的 5 条消息交流就耗尽了 5 小时周期内一半的额度后,他决定取消 Pro 订阅。
部分用户还指出,Gemini 有时会自动切换到 Flash 模型,即使用户明明选择的是 Pro 模型——这仅仅是因为系统负载过高。许多用户参与了讨论,几乎每个人都对新的限额制度感到不满。
还有用户声称,“个性化”功能会显著影响额度的消耗速度。另一个主要的抱怨点是,Google 并没有提前通知订阅用户这些变更。
计算资源的消耗情况可以在 Gemini 应用的“设置 -> 使用限额”(Settings -> Usage limits)部分进行查看。一旦达到限额,对话将只能继续使用最基础的 Flash-Lite 模型,Pro 订阅用户也不例外。为了绕过限额并继续使用更高级的模型,AI Pro 和 AI Ultra 的订阅者可以额外按需购买一次性的 AI 点数。
Google 并未公开 AI Pro 方案具体的 Token 数量或点数上限:官方通知中仅提到,其额度是免费版的四倍。AI Plus 方案的额度是标准版的两倍,AI Pro 是四倍,而 AI Ultra 则提供标准版二十倍的额度。与此同时,Google 停止了向 Flow 用户发放 1000 个免费 AI 点数的福利,但声称这对现有用户不会产生影响。
限额的调整恰逢 Google 对订阅产品线进行重组。Google 将顶级方案 AI Ultra 的月费下调了 50 美元,降至 200 美元。而在原本 200 美元的 Ultra 方案和 20 美元/月的 Pro 方案之间,Google 新增了一个定价为 100 美元/月的 AI Ultra 方案,该方案的功能集更少,限额也更低。对于顶级方案以下的其他方案,Google 在公告中并未详细说明限额的具体调整情况。
转为按计算资源计费后,额度的消耗变得难以预测:以前是按请求次数计费,而现在一条复杂的提示词就可能消耗掉相当大一部分额度。对于那些将 Gemini 作为主要生产力工具的用户来说,每周的总额度上限增加了一个前所未有的限制:即使你小心翼翼地分配 5 小时周期内的使用量,也可能在周三左右就触及每周的天花板。
现在,用户更有必要通过设置中的限额部分来随时监控剩余额度,更何况 Google 保留了在不提前通知的情况下更改限额的权利。