谷歌Gemini 2.5 API推“隐式缓存”,开发者成本最高降低75%
2025-05-10 11:14:00
IT之家 5 月 10 日消息,科技媒体 WinBuzzer 昨日(5 月 9 日)发布博文,报道称谷歌为其 Gemini 2.5 API,推出了“隐式缓存”(Implicit Caching)功能,自动识别并重用 API 请求中的常见前缀,开发者的成本最高可以降低 75%。
该功能适用于 Gemini 2.5 Pro 和 Gemini 2.5 Flash 模型,自动检测 API 请求中的重复前缀并加以重用,开发者的使用成本最高可以降低 75%。
IT之家注:与 2024 年 5 月推出的“显式缓存”(Explicit Caching)不同,隐式缓存无需开发者手动配置,系统默认开启,节省成本的同时大幅简化操作流程。
为帮助开发者充分利用隐式缓存,谷歌建议在构建提示词(Prompt)时,将稳定、常见的内容放在开头,后面再添加用户特定的变量内容。此外,短时间内发送具有相似前缀的请求也能提高缓存命中率。
谷歌还设定了最低 Token 数量要求:Gemini 2.5 Flash 需 1024 个 Token,Gemini 2.5 Pro 则需 2048 个 Token。API 响应中新增的“
cached_content_token_count”字段会显示缓存 Token 的使用情况和优惠计费详情。
与此同时,显式缓存仍作为可选方案,支持 Gemini 2.5 及 2.0 模型,允许开发者自定义缓存内容和生存时间(TTL,默认 1 小时)。
谷歌此举虽宣称成本节省 75%,但实际效果尚待第三方验证,且可能因使用模式不同而有所差异。
相关推荐
-
怀旧iPhone 6:消息称苹果为iPhone 17/Pro酝酿全新灰色 IT之家 7 月 23 日消息,科技媒体 majinbuofficial 今天(7 月 23 日)发布博文,消息称苹果内部正为 iPhone 17 标准版,测试新的灰色调,其灵感来自经典 iPhone 6 设计。上图为灰色版 iPhone 6IT之家援引博文报道,苹果公司曾计划在 2024 年推出的
实时讯息 07-23
-
大V探营:终于登上这样的大舞台 “设施服务齐备,可以闭眼冲!”昨天杨浦区V聚场内,知名游戏解说、B站UP主籽岷在为第二天的直播进行最后调试。吸音软包墙面阻隔外部噪音和回声,高品质的灯光系统确保了每一帧画面都能达到影视级标准,强大的设备支持解决了技术层面的后顾之忧。当设备调试、环境噪音、网络波动等“消耗”被技术手段压缩,创作者的精力
实时讯息 07-17
-
《上海市关于支持互联网优质内容创作的若干举措》政策问答 政策背景1.制定推出《上海市关于支持互联网优质内容创作的若干举措》(简称《若干举措》)的主要目的是什么?答:互联网优质内容是讲好中国故事、展示城市形象的重要支撑。支持推动互联网优质内容创作,是培育文化新质生产力、提升城市软实力的战略布局。当前,互联网内容创作行业发展迅速,上海始终欢迎并竭诚助力相关企
实时讯息 07-15
-
微软推送Win10 WinRE更新KB5063523,修复4月补丁安装失败问题 IT之家 7 月 13 日消息,在 2025 年 7 月“补丁星期二”配套推送的月度动态更新中,微软面向 Windows 10 21H2 与 22H2 版本发布了新的 Windows Recovery Environment(WinRE)更新 KB5063523,专门解决今年 4 月 KB50575
实时讯息 07-13
-
三轮车取名“问界”“智界”,公司道歉 就网络热议的三轮车取名“问界”“智界”事件,7月10日,涉事方重庆宗申车辆有限公司、江苏宗申电动车有限公司(以下简称“宗申电动车”)通过微信公众号“宗申智慧出行”发表致歉声明,表示已立即整改相关产品命名,下架并停止传播所有相关争议内容,全面加强内部审核机制。宗申致歉,承认涉嫌侵犯“问界”“智界”商标
实时讯息 07-11