谷歌Gemini 2.5 API推“隐式缓存”,开发者成本最高降低75%
2025-05-10 11:14:00
IT之家 5 月 10 日消息,科技媒体 WinBuzzer 昨日(5 月 9 日)发布博文,报道称谷歌为其 Gemini 2.5 API,推出了“隐式缓存”(Implicit Caching)功能,自动识别并重用 API 请求中的常见前缀,开发者的成本最高可以降低 75%。
该功能适用于 Gemini 2.5 Pro 和 Gemini 2.5 Flash 模型,自动检测 API 请求中的重复前缀并加以重用,开发者的使用成本最高可以降低 75%。
IT之家注:与 2024 年 5 月推出的“显式缓存”(Explicit Caching)不同,隐式缓存无需开发者手动配置,系统默认开启,节省成本的同时大幅简化操作流程。
为帮助开发者充分利用隐式缓存,谷歌建议在构建提示词(Prompt)时,将稳定、常见的内容放在开头,后面再添加用户特定的变量内容。此外,短时间内发送具有相似前缀的请求也能提高缓存命中率。
谷歌还设定了最低 Token 数量要求:Gemini 2.5 Flash 需 1024 个 Token,Gemini 2.5 Pro 则需 2048 个 Token。API 响应中新增的“
cached_content_token_count”字段会显示缓存 Token 的使用情况和优惠计费详情。
与此同时,显式缓存仍作为可选方案,支持 Gemini 2.5 及 2.0 模型,允许开发者自定义缓存内容和生存时间(TTL,默认 1 小时)。
谷歌此举虽宣称成本节省 75%,但实际效果尚待第三方验证,且可能因使用模式不同而有所差异。
相关推荐
-
谷歌Gemini 2.5 API推“隐式缓存”,开发者成本最高降低75% IT之家 5 月 10 日消息,科技媒体 WinBuzzer 昨日(5 月 9 日)发布博文,报道称谷歌为其 Gemini 2.5 API,推出了“隐式缓存”(Implicit Caching)功能,自动识别并重用 API 请求中的常见前缀,开发者的成本最高可以降低 75%。该功能适用于 Gemin
实时讯息 05-10
-
电影票退票难题,你也遇到过吗? 日前,全国消协发布投诉热点分析及典型案例,其中两起案例与人们看电影有关,一起为消费者退票难问题,一起为影院“软强制”要求消费者购买3D眼镜问题。全国消协认为,影院和平台拒绝退票不符合行业发展趋势与市场公平原则。另外,作为观看3D电影服务的必要组成部分和基本工具,影院提供3D眼镜与提供座位、音响系统等
实时讯息 05-10
-
网易《逆水寒》手游画质提升堪比实景,3.1.1周年庆新版本将至 IT之家 5 月 9 日消息,网易《逆水寒》手游于 4 月 25 日更新到 2.3.3 版本,首次运用动态气雾、镜面反射、会呼吸的植被、类影视级模型,以及“写实环境光照”等效果,让部分经典地图焕然一新。版本更新后,一位名叫“年少模样”的逆水寒玩家,在各个平台发布了名为《磁州一日游》的视频,堪比实景的
实时讯息 05-09
-
一揽子金融政策如何稳市场稳预期?专家解读→ 5月7日上午,国务院新闻办举行新闻发布会,中国人民银行、国家金融监督管理总局、中国证券监督管理委员会负责人介绍了“一揽子金融政策支持稳市场稳预期”有关情况。一揽子政策会给楼市股市带来怎样的支持?又将如何支持小微企业和民营企业?我们来听北京师范大学教授经济学专家万喆的解读。供需两端协同发力构建新的楼市
实时讯息 05-08
-
图像生成新星Recraft获3000万美元B轮融资 IT之家 5 月 6 日消息,在图像生成领域一鸣惊人的初创公司 Recraft 宣布完成了一轮 3000 万美元(IT之家注:现汇率约合 2.17 亿元人民币)的 B 轮融资,本轮融资由 Accel 领投,Khosla Ventures 和 Madrona 等投资机构也参与其中。Recraft 总部
实时讯息 05-06