谷歌Gemini 2.5 API推“隐式缓存”,开发者成本最高降低75%
2025-05-10 11:14:00
IT之家 5 月 10 日消息,科技媒体 WinBuzzer 昨日(5 月 9 日)发布博文,报道称谷歌为其 Gemini 2.5 API,推出了“隐式缓存”(Implicit Caching)功能,自动识别并重用 API 请求中的常见前缀,开发者的成本最高可以降低 75%。
该功能适用于 Gemini 2.5 Pro 和 Gemini 2.5 Flash 模型,自动检测 API 请求中的重复前缀并加以重用,开发者的使用成本最高可以降低 75%。
IT之家注:与 2024 年 5 月推出的“显式缓存”(Explicit Caching)不同,隐式缓存无需开发者手动配置,系统默认开启,节省成本的同时大幅简化操作流程。
为帮助开发者充分利用隐式缓存,谷歌建议在构建提示词(Prompt)时,将稳定、常见的内容放在开头,后面再添加用户特定的变量内容。此外,短时间内发送具有相似前缀的请求也能提高缓存命中率。
谷歌还设定了最低 Token 数量要求:Gemini 2.5 Flash 需 1024 个 Token,Gemini 2.5 Pro 则需 2048 个 Token。API 响应中新增的“
cached_content_token_count”字段会显示缓存 Token 的使用情况和优惠计费详情。
与此同时,显式缓存仍作为可选方案,支持 Gemini 2.5 及 2.0 模型,允许开发者自定义缓存内容和生存时间(TTL,默认 1 小时)。
谷歌此举虽宣称成本节省 75%,但实际效果尚待第三方验证,且可能因使用模式不同而有所差异。
相关推荐
-
台积电子公司将发行价值100亿美元新股,以降低外汇避险成本 来源:界面新闻6月25日,台积电代子公司TSMC Global公告,董事会计划发行价值100亿美元的新股,主要用以降低外汇避险成本。
实时讯息 06-25
-
3万加盟AI洗头机,暴富印钞机还是韭菜收割机? “北上广深”等一线城市,正在掀起一股AI洗头热。所谓“AI洗头”,就是在AI洗头吧或理发店等消费场景,智能设备AI洗头机取代人工,从洗发到烘干,只要按一下按钮,便可以为消费者提供一条龙式智能化洗头服务。AI洗头的价格各地不一,商家们为了引流,通常会将单次活动价格设置为5元、9.9元,比普通理发店一次
实时讯息 05-29
-
成本几分钱,如何1年狂赚100亿? 都说生意不好做,没想到2025年,有公司靠卖卡片一年就能赚100亿元。 日前,集换式卡牌领域龙头企业卡游向港股递交上市申请,其招股书数据格外吸睛:2024 年收入达100亿元,同比增长278%;毛利率71.3%,盈利成绩远超同行,甚至盖过潮玩界明星企业泡泡玛特。 同样因为踩上风口而成绩亮眼,
实时讯息 05-26
-
宁夏移动: 信息服务普惠万家 畅享数字生活新体验 为持续深化电信普惠成果,让更优质的用网体验走进千家万户,宁夏移动深入优化智能调度技术与内容分发网络(CDN)技术。面对不同APP服务器分布全国,内容传输存在丢包、时延问题,宁夏移动将云游戏、直播、短视频等热门内容源提前存放至本地互联网资源节点。用户访问内容无需再从遥远的应用服务器中心传输至个人终端,
实时讯息 05-15
-
学生做作业直接复制AI生成内容?教育部:明确禁止! 近日,教育部基础教育教学指导委员会发布《中小学人工智能通识教育指南(2025年版)》(以下简称《通识教育指南》)和《中小学生成式人工智能使用指南(2025年版)》(以下简称《使用指南》)。其中要求:小学阶段禁止学生独自使用开放式内容生成功能,教师可在课内适当使用辅助教学;初中阶段可适度探索生成内容的
实时讯息 05-13