首页
梁园区
睢阳区
永城市
夏邑县
虞城县
柘城县
宁陵县
睢县
民权县
示范区
首页
梁园区
睢阳区
永城市
夏邑县
虞城县
柘城县
宁陵县
睢县
民权县
示范区
民权县
>
正文
<谷歌深夜放性价比“猛兽”!>
2026-05-07 13:51:00
新浪新闻
智东西3月4日报道,今日凌晨,Gemini 3.1 Flash-Lite正式发布,谷歌官方介绍该模型为Gemini 3系列中速度最快、性价比最高的模型,专为应对大规模开发者工作负载而设计。根据Artificial Analysis基准测试,Gemini 3.1 Flash-Lite的首Token响应速度较2.5 Flash提高2.5倍,每秒输出Tokens数达389个,排名第一,较2.5 Flash提升45%,此时保持了与2.5 Flash相近或更高的生成质量。该模型还可以用来创建一个能够为企业落实多种多步骤任务的SaaS Agent。即日起,Gemini 3.1 Flash-Lite预览版将通过Google AI Studio的Gemini API向开发者开放,此时企业用户可通过Vertex AI平台采用。例如,Gemini 3.1 Flash-Lite可以在很短的时间内将数百个不同类别的商品填入一个电商网站的线框原型中。Gemini 3.1 Flash-Lite能够利该范围,实时生成动态的气象仪表盘。有网友说:“思维水平功能彻底改善了游戏。“用户可以将简易的查询路由到低思维模式,将复杂的任务路由到高思维模式。除原始性能外,Gemini 3.1 Flash-Lite在AI Studio和Vertex AI平台标配“ thinking levels”调节功能,开发者可灵活控制模型在任务中的“思考深度”。从行业应用的角度看,这种“够用且不贵”的模型往往比一味追求参数规模的办法更具落地价值。这不仅节省了成本,还提高了架构的灵活性。更有网友直接将Gemini 3.1 Flash-Lite比喻成了“野兽”,并称“这不仅仅是迭代,它是开发者的生产力倍增器。Gemini 3.1 Flash-Lite在价格上拉低了大模型高频调用的门槛。”在这个追求降本增效的时代,Gemini 3.1 Flash-Lite既要质量,又要速度,还要低成本,为AI应用的规模化落地提供了一种新解法。Gemini 3.1 Flash-Lite既能处理大规模成本优先任务,如批量翻译、内容审核等,也能处理如生成用户界面/仪表盘、创建模拟仿真、执行多步指令等需要深度推理的复杂场景。其也可以快速分析和排序大量的多模态内容,例如图像。在谷歌的官宣推文下方,有不少外网网友都对这款模型的低成本、高效益强调赞叹。▲Artificial Analysis生成速度榜单(ai排行榜收获1432分的Elo评分,在推理基准测试GPQA Diamond中取得86.9%的分数,在多模态理解测试MMMU Pro的成绩达76.8%,超越前代大型模型如2.5 Flash。其可调节的“思考深度”,也让开发者能根据任务的实际需要灵活分配计算资源,避免了不必要的账单。Gemini 3.1 Flash-Lite定价为输入每百万tokens0.25美元(约合人民币1.73元),输出每百万tokens1.5美元(约合人民币10.35元)。谷歌本质上是在有限预算内,把“可用”和“够用”做了更务实的结合。
<
上一篇:国际人士:警惕日本军国|主义死灰复燃
热点排行
0
超九成受访者期【待】更多地方推出“票根优惠”
0
"农业社会化服务体系不断完善"
1
Anthropic与SpaceX签署算力协议 以满足日益上升的人工智能需求
2
电影《给阿嬷的情书》:书写中国人刻在骨血里"的"情义
3
"“五一”假期河南郑州文博机构参观人数超98万人次"
4
"中新健康|孩子出现这些症状,可能是哮喘早期信号"
5
中国蹦床队、艺术体操队世界冠军登榜仪<式召>开
6
春晚机器人"零失误",制作[还是现]实?
7
铁路“五一”假期运输8天累计发送|旅客1.59亿人次
8
跨越万里的劳动节:一位青田侨商的“全球《十二时辰》”
9
"逛展览赏非遗品美食 文旅融合激活冰城消费新活力"
今日商丘
新浪微博
商丘网
商丘日报