Gemini 3.1 Flash-Lite:面向大规模智能设计
谷歌近日推出全新AI模型Gemini 3.1 Flash-Lite,正式进入开发者预览阶段,可通过Google AI Studio和Vertex AI面向企业和开发者开放使用。该模型定位为高性能、低成本的轻量级AI解决方案,专为高并发、大规模工作负载设计,旨在满足实时性与效率并重的应用场景。 Gemini 3.1 Flash-Lite在性能上实现显著提升:相比前代2.5 Flash模型,其首次响应时间(Time to First Answer Token)提升2.5倍,输出速度提高45%,同时保持甚至超越原有质量水平。根据Artificial Analysis基准测试,其在推理与多模态理解能力方面表现优异,尤其在GPQA Diamond(86.9%)和MMMU Pro(76.8%)等权威评测中超越同级别模型,甚至优于部分更大型的前代Gemini模型。 在成本方面,Gemini 3.1 Flash-Lite定价极具竞争力:输入每百万token仅0.25美元,输出每百万token为1.50美元,大幅降低使用门槛,特别适合需要高频调用的场景,如内容翻译、敏感信息审核、用户界面生成、模拟系统构建等。 该模型还具备“智能思考层级”功能,开发者可在AI Studio和Vertex AI中灵活调节模型的推理深度,实现对复杂任务的精准控制。例如,它能快速填充电商原型图中的数百个商品信息,实时生成基于实时气象数据的动态仪表盘,或构建可执行多步骤任务的企业级SaaS代理。 目前,包括Latitude、Cartwheel和Whering在内的多家企业已率先接入该模型,反馈其在处理复杂指令、保持上下文一致性方面表现出色,兼具大模型的精准度与轻量模型的高效性。 谷歌表示,Gemini 3.1 Flash-Lite的发布标志着其在打造“高性价比、可扩展AI能力”道路上迈出关键一步,未来将支持更多开发者与企业构建更智能、更响应迅速的应用。目前该模型仍处于预览阶段,生成式AI技术仍在持续演进中。
