Google I/O大会Keynote:Gemini 1.5 Pro更新,API降价,AI基础设施迭代

导语:Google在I/O大会上发布Gemini 1.5 Pro支持更长上下文,并增强了多模态和应用软件生态。此外,他们还推出了开源模型迭代和降价的API。另外,他们宣布将于2024年推出TPU V6——Trillium,以及2025年初推出英伟达Blackwell云服务。

 

1、Gemini 1.5 Pro支持更长上下文
Gemini 1.5 Pro上下文长度将翻倍至2M Tokens,已经向开发人员提供预览,预计将在今年晚些时候向用户提供。

2、Gemini多模态和应用软件生态进一步增强
1)Ask Photos:Google Photos图像查找功能增强;
2)Project Astra:AI助手项目原型展示;
3)Imagen3:图像生成模型;
4)Veo:音乐生成模型;
5)Google AI Searech;
6)Gemini for Workspace:AI Teammate、Gmail等;
7)Gems:支持定制的AI助手;
8)安卓系统AI能力提升;

3、开源模型迭代
1)Gemini 1.5 Flash:轻量化模型,提升推理速度和效率,支持1M Tokens上下文;
2)PaliGemma:Google的第一个开源视觉模型;
3)Gemma 2开源模型:预计6月发布,新增27b模型(Gemma仅有7b和2b),更好地适配英伟达下一代GPU产品,同时也可以在Vertex AI的单一TPU主机运行;

4、API降价
1)Gemini 1.5 Pro:原价$7/M tokens,现对于128K以下Prompts,为$3.50/million tokens。
2)Gemini 1.5 Flash:对于128K以下Prompts定价为$0.35/M tokens。
注:以上均为输入口径,作为对照,GPT-4o是$5/M tokens,GPT-4 Turbo是$10/M tokens,GPT 3.5 Trubo是$0.5/M tokens。

5、AI基础设施更新
发布TPU V6——Trillium,预计将于2024年晚些推出,单芯片算力是上一代的4.7倍。预计将于2025年初提供英伟达Blackwell云服务。

© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容