导语:谷歌发布了Gemini,一个基于多模态数据训练的大模型,具备处理高度复杂任务的能力。Gemini的发布意味着开启了多模态AI应用时代,能够无缝地理解、操作和组合不同类型的信息。该技术对视频分析、跨范围任务以及AI终端的发展都带来了重要影响。海康威视、大华股份、漫步者等相关公司有望受益于Gemini的推出。此外,Gemini Nano也加速了AI终端硬件创新的进程。但需注意到大模型领域竞争激烈和AI技术落地的风险。投资者应密切关注相关标的的动态。
由多模态数据演化而来的google Gemini,带来全面超越GPT4V的底气。根据第一财经数据,作为首个从开始即使用多模态数据训练的大模型, Gemini 大模型在具备原生多模态大模型的前提下,构建出三种不同量级:
Gemini Ultra:规模最大、能力最强,用于处理高度复杂的任务;
Gemini Pro:在各种任务上扩展的最佳模型;
Gemini Nano:用于端侧(on-device)任务的最高效模型。
作为原生多模态大模型的Gemini,其背后含义意味着它可以泛化并无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。根据谷歌表示,Gemini还是他们迄今为止最灵活的模型,能够高效地运行在数据中心和移动设备等多类型平台上。Gemini提供的 SOTA 能力将显著增强开发人员和企业客户构建和扩展 AI 的方式。
Gemini带来视频分析理解、跨范围任务可扩展模型以及AI终端的多维度共振。从本次Gemini的发布中,已具备同时识别和理解文本、图像、音频等能力。在图像基准方面的测试中,Gemini Ultra 不需要从图像中提取文本就能进行 OCR 处理,这凸显了 Gemin 内置的强大多模态能力,也初步显示了 Gemini 具有更复杂推理能力,梳理出相关视频数据卡位企业:【海康威视】【大华股份】【千方科技】【格灵深瞳】【苏州科达】【汇纳科技】【云从科技】等;
适用于特定任务和端侧的 Gemini Nano再度加速从AI PC到AI pin的AI终端变革:AI PC只是开始,大模型重构汽车、手机与机器人等各类终端,我们将全面迎来一轮AI终端硬件创新潮!相关标的梳理
【中科创达】【萤石网络】【漫步者】等;
风险提示:大模型领域行业竞争加剧;AI技术落地不及预期,政策落地不及预期。
暂无评论内容