谷歌发布Gemini，多模态AI应用时代开启，相关标的梳理-玖儿的学习笔记

导语：谷歌发布了Gemini，一个基于多模态数据训练的大模型，具备处理高度复杂任务的能力。Gemini的发布意味着开启了多模态AI应用时代，能够无缝地理解、操作和组合不同类型的信息。该技术对视频分析、跨范围任务以及AI终端的发展都带来了重要影响。海康威视、大华股份、漫步者等相关公司有望受益于Gemini的推出。此外，Gemini Nano也加速了AI终端硬件创新的进程。但需注意到大模型领域竞争激烈和AI技术落地的风险。投资者应密切关注相关标的的动态。

由多模态数据演化而来的google Gemini，带来全面超越GPT4V的底气。根据第一财经数据，作为首个从开始即使用多模态数据训练的大模型， Gemini 大模型在具备原生多模态大模型的前提下，构建出三种不同量级：
Gemini Ultra：规模最大、能力最强，用于处理高度复杂的任务；
Gemini Pro：在各种任务上扩展的最佳模型；
Gemini Nano：用于端侧（on-device）任务的最高效模型。

作为原生多模态大模型的Gemini，其背后含义意味着它可以泛化并无缝地理解、操作和组合不同类型的信息，包括文本、代码、音频、图像和视频。根据谷歌表示，Gemini还是他们迄今为止最灵活的模型，能够高效地运行在数据中心和移动设备等多类型平台上。Gemini提供的 SOTA 能力将显著增强开发人员和企业客户构建和扩展 AI 的方式。

Gemini带来视频分析理解、跨范围任务可扩展模型以及AI终端的多维度共振。从本次Gemini的发布中，已具备同时识别和理解文本、图像、音频等能力。在图像基准方面的测试中，Gemini Ultra 不需要从图像中提取文本就能进行 OCR 处理，这凸显了 Gemin 内置的强大多模态能力，也初步显示了 Gemini 具有更复杂推理能力，梳理出相关视频数据卡位企业：【海康威视】【大华股份】【千方科技】【格灵深瞳】【苏州科达】【汇纳科技】【云从科技】等；

适用于特定任务和端侧的 Gemini Nano再度加速从AI PC到AI pin的AI终端变革：AI PC只是开始，大模型重构汽车、手机与机器人等各类终端，我们将全面迎来一轮AI终端硬件创新潮！相关标的梳理
【中科创达】【萤石网络】【漫步者】等；

风险提示：大模型领域行业竞争加剧；AI技术落地不及预期，政策落地不及预期。

1、本网站名称：99学社
2、本站永久网址：https://www.xueshe9.com
3、本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请点击跳转到免责声明页面处理。
4、本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报。
6、本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END