多模态大模型进展不断，AI跨年行情看好，虹软科技、灵动Ai等值得关注-玖儿的学习笔记

导语：最近多模态大模型的进展不断，引发了市场对AI板块的热情。语言模型技术路径已经相对收敛，而视频生成模型仍处于探索期。多模态数据能够更真实地反映物理世界属性，并有更广阔的应用前景。在多模态模型应用场景上布局良好的公司值得关注。虹软科技、灵动Ai、万兴科技、中科创达、海康威视、大华股份、萤石网络等公司都是值得投资者关注的标的。在新的一年，AI板块有望迎来更好的发展。

近期Pika的出圈，以及谷歌Gemini 1.0效果全面超越GPT-4，以及国内众多厂商基于大模型推出各类应用，引发市场对AI板块的新一轮热情，我们继续看好AI板块接下来表现。

#大语言模型技术路径已收敛，而视频生成模型仍处于探索期
在OpenAI的技术方向引领下，目前语言模型的技术路径基本就是GPT这一条路。而多模态技术方面，目前没有一家公司处于绝对领先地位，技术路径仍存在探索的可能。AI视频的生成面临流畅性、帧生成逻辑、协调性等等问题，模型需要生成每一帧发生的事情，而用户的prompt往往非常简略，无法像图像生成一样为每一帧提供详细的描述，种种原因都导致了目前AI视频生成技术仍无法做到非常完美，技术路线也多种多样。

#多模态数据能够更真实反映物理世界属性，能感知真实物理世界的多模态模型应用前景更加广阔
语言作为一种精炼的表述载体，可以对物理世界进行抽象描述，例如文生图和文生视频中，用户都可以用简短的一句话或者几句话来对想要生成的图像或视频进行描述。但是从承载的信息量来讲，语言所能承载的信息是远远不及图像和视频的。而多模态的数据例如图像、视频、音频、振动等信息，则更加能反映出物理世界的真实属性，是真正对于物理世界状态的感知，与人类感知世界的方式更加接近。我们认为，未来的多模态模型将能够真正实现对世界状态的完整感知，也因此能具备更多的应用场景。

#多模态是生成式AI下一步重点方向，百花齐放的应用场景有望探索
现阶段大语言模型的竞争已经非常激烈，从技术突破的角度来看，我们认为，下一阶段的重点攻克方向必然会是多模态技术。能够真正处理和应用好多模态AI能力，才能真正打通物理世界和数字世界的障壁，用最基础的感知世界能力直接生成操作，实现与物理世界最自然的交互。因此，基于多模态的应用场景仍需不断探索，AI视频生成仅仅是多模态技术路径中的一个小方向，多模态领域的ChatGPT时刻还未到来。

投资建议与投资标的
我们认为，在多模态模型应用场景上具备良好布局和卡位的公司值得关注。建议关注虹软科技、科大讯飞、万兴科技、中科创达、海康威视、大华股份、萤石网络。

1、本网站名称：99学社
2、本站永久网址：https://www.xueshe9.com
3、本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请点击跳转到免责声明页面处理。
4、本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报。
6、本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END