20230907混元大模型速评:开启智能新时代,激活应用潜力

【中信证券传媒互联网】混元大模型速评:开启智能新时代,激活应用潜力

?2023年9月7日腾讯全球数字生态峰会上,腾讯混元大模型发布。腾讯混元大模型拥有超过千亿参数的规模,训练语料达到了2万亿个tokens,具有强大的中文理解能力、创作能力、逻辑推理能力以及可靠的任务执行能力,在三大常见的测试集上表现出色,中文、理科和数学等子项方面超越GPT-4。目前,混元已与腾讯的产品广泛对接集成,在腾讯云、腾讯广告、腾讯会议、腾讯文档、微信搜一搜等多个业务线提供智能服务、提高工作效率。

?混元大模型的主要突破在可靠性(提高回答准确率)、成熟性(处理复杂问题)两大方向。可靠性方面:混元大模型不完全依赖外部插件,通过基于探针技术方法在预训练阶段优化目标函数,相较于市场常见开源大模型Demon,将幻觉率降低30~50%。2)强化学习阶段针对诱导性提问加强识别,对陷阱问题的拒答率提高20%。成熟性方面:1)混元大模型在处理超长文本方面取得突破进展,可以完成4000字以上超长文本的处理和生成,在学术、法律等领域拓宽应用。2)提出思维链的新逻辑,强化问题拆解和分步思考的能力,让大模型在场景中的思维和逻辑能力显著提升。

?发布会中演示了三个混元大模型在腾讯内部的应用案例:1)腾讯会议,提升口语化文本的准确理解、超长记录高效提炼、实时理解会议内容并生成解答,测试阶段在指令理解、会中问答、会议摘要、会议待办项等各种应用场景效果胜过GPT3.5。2)腾讯文档,能够胜任总结、翻译、润色、生成文书规范等多项文本生成场景,并可以进行excel公式生成和图表制作。3)腾讯广告,智能高效生成广告素材,测试中42%受访者认为混元相较Midjourney和SD的效果更佳。

?我们认为当前AI产业的进程下,应用场景落地与产业变革是关键。混元大模型发布将公司的社交平台、企业服务、广告、游戏等众多板块带来业务增量和效率提升,公司同时在底层算力和行业大模型生态方面持续加强建设,有望在人工智能新时代进一步发挥优势,释放更大商业潜力。

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容