(资料图片仅供参考)
事件:4月10日下午,在商汤技术交流日活动上,公司宣布推出大模型体系“日日新大模型”,对市场高度关注的语言问答和文生图能力做了多种应用场景的实机演示。“日日新大模型”包括自然语言生成、文生图、感知模型标注、以及模型研发功能。商汤称其大模型从2019年开始研发,目前整体参数量达到5000亿,今年目标达到万亿。
点评:商汤“大模型+大算力”解决方案,落地场景实用性高,功能可用性强,综合表现超预期,大模型国产化进程持续加速,行业景气度提升。
商汤语言大模型基础质素优越,可覆盖多种实用落地场景用户最关心的功能模块--中文语言大模型应用平台“商量”参数量为1800亿,能力图谱广度深度兼备,与其质素相配。值得关注的几个落地情景有:1)编程助手,商汤称在其内部公司的测试中,代码助手将编程效率提升62%,HumanEval测试集一次通过率达到40.2%,商汤称该通过率高于微软此前公布的Copilot;2)问诊助手,模型通过多轮对话了解病情后才给出建议,更接近真实问诊体验,该功能已在新华医院在内的多家医院落地;3)PDF文件阅读助手,在向“商量”提供长达24页的《中国专利法》PDF文件后,“商量”能够快速理解法条内容,回答提问。
大模型将商汤在CV领域的深厚积累予以变现,多模态实力超预期看好商汤充分利用CV技术经验,通过跨模态和三维化相结合形成模型差异化竞争优势,并在游戏、直播等领域打开商空间。目前“日日新大模型”的定位是一款多模态深度学习模型,支持着商汤自研的生成式AI应用系列,包括文生图工具“秒画”、AI数字人生成工具“如影”、3D建模快速生成工具“琼影”和“格物”。以“秒画”为例,我们看到,产品实现了2秒出图,不需要额外编程和调试,用户可自定义生成图片的数量、分辨率、长宽比等,生成效果优越,整体体验可对标Midjourney。我们认为,商汤因其发展历史和业务特点,在CV领域拥有着行业领先地位,是其跨模态模型三维化表现超预期的核心原因,可支持其与百度“文心一言”等产品区别开来。
“大模型+大算力”提供解决方案,吸引下游用户投入模型迭代并开启商业化商汤的算力和算法皆无短板,具备支持外部客户的能力,有利于引进广泛的行业数据开启产品迭代和体验提升的正循环。根据商汤3月28日的财报,商汤在其智能计算基础设施-SenseCoreAI大装置上,基于2.7万块GPU的并行计算系统实现了5.0exaFLOPS的算力输出,可支持最多20个千亿参数量大模型同时训练,最高可支持万亿参数超大模型的训练。基于大装置,商汤目前已构建了CV、NLP、AIGC、多模态、决策智能等多个领域的大模型。目前商汤对外服务超过8家大型客户,包含科研机构、商业银行、游戏公司、互联网公司等,提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种大模型即服务(Model-as-a-Service)。
风险提示
1)技术发展不及预期风险;2)市场监管风险;3)版权风险。