“360智脑”大模型升级4.0，全面接入360全家桶，周鸿祎现场对话“马斯克”

智东西（公众号：zhidxcom）

作者 | ZeR0

编辑 | 漠影

(资料图片)

智东西6月13日报道，今日下午，三六零（下称“360”）宣布认知型通用大模型“360智脑”升级4.0，在多模态等关键能力上完成迭代，国内首发“文生视频”多模态功能，并展示了覆盖大模型全部应用场景的十大核心能力。

360集团创始人周鸿祎现场还解读了360智脑大模型训练全程的八大天然优势，包括技术优势、数据优势、搜索增强优势、工程化优势、场景优势、内容安全优势、大模型安全优势、算力优势。他谈道，360集团拥有国内唯一可与微软“全家桶”比肩的全端应用。

周鸿祎说，中国进入百模大战，基础能力外，更重要的是应用场景的比拼。他宣布“360智脑4.0”接入浏览器、搜索、安全卫士等360全端产品，实现全面智能化重塑。

同时，360 AI数字人正式发布。360集团创始人周鸿祎现场与数字人版“诸葛亮”、“孙悟空”、“马斯克”、“刘德华”进行对话。他还创建了自己的数字分身作为“360发言人”，并当场让观众对这个“周鸿祎”数字人进行提问。

周鸿祎谈道：“国内现在（AI大模型）你追我赶，不断地相互激励，缩小和全球领先技术的距离。原来我说（差距）有一年半、两年，我今天收回这句话。我认为国内现在这种发展迭代速度，已经基本赶上或者接近国际平均水平。”

一、周鸿祎现场对话“诸葛亮”、“马斯克”，360智脑4.0让AI数字人有灵魂

360将依托360智脑大模型能力，重新定义“数字人”。

区别于传统数字人只能按既定脚本输出内容，360 AI数字人的特点在于有记忆、有人设和性格，能够复刻思维方式和人生经历。

据了解，360 AI数字人目前拥有200多个角色，分为数字名人和数字员工两类。

数字名人包括历史人物、偶像明星、文学形象等，让用户在与数字人的开放对话中实现与偶像的近距离接触，与先贤的思想交流。

周鸿祎现场演示了与“诸葛亮”、“孙悟空”、“马斯克”、“刘德华”的数字人对话，并问一些跟真人经历相关的问题。

全程周鸿祎都是使用语音输入，转写准确率看起来不错。他向每个数字人分别问了些针对性的问题，比如问“诸葛亮”为什么不废掉刘禅取而代之、问“孙悟空”最喜欢取经路上的哪个妖精、问“马斯克”SpaceX火箭发射失败是不是个打击、问“刘德华”最喜欢哪个港台女明星。

从回答来看，数字人们回答问题时的说话风格、音色都比较贴合角色，但是口型对不上。

像“诸葛亮”数字人，说话一直是文言文风，不过在回答怎么看成为年轻人鬼畜素材的没撑住“人设”，前面还好端端的都是文言文，最后突然来了句“祝愿年轻朋友在未来的道路上，勇往直前，开创更加美好的未来”这样的现代大白话。

“孙悟空”数字人回答师徒四人中最喜欢的是自己、最讨厌的是贪吃偷懒耍滑让人头疼的猪八戒，取经路上最喜欢的妖精是“不是真正的妖精”的忠诚保护师傅的白龙马。

这些答案还算都能自圆其说。接着它就在一个更刁钻的问题上翻了车。当周鸿祎问：“据说红孩儿是你和铁扇公主生的？”“孙悟空”给出了一个令群场震惊的答案：“其实红孩儿是太上老君的儿子，并不是我和铁扇公主生的。”

数字员工则可成为企业员⼯的知识助⼿和办公助手，提升企业运营效能。

周鸿祎演示了与“法务专员”数字人角色进行现场对话。该数字人对“中小企业如何管理好公章”、“一般合同的审核要点是什么”、“车祸两车分别分别承担什么责任”等问题给出了专业回答。

此外，360AI数字人支持定制，每个人都能通过上传私人知识库，低成本生成自己的专属数字人，如数字分身、数字助理、数字偶像等。

对于这一功能，周鸿祎现场演示了创建一个“周鸿祎”数字人的全过程。

首先，选择对话角色“创建数字人”，填写角色昵称、简短描述、问候语、角色定义，选择性别和上传图像，设置对话权限。

接着导入AI学习资料。AI数字人会学习所导入文档及音视频的内容，并将其应用在与人的对话之中。一个“周鸿祎”数字人就创建成功啦！

周鸿祎认为，360AI数字人未来的发展方向是生成声音、视频并拥有长期记忆，甚至拥有目标分解和规划的能力，并且拥有“手和脚”，具备执行力，更好为人类提供服务。“AI的进化要以人为本，大模型应该成为人类的朋友和助手。”

最后，他也秀了下“One More Thing”。

先把“林黛玉”、“诸葛亮”、“周鸿祎”、“孙悟空”四个数字人拉进一个群。

抛出问题后，这些数字人就会分别按照自己的人设，展开在线群聊。

另一个视频示例是一群数字员工协作的场景，这些在群里发各种信息的数字员工包括“策划总监”、“创意总监”、“绘画师”等。

二、国内首发“文生视频”多模态功能，现场演示图生文、图生图、文生图能力

360AI数字人背后是“360智脑4.0”强大的多模态能力的支撑。周鸿祎说，GPT时代中国自研大模型弯道超车的关键在于发展多模态。

目前，360已具备跨模态生成能力，包括文字处理能力、图像处理能力、语音处理能力以及视频处理能力，可实现文生文、文生图、文生表、图生图、图生文、视频理解等功能。

会上，360智脑“文生视频”多模态功能国内首发，任何文字脚本都可生成视频，不受专业技能和素材限制。

现场的两个示例展示了其“无中生有”的能力：一个是企鹅在沙漠中洗澡，一个是熊猫划船。

此外，周鸿祎也现场演示了360智脑的图生文、图生图、文生图等多模态能力。

对于AI来说，理解图像相当有挑战性。在图生文方面，360智脑-视觉大模型VQA能够对图片进行理解，精准提取图片/视频特征，觉察出图中的不合理之处，并用文字回答关于图片的问题。

比如问下图有什么不正常的地方，360智脑会指出“图中的女性手臂和肩膀上的肌肉线条非常突出，这种肌肉线条的描绘在文艺复兴时期的绘画中并不常见”。

不管是让AI描述一下图片，还是问“这张图片里的场景在哪里”等具体的问题，360智脑都能快速给出回答。甚至它还能根据这张图片的内容，延展预测接下来会发生的事情。

另一个例子是一张小孩在摸电插头的图片。当被问“图中是否存在安全隐患”时，360智脑明确给出答案：小男孩手握插头可能会不慎触电。

在实际交通场景中，输入文字需求，360智脑就能精准匹配检测目标。

图生图方面，只需语音或文字输入要求，360智脑就能完成更换图片的尺寸、背景色等修改。其数字人广场有多种功能可供选择，比如选择“证件照设计师”，AI就可以帮你生成想要的证件照。

文生图方面，360智脑可以大开脑洞，快速创作出一幅“熊猫爬长城”图，解锁创作想象力。

360智脑已具备生成与创作、多轮对话、代码能力、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、翻译等十大核心能力，维度涵盖数百项细分功能。

周鸿祎说，360智脑的十大核心能力可覆盖大模型全部应用场景，在多个第三方评测中位居国产大模型第一梯队。

在部分“中文理解”题目中，360智脑的表现优于GPT-3.5和GPT-4。此外，360智脑在2023年高考作文题目押10中2，高考作文获得语文特级教师肯定，卷面分数90+分，被评为“共情能力强，很有人情味”。

三、解读八大天然优势：数据量、算力资源为A股第一

会上，基于360“两翼齐飞+四路并发”大模型战略，周鸿祎解读了360智脑大模型训练全程的八大天然优势。

技术优势上，360是搜索出身，天然拥有发展大模型的技术基因，并长期跟踪Bert、GPT等自然语言处理（NLP）前沿技术发展。

数据优势上，周鸿祎说，360以搜索为基础，拥有大规模、多样性、高质量训练语料库，数据量为A股第一，是第二名的2倍、GPT-3的14倍。

搜索增强优势上，大模型最重要的能力插件是搜索和网页抓取，大模型与搜索引擎相互增强，可以解决大模型知识库滞后、知识理解模糊的问题，增强实时性、准确性和结果质量。

工程化优势上，360为全球200多个国家的15亿用户提供持续服务，拥有大流量、大用户量练就的工程化调度能力。

场景优势上，周鸿祎称360拥有国内唯一可与微软“全家桶”比肩的全端应用，包括中国第一大浏览器360安全浏览器、中国第一大PC安全产品360安全卫士、中国第二大搜索引擎360搜索。

内容安全优势上，360拥有20年互联网内容安全能力积累。周鸿祎说，大模型自身安全是未来大模型的核心竞争力，内在脆弱性会引发隐私泄露、模型窃取、生成钓鱼软件、后门风险、生成恶意代码等安全风险，而360是国内独有数据安全AI安全领军者。

算力优势上，360搭建了大规模高性能GPU算力中心，算力资源为A股第一，实现千亿参数模型训练的持续稳定运行。

周鸿祎还宣布360智脑全面接入360 AI“全家桶”。

360安全卫士接入360智脑，悬浮桌面一键唤醒，输入问题即可生成答案，让AI辅助写总结邮件等桌面工作。

360安全浏览器通过浏览网页滑词或点击右上角入口唤醒360智脑，然后就能在右侧对话框使用一键翻译、解释内容、改写、长篇文章报道一键总结、快速获取关键信息等功能。

基于AI的新版360搜索换上全新对话页，为用户提供更优质、更有趣、更多灵感的对话式搜索体验，点击“继续对话”，就能进入基于AI的对话式搜索界面。

全球播报:“360智脑”大模型升级4.0，全面接入360全家桶，周鸿祎现场对话“马斯克”

“360智脑”大模型升级4.0，全面接入360全家桶，周鸿祎现场对话“马斯克”