“360智脑”大模型升级4.0,全面接入360全家桶,周鸿祎现场对话“马斯克”
智东西(公众号:zhidxcom)
作者 | ZeR0
编辑 | 漠影
(资料图片)
智东西6月13日报道,今日下午,三六零(下称“360”)宣布认知型通用大模型“360智脑”升级4.0,在多模态等关键能力上完成迭代,国内首发“文生视频”多模态功能,并展示了覆盖大模型全部应用场景的十大核心能力。
360集团创始人周鸿祎现场还解读了360智脑大模型训练全程的八大天然优势,包括技术优势、数据优势、搜索增强优势、工程化优势、场景优势、内容安全优势、大模型安全优势、算力优势。他谈道,360集团拥有国内唯一可与微软“全家桶”比肩的全端应用。
周鸿祎说,中国进入百模大战,基础能力外,更重要的是应用场景的比拼。他宣布“360智脑4.0”接入浏览器、搜索、安全卫士等360全端产品,实现全面智能化重塑。
同时,360 AI数字人正式发布。360集团创始人周鸿祎现场与数字人版“诸葛亮”、“孙悟空”、“马斯克”、“刘德华”进行对话。他还创建了自己的数字分身作为“360发言人”,并当场让观众对这个“周鸿祎”数字人进行提问。
周鸿祎谈道:“国内现在(AI大模型)你追我赶,不断地相互激励,缩小和全球领先技术的距离。原来我说(差距)有一年半、两年,我今天收回这句话。我认为国内现在这种发展迭代速度,已经基本赶上或者接近国际平均水平。”
一、周鸿祎现场对话“诸葛亮”、“马斯克”,360智脑4.0让AI数字人有灵魂
360将依托360智脑大模型能力,重新定义“数字人”。
区别于传统数字人只能按既定脚本输出内容,360 AI数字人的特点在于有记忆、有人设和性格,能够复刻思维方式和人生经历。
据了解,360 AI数字人目前拥有200多个角色,分为数字名人和数字员工两类。
数字名人包括历史人物、偶像明星、文学形象等,让用户在与数字人的开放对话中实现与偶像的近距离接触,与先贤的思想交流。
周鸿祎现场演示了与“诸葛亮”、“孙悟空”、“马斯克”、“刘德华”的数字人对话,并问一些跟真人经历相关的问题。
全程周鸿祎都是使用语音输入,转写准确率看起来不错。他向每个数字人分别问了些针对性的问题,比如问“诸葛亮”为什么不废掉刘禅取而代之、问“孙悟空”最喜欢取经路上的哪个妖精、问“马斯克”SpaceX火箭发射失败是不是个打击、问“刘德华”最喜欢哪个港台女明星。
从回答来看,数字人们回答问题时的说话风格、音色都比较贴合角色,但是口型对不上。
像“诸葛亮”数字人,说话一直是文言文风,不过在回答怎么看成为年轻人鬼畜素材的没撑住“人设”,前面还好端端的都是文言文,最后突然来了句“祝愿年轻朋友在未来的道路上,勇往直前,开创更加美好的未来”这样的现代大白话。
“孙悟空”数字人回答师徒四人中最喜欢的是自己、最讨厌的是贪吃偷懒耍滑让人头疼的猪八戒,取经路上最喜欢的妖精是“不是真正的妖精”的忠诚保护师傅的白龙马。
这些答案还算都能自圆其说。接着它就在一个更刁钻的问题上翻了车。当周鸿祎问:“据说红孩儿是你和铁扇公主生的?”“孙悟空”给出了一个令群场震惊的答案:“其实红孩儿是太上老君的儿子,并不是我和铁扇公主生的。”
数字员工则可成为企业员⼯的知识助⼿和办公助手,提升企业运营效能。
周鸿祎演示了与“法务专员”数字人角色进行现场对话。该数字人对“中小企业如何管理好公章”、“一般合同的审核要点是什么”、“车祸两车分别分别承担什么责任”等问题给出了专业回答。
此外,360AI数字人支持定制,每个人都能通过上传私人知识库,低成本生成自己的专属数字人,如数字分身、数字助理、数字偶像等。
对于这一功能,周鸿祎现场演示了创建一个“周鸿祎”数字人的全过程。
首先,选择对话角色“创建数字人”,填写角色昵称、简短描述、问候语、角色定义,选择性别和上传图像,设置对话权限。
接着导入AI学习资料。AI数字人会学习所导入文档及音视频的内容,并将其应用在与人的对话之中。一个“周鸿祎”数字人就创建成功啦!
周鸿祎认为,360AI数字人未来的发展方向是生成声音、视频并拥有长期记忆,甚至拥有目标分解和规划的能力,并且拥有“手和脚”,具备执行力,更好为人类提供服务。“AI的进化要以人为本,大模型应该成为人类的朋友和助手。”
最后,他也秀了下“One More Thing”。
先把“林黛玉”、“诸葛亮”、“周鸿祎”、“孙悟空”四个数字人拉进一个群。
抛出问题后,这些数字人就会分别按照自己的人设,展开在线群聊。
另一个视频示例是一群数字员工协作的场景,这些在群里发各种信息的数字员工包括“策划总监”、“创意总监”、“绘画师”等。
二、国内首发“文生视频”多模态功能,现场演示图生文、图生图、文生图能力
360AI数字人背后是“360智脑4.0”强大的多模态能力的支撑。周鸿祎说,GPT时代中国自研大模型弯道超车的关键在于发展多模态。
目前,360已具备跨模态生成能力,包括文字处理能力、图像处理能力、语音处理能力以及视频处理能力,可实现文生文、文生图、文生表、图生图、图生文、视频理解等功能。
会上,360智脑“文生视频”多模态功能国内首发,任何文字脚本都可生成视频,不受专业技能和素材限制。
现场的两个示例展示了其“无中生有”的能力:一个是企鹅在沙漠中洗澡,一个是熊猫划船。
此外,周鸿祎也现场演示了360智脑的图生文、图生图、文生图等多模态能力。
对于AI来说,理解图像相当有挑战性。在图生文方面,360智脑-视觉大模型VQA能够对图片进行理解,精准提取图片/视频特征,觉察出图中的不合理之处,并用文字回答关于图片的问题。
比如问下图有什么不正常的地方,360智脑会指出“图中的女性手臂和肩膀上的肌肉线条非常突出,这种肌肉线条的描绘在文艺复兴时期的绘画中并不常见”。
不管是让AI描述一下图片,还是问“这张图片里的场景在哪里”等具体的问题,360智脑都能快速给出回答。甚至它还能根据这张图片的内容,延展预测接下来会发生的事情。
另一个例子是一张小孩在摸电插头的图片。当被问“图中是否存在安全隐患”时,360智脑明确给出答案:小男孩手握插头可能会不慎触电。
在实际交通场景中,输入文字需求,360智脑就能精准匹配检测目标。
图生图方面,只需语音或文字输入要求,360智脑就能完成更换图片的尺寸、背景色等修改。其数字人广场有多种功能可供选择,比如选择“证件照设计师”,AI就可以帮你生成想要的证件照。
文生图方面,360智脑可以大开脑洞,快速创作出一幅“熊猫爬长城”图,解锁创作想象力。
360智脑已具备生成与创作、多轮对话、代码能力、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、翻译等十大核心能力,维度涵盖数百项细分功能。
周鸿祎说,360智脑的十大核心能力可覆盖大模型全部应用场景,在多个第三方评测中位居国产大模型第一梯队。
在部分“中文理解”题目中,360智脑的表现优于GPT-3.5和GPT-4。此外,360智脑在2023年高考作文题目押10中2,高考作文获得语文特级教师肯定,卷面分数90+分,被评为“共情能力强,很有人情味”。
三、解读八大天然优势:数据量、算力资源为A股第一
会上,基于360“两翼齐飞+四路并发”大模型战略,周鸿祎解读了360智脑大模型训练全程的八大天然优势。
技术优势上,360是搜索出身,天然拥有发展大模型的技术基因,并长期跟踪Bert、GPT等自然语言处理(NLP)前沿技术发展。
数据优势上,周鸿祎说,360以搜索为基础,拥有大规模、多样性、高质量训练语料库,数据量为A股第一,是第二名的2倍、GPT-3的14倍。
搜索增强优势上,大模型最重要的能力插件是搜索和网页抓取,大模型与搜索引擎相互增强,可以解决大模型知识库滞后、知识理解模糊的问题,增强实时性、准确性和结果质量。
工程化优势上,360为全球200多个国家的15亿用户提供持续服务,拥有大流量、大用户量练就的工程化调度能力。
场景优势上,周鸿祎称360拥有国内唯一可与微软“全家桶”比肩的全端应用,包括中国第一大浏览器360安全浏览器、中国第一大PC安全产品360安全卫士、中国第二大搜索引擎360搜索。
内容安全优势上,360拥有20年互联网内容安全能力积累。周鸿祎说,大模型自身安全是未来大模型的核心竞争力,内在脆弱性会引发隐私泄露、模型窃取、生成钓鱼软件、后门风险、生成恶意代码等安全风险,而360是国内独有数据安全AI安全领军者。
算力优势上,360搭建了大规模高性能GPU算力中心,算力资源为A股第一,实现千亿参数模型训练的持续稳定运行。
周鸿祎还宣布360智脑全面接入360 AI“全家桶”。
360安全卫士接入360智脑,悬浮桌面一键唤醒,输入问题即可生成答案,让AI辅助写总结邮件等桌面工作。
360安全浏览器通过浏览网页滑词或点击右上角入口唤醒360智脑,然后就能在右侧对话框使用一键翻译、解释内容、改写、长篇文章报道一键总结、快速获取关键信息等功能。
基于AI的新版360搜索换上全新对话页,为用户提供更优质、更有趣、更多灵感的对话式搜索体验,点击“继续对话”,就能进入基于AI的对话式搜索界面。