小米64亿大语言模型亮相C-Eval、CMMLU评测

作者：来源：中关村在线 2023-08-12 09:11:42

　

【资料图】

近日，小米的大语言模型MiLM-6B首次亮相C-Eval、CMMLU两大AI模型评测榜单。据悉，MiLM-6B在C-Eval总榜单中排名第10，同参数量级排名第1，而在CMMLU中文向大模型中则位列第1。C-Eval公布的数据显示，MiLM-6B模型在各个测试科目中的平均成绩表现良好。在STEM（科学、技术、工程和数学教育）的20个科目中，包括计量师、物理、化学、生物等多个项目都取得了较高的准确率。在10个社会科学科目中，除教育学和地理外，该模型在所有科目中都获得了较为理想的准确率。在人文科学的11个科目中，MiLM-6B在历史与法律基础上也有着不错的准确率表现。然而，尽管MiLM-6B模型在大多数科目中表现出了相对良好的准确度，但在法学、数学、编程、概率论、离散数学等科目上的表现仍有待提升。据了解，MiLM-6B是小米开发的一个大规模预训练语言模型，参数规模为64亿。

　

相关文章

最近更新

小米64亿大语言模型亮相C-Eval、CMMLU评测

2023-08-12
聚焦短板弱项青岛市持续推进背街小巷环境综合整治

2023-08-12
阿里组织变革后首份财报显改革效果，多业务“起飞” ，未来可期

2023-08-12
房山将评估转移群众原居住点地质风险，加快拟定安置方案

2023-08-12
“皮卡加盖”等于哈弗H5？车长近5.2米，没有七座真的可惜

2023-08-12
可能是北京胡同里最文艺的一条citywalk路线

2023-08-12
天空现黄色烟雾？河北平乡：酸性物质泄漏无人伤亡

2023-08-12
《极品飞车不羁》第4章宣传片:保时捷75周年纪念更新

2023-08-12
广西壮族自治区总工会组织150名农民工子女参加阳光少年工会夏令营

2023-08-12
非洲大黑机吧播放（30个非洲之最）

2023-08-12
家长教唆孩子将酒店门牌有房改有尸

2023-08-12
微保家庭意外险是真的吗还是假的？有必要买吗？

2023-08-12
压力挑战超预期，12%增长目标尚未实现古越龙山半年业绩同比持平

2023-08-12
美众议员反对再向乌提供大规模军事支持

2023-08-12
美国能源部12亿美元投资从空气中提取碳，巴菲特的西方石油“躺赢”

2023-08-12
燕京啤酒08月11日被深股通减持63.75万股

2023-08-12
第十一届茅盾文学奖揭晓获奖者为何是他们？

2023-08-12
关于鹏扬淳开债券型证券投资基金增聘基金经理的公告

2023-08-12
七月份的金融数据很不好，但是要坚信稳中向好

2023-08-12
张掖市市场监督管理局“线上+线下”双管齐下保障特殊食品安全

2023-08-12
科瓦西奇晒照纪念曼城英超首秀：强势开局！

2023-08-12
转出未交增值税账务处理（未交增值税账务处理）

2023-08-12
2-3！张本美和爆冷输球，朱芊曦力挽狂澜，平野美宇上演大逆转

2023-08-12
勇士VS太阳！美媒评揭幕战3大看点：杜兰特迎战追梦保罗复仇老东家

2023-08-12
联合国成功转移也门“萨菲尔”号上的原油

2023-08-12
骨汤麻辣烫是真骨汤吗_骨汤麻辣烫

2023-08-12
广东梅州：鼓励居民购房提取公积金作首付

2023-08-12
股票行情快报：大庆华科（000985）8月11日主力资金净买入122.66万元

2023-08-12
局座叫什么（局座是什么意思）

2023-08-12
想不火都难！将近25万人预约一加Ace 2 Pro

2023-08-12

精彩导读

首钢股份：2023年上半年实现营业收入573.68亿元，降本增效成果显著

天朝上品干红葡萄酒、波特酒斩获第十三届亚洲葡萄酒质量大赛金奖

股民提问芯动联科：公司所积累的MEMS技术能否用于开发味觉、嗅觉传感器？

锚定新兴产业、数字经济央地部署现代化产业体系建设

抄底资金持续涌入多只港股ETF规模突破百亿元

中国工程院院士邬贺铨：安全已成为数字经济发展焦点

热门资讯