首页
梁园区
睢阳区
永城市
夏邑县
虞城县
柘城县
宁陵县
睢县
民权县
示范区
首页
梁园区
睢阳区
永城市
夏邑县
虞城县
柘城县
宁陵县
睢县
民权县
示范区
民权县
>
正文
《面壁智能等开源首个基于华为昇腾训练的1.58》
2026-05-26 16:18:01
新浪新闻
5月25日消息,该领域、OpenBMB开源社区,正式发布并开源其在低比特大模型训练方向的最新成果——BitCPM-CANN。这意味着,未来有望在手机上运行 60B 大模型,手机的智能会大幅提升。据介绍,相比传统 BF16 精度,BitCPM-CANN 在推理时期释放约6倍显存红利,与此同时将模型能力保留率维持在90%–97.2%。该范围内存,可以承载远超以往的模型能力;或者反过来说,同样的模型能力在同一款终端上运行,只需要过去 1/6 的内存。「2-bit」该行业行业的热门研究话题,也是在手机上运行更这一研究卡点之一。这款中国首个该领域华为昇腾实现端到端训练并开源的三值大模型,继5月23日在华为鲲鹏昇腾开这一商讨亮相后,今日正式将其全系列模型向全社会开放。2-bit 量化将模型权重压缩 6-8 倍,使其能存入手机闪存,如 4GB 内存能放 16B,再配合 MoE 与激活范围约束、能放 32B;若内存扩大到 8GB,则能将模型参数扩大到 60B。面壁智能强调,BitCPM-CANN 的亮相,标志着面壁智能高效大模型「小钢炮」在端侧落地的能力进一步跃升,同时也借助开源向中国端侧大模型赛道提交了一份新的答卷。
<
上一篇:《一战再战》北美首周票房创新高 优秀口碑加持
热点排行
0
德国【萨】尔布吕肯乒乓球俱乐部实现欧冠四连冠
0
油价居高不下,今年 4 月全球新能源|汽车注册量 160 万辆同比再度上升
1
亲近|土地
2
全国首例AI代写“种草笔记”案宣判 为“数字泔水”治理划红线
3
【文物“选秀”绽风华 浙江省馆藏文物定级珍品展亮相】
4
{中国AI企业背后的创新密码}
5
南非2026年一季度失业率升"至32."7%
6
工业遗产焕新 活化利用释放新活力
7
"第八届北京邻里节活动启幕 近百万居民共赴友邻之约"
8
中国牵头制定的首个产品碳足迹数字化国际标准成功立项
9
中方:将一如既往支持委"内"瑞拉维护自身主权、尊严和合法权利
今日商丘
新浪微博
商丘网
商丘日报