百度把文心4.5全家桶扔进开源菜市场:47B、3B、0.3B随你挑,还带切菜教程

AI资讯5天前发布 能自力
93 0
百度把文心4.5全家桶扔进开源菜市场:47B、3B、0.3B随你挑,还带切菜教程

温馨提示:本文会大量使用“傻瓜式”“白菜价”等词汇,但模型确实免费,放心白嫖。

一、发生了什么?

6 月 30 日,百度突然把文心 4.5 系列共 10 款模型 打包开源,像摆摊一样往 GitHub、Hugging Face、飞桨星河社区一甩:
“各位乡亲,模型随便拿,教程管饱!”

二、模型全家福,一张表秒懂

型号身材特色适合人群
ERNIE-4.5-300B-A47B47B MoE大力出奇迹,推理/知识任务霸榜不差显卡的土豪实验室
ERNIE-4.5-21B-A3B3B MoE小钢炮,数学推理依旧能打单卡 4090 玩家
ERNIE-4.5-0.3B0.3B Dense手机都能跑,麻雀虽小五脏俱全端侧极客、树莓派爱好者
其余 7 款各种尺寸文本 / 多模态任君选选择困难症请闭眼抓阄

三、技术黑话翻译机

  • 多模态混合专家(MoE)
    翻译:模型里住了一堆“专科医生”,看图的说图,码字的说字,互不抢饭碗,省电又高效。
  • 多维旋转位置编码
    翻译:给每个字/像素发一张“旋转木马门票”,让它知道自己在哪儿,防止串位。
  • 异构混合并行 + 负载均衡
    翻译:训练时像拼乐高,GPU/CPU/NPU 各干各的,谁都不摸鱼。
  • 4-bit / 2-bit 量化
    翻译:把模型压成“压缩饼干”,显存吃得少,速度还快,老显卡也能再战三年。

四、性能八卦榜单

百度把文心4.5全家桶扔进开源菜市场:47B、3B、0.3B随你挑,还带切菜教程
  • ERNIE-4.5-300B-A47B 在 28 个基准测试里把 DeepSeek-V3 “按在地上摩擦”,尤其在知识问答和逻辑推理赛道领先一个身位。
  • ERNIE-4.5-21B-A3B 用 1/10 的参数在数学任务上跟大哥平分秋色,堪称“参数界的五菱宏光”。

五、开发者工具箱

神器作用一句话安利
ERNIEKit微调、量化一条龙不会炼丹也能炼模型
FastDeploy一键上到 CPU/GPU/手机/车机部署比点外卖还快

六、如何白嫖?

七、彩蛋时间

  • 学生党:论文 baseline 有了,老板再问就是“基于文心 4.5”。
  • 创业者:0.3B 模型直接塞手机,App Store 文案可写“内置大模型”。
  • 百度:别谢我,下次请我喝奶茶就行。
© 版权声明

相关文章

暂无评论

暂无评论...