
温馨提示:本文会大量使用“傻瓜式”“白菜价”等词汇,但模型确实免费,放心白嫖。
一、发生了什么?
6 月 30 日,百度突然把文心 4.5 系列共 10 款模型 打包开源,像摆摊一样往 GitHub、Hugging Face、飞桨星河社区一甩:
“各位乡亲,模型随便拿,教程管饱!”
二、模型全家福,一张表秒懂
型号 | 身材 | 特色 | 适合人群 |
---|---|---|---|
ERNIE-4.5-300B-A47B | 47B MoE | 大力出奇迹,推理/知识任务霸榜 | 不差显卡的土豪实验室 |
ERNIE-4.5-21B-A3B | 3B MoE | 小钢炮,数学推理依旧能打 | 单卡 4090 玩家 |
ERNIE-4.5-0.3B | 0.3B Dense | 手机都能跑,麻雀虽小五脏俱全 | 端侧极客、树莓派爱好者 |
其余 7 款 | 各种尺寸 | 文本 / 多模态任君选 | 选择困难症请闭眼抓阄 |
三、技术黑话翻译机
- 多模态混合专家(MoE)
翻译:模型里住了一堆“专科医生”,看图的说图,码字的说字,互不抢饭碗,省电又高效。 - 多维旋转位置编码
翻译:给每个字/像素发一张“旋转木马门票”,让它知道自己在哪儿,防止串位。 - 异构混合并行 + 负载均衡
翻译:训练时像拼乐高,GPU/CPU/NPU 各干各的,谁都不摸鱼。 - 4-bit / 2-bit 量化
翻译:把模型压成“压缩饼干”,显存吃得少,速度还快,老显卡也能再战三年。
四、性能八卦榜单

- ERNIE-4.5-300B-A47B 在 28 个基准测试里把 DeepSeek-V3 “按在地上摩擦”,尤其在知识问答和逻辑推理赛道领先一个身位。
- ERNIE-4.5-21B-A3B 用 1/10 的参数在数学任务上跟大哥平分秋色,堪称“参数界的五菱宏光”。
五、开发者工具箱
神器 | 作用 | 一句话安利 |
---|---|---|
ERNIEKit | 微调、量化一条龙 | 不会炼丹也能炼模型 |
FastDeploy | 一键上到 CPU/GPU/手机/车机 | 部署比点外卖还快 |
六、如何白嫖?
- 在线体验:直接冲 文心一言,免费薅。
- 下载地址:
– GitHub:PaddlePaddle/ERNIE
– Hugging Face:baidu 仓库
– 飞桨星河:aistudio.baidu.com - 技术报告:PDF 太长?打印当枕头也行——下载传送门
七、彩蛋时间
- 学生党:论文 baseline 有了,老板再问就是“基于文心 4.5”。
- 创业者:0.3B 模型直接塞手机,App Store 文案可写“内置大模型”。
- 百度:别谢我,下次请我喝奶茶就行。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...