7 月 7 日消息,百度于6 月 30 日一次性开源了文心大模型 4.5 系列的10款模型。这些模型涵盖从47B激活参数的混合专家(MoE)到轻量级0.3B稠密型模型,并支持文本和多模态等多种任务需求。值得注意的是,中兴通讯今日宣布其AiCube智算一体机在文心 4.5 开源当天便完成了全系列模型的适配。
据官方介绍,AiCube智算一体机成功完成了对ERNIE-4.5-300B-A47B等全系列模型的深度适配。这一成果主要得益于AiCube开放且灵活的智算基座架构,该系统原生支持文心4.5系列模型,并可选配昆仑芯P800 AI加速卡以提供更强性能支持。此外,AiCube还内置了一站式模型迁移工具,用户无需修改代码即可通过可视化界面快速完成模型部署,将传统数周的部署周期缩短至小时级。
借助昆仑芯P800超大显存的优势,AiCube实现了对文心4.5全系列模型的单机部署。针对多模态任务,通过软硬件深度集成和优化,确保了各组件之间的高效协同;同时采用创新的动态资源调度和缓存优化技术,有效缓解I/O瓶颈并显著提升了GPU利用率。这些多维优化技术充分挖掘了算力资源的潜力,为大模型提供了强大的性能支撑。
值得注意的是,AiCube 一体机不仅深度支持文心系列模型,还全面兼容Qwen3、DeepSeek等主流开源大模型。其底层架构采用模块化设计,旨在满足未来多模态模型的部署需求,并全面适配PyTorch、TensorFlow等主流AI框架。这种灵活的设计使得AiCube能够轻松应对当前及未来的多样化模型场景需求,打造了一机多模的“大模型统一底座”,显著降低了企业拥抱不同AI技术的门槛。
© 版权声明
文章版权归作者所有,未经允许请勿转载。