华为:昇腾AI计算平台训练出准万亿MoE模型|界面新闻 · 快讯

AFtr9qmm 8 0

5月30日消息,华为宣布推出参数规模高达7180亿的全新模型盘古Ultra MoE,这是一个全流程在昇腾AI计算平台上训练的准万亿MoE模型。据悉,盘古团队提出Depth-Scaled Sandwich-Norm(DSSN)稳定架构和TinyInit小初始化的方法,在昇腾平台上实现了超过18TB数据的长期稳定训练。在训练方法上,华为团队首次披露在昇腾CloudMatrix 384超节点上打通大稀疏比MoE强化学习(RL)后训练框架的关键技术,使RL后训练进入超节点集群时代。

  • 猪价跌至年内低点,分析师:偏弱运行态势或将持续|界面新闻
  • “关税措施非法”,美国12州起诉特朗普政府|界面新闻 · 天下
  • 一季度健康险“开门红”, 今年能否突破万亿门槛?|界面新闻
  • 欧洲股市收盘涨跌不一|界面新闻 · 快讯
  • 默沙东中国区换帅,将由现日本区总裁接任|界面新闻
  • 广西龙胜山洪灾害8名失联人员均被找到,但已全部遇难|界面新闻 · 中国
  • 出资12.6亿美元,腾讯音乐拟收购喜马拉雅|界面新闻 · 科技
  • 【观察】2024年中国人口版图:20省份自然增长为负,人口竞争加剧|界面新闻 · 中国
  • 三年新增28000个实习岗,腾讯启动史上最大规模就业计划|界面新闻 · 科技
  • 国防部新闻发言人张晓刚就日本民用飞机侵闯中国钓鱼岛领空答记者问|界面新闻 · 快讯
  • 不要打“经济核战争”,华尔街金主喊话特朗普收手|界面新闻 · 天下
  • 北京环球度假区春日狂欢活动回归,引入多个热门IP主题体验|界面新闻 · 旅行
  • 康泰生物的应收账款比营收还多|界面新闻
  • 未及时披露4450万元对外财务资助,哈三联及三名公司高层被警示|界面新闻 · 证券
  • 医药研发外包公司的猴子可能要白囤了|界面新闻
  • 抱歉,评论功能暂时关闭!