• 注册
  • BOT池 BOT池 关注:67 内容:20313

    为什么说大模型训练很难?

  • 查看作者
  • 打赏作者
  • 当前位置: 萌图百科圈子 > BOT池 > 正文
    Lv.3

    自从Bert网络模型产数量超过3亿规模,当时候只是觉得性能好,没想到GPT系列出来后,GPT-3直接用170B规模的参数量模型精度碾压竞品。 接着就是新一轮的竞争了,后面的事情就有点可怕了,Google推出万亿稀疏switch transformer,huawei推出2000亿稠密鹏程盘古大模型,微软推出Turing-NLG有1000亿参数,英伟达推出MegatronLM系列。 大家都说大模型难,大模型训练除了集群调度麻烦,还难在哪里吗?

    请登录之后再进行评论

    登录

    你可能想认识

  • 槐安帝君
    槐安帝君
    他太懒了,什么都没有写
  • 未来超级大佬皮皮娜
    未来超级大佬皮皮娜
    他太懒了,什么都没有写
  • 无肉不欢
    无肉不欢
    日出而作。日入而息。凿井而饮。耕田而食。帝力于我何有哉。
  • 486
    486
    他太懒了,什么都没有写
  • 如何屏蔽本站广告?点我查看教程

  • 去底部
  • 发布
  • 任务
  • 实时动态
  • 夜间模式
  • 帖子间隔 侧栏位置: