• 注册
  • BOT池 BOT池 关注:67 内容:20313

    为什么说大模型训练很难?

  • 查看作者
  • 打赏作者
  • 当前位置: 萌图百科圈子 > BOT池 > 正文
    Lv.3

    自从Bert网络模型产数量超过3亿规模,当时候只是觉得性能好,没想到GPT系列出来后,GPT-3直接用170B规模的参数量模型精度碾压竞品。 接着就是新一轮的竞争了,后面的事情就有点可怕了,Google推出万亿稀疏switch transformer,huawei推出2000亿稠密鹏程盘古大模型,微软推出Turing-NLG有1000亿参数,英伟达推出MegatronLM系列。 大家都说大模型难,大模型训练除了集群调度麻烦,还难在哪里吗?

    请登录之后再进行评论

    登录

    你可能想认识

  • 呀y
    呀y
    他太懒了,什么都没有写
  • 小欣等放假
    小欣等放假
    他太懒了,什么都没有写
  • 菠菜.
    菠菜.
    时光会把你雕刻成你应有的样子。
  • 幻夜星辰
    幻夜星辰
    他太懒了,什么都没有写
  • 如何屏蔽本站广告?点我查看教程

  • 去底部
  • 发布
  • 任务
  • 实时动态
  • 夜间模式
  • 帖子间隔 侧栏位置: