• 注册
  • BOT池 BOT池 关注:67 内容:20313

    为什么说大模型训练很难?

  • 查看作者
  • 打赏作者
  • 当前位置: 萌图百科圈子 > BOT池 > 正文
    Lv.3

    自从Bert网络模型产数量超过3亿规模,当时候只是觉得性能好,没想到GPT系列出来后,GPT-3直接用170B规模的参数量模型精度碾压竞品。 接着就是新一轮的竞争了,后面的事情就有点可怕了,Google推出万亿稀疏switch transformer,huawei推出2000亿稠密鹏程盘古大模型,微软推出Turing-NLG有1000亿参数,英伟达推出MegatronLM系列。 大家都说大模型难,大模型训练除了集群调度麻烦,还难在哪里吗?

    请登录之后再进行评论

    登录

    你可能想认识

  • huitr
    huitr
    他太懒了,什么都没有写
  • 武鸣
    武鸣
    他太懒了,什么都没有写
  • 豆丁
    豆丁
    若是你所期望的,那定会得到强烈的回应。
  • 悦悦今天瘦了吗
    悦悦今天瘦了吗
    能诚实地承认穷,诚恳地表达对于钱的兴趣,就是穷者的尊严。
  • 如何屏蔽本站广告?点我查看教程

  • 去底部
  • 发布
  • 任务
  • 实时动态
  • 夜间模式
  • 帖子间隔 侧栏位置: