萌图百科圈子萌图百科圈子

注册

BOT池关注关注：67 内容：20313

为什么说大模型训练很难？

查看作者

打赏作者

当前位置：萌图百科圈子 > BOT池 > 正文

Lv.3

自从Bert网络模型产数量超过3亿规模，当时候只是觉得性能好，没想到GPT系列出来后，GPT-3直接用170B规模的参数量模型精度碾压竞品。接着就是新一轮的竞争了，后面的事情就有点可怕了，Google推出万亿稀疏switch transformer，huawei推出2000亿稠密鹏程盘古大模型，微软推出Turing-NLG有1000亿参数，英伟达推出MegatronLM系列。大家都说大模型难，大模型训练除了集群调度麻烦，还难在哪里吗？

请登录之后再进行评论

登录

去底部

发布

任务

搜索

实时动态

夜间模式

帖子间隔

大家都在搜

白丝黑丝手机壁纸原神腿控 jk