NLP-预训练模型-2019-NLG：GPT-2【参数量：1542M；训练数据量：40GB】

左手的ㄟ右手 2023-09-25 15:44 134阅读 0赞

发表评论取消回复

表情：

评论列表（有 0 条评论，134人围观）

还没有评论，来说两句吧...

相关阅读

相关 NLP-预训练模型-201806-NLG：GPT-1【参数量：117M；训练数据量：1GB】【预训练：GPT使用单向语言模型；Fine-tuning：GPT、Task的参数一起训练】

![在这里插入图片描述][3068c6ce804e4581acf5efb5008283ee.png_pic_center] 预训练模型(Pretrained model)：一

╰+攻爆jí腚メ/ 2023年10月03日 12:26/ 0 赞/ 19 阅读

相关 NLP-预训练模型-2020

Transformer 是目前 NLP 研究领域中特别重要的模型，也衍生出了很多基于 Transformer 的方法，例如 BERT、GPT，在很多 NLP 任务中有很好的效果

水深无声/ 2023年10月01日 20:47/ 0 赞/ 66 阅读

相关 NLP-预训练模型-2018：Bert字典

-------------------- -------------------- -------------------- 参考资料： [我的BERT！改改字典，让

落日映苍穹つ/ 2023年10月01日 19:03/ 0 赞/ 21 阅读

相关 NLP-预训练模型-2019：XLM-Roberta【一种多语言预训练模型】

[《原始论文：Unsupervised Cross-lingual Representation Learning at Scale》][Unsupervised Cross-

心已赠人/ 2023年10月01日 11:12/ 0 赞/ 38 阅读

相关 NLP-预训练模型-2019：SpanBERT

![在这里插入图片描述][watermark_type_d3F5LXplbmhlaQ_shadow_50_text_Q1NETiBA5b-N6ICF44Gu5Lmx5aSq6Y

古城微笑少年丶/ 2023年10月01日 11:10/ 0 赞/ 40 阅读

相关 NLP-预训练模型-2019-NLU+NLG：UniLM（自然语言理解与生成的统一预训练语言模型）

UniLM论文全名为Unified Language Model Pre-training for Natural Language Understanding and Gen

谁践踏了优雅/ 2023年09月30日 10:27/ 0 赞/ 20 阅读

相关 NLP-预训练模型-2020-NLG：GPT-3【参数量：1750亿（175B）；训练数据量：570GB】

GPT-3依旧延续自己的单向[语言模型][Link 1]训练方式，只不过这次把模型尺寸增大到了1750亿，并且使用45TB数据进行训练。同时，[GPT-3][]主要聚焦于更通用

缺乏、安全感/ 2023年09月25日 15:44/ 0 赞/ 66 阅读

相关 NLP-预训练模型-2019-NLG：GPT-2【参数量：1542M；训练数据量：40GB】

2.1、GPT-2的核心思想 GPT-2的学习目标是使用无监督的预训练模型做有监督的任务。语言模型也能够学习某些监督学习的任务，并且不需要明确具体的监督符号。而监督学

左手的ㄟ右手/ 2023年09月25日 15:44/ 0 赞/ 135 阅读

相关 Audio-预训练模型-2019：vq-wav2vec

[vq-wav2vec: Self-Supervised Learning of Discrete Speech Representations - NASA/ADS][vq-

梦里梦外;/ 2023年09月25日 12:29/ 0 赞/ 64 阅读

相关 NLP预训练模型综述

现在深度学习越来越火了，在NLP领域主要使用CNNs、RNNs、GNNs以及attention机制。尽管这些模型取得了一些成绩，但是和CV相比，还是有些差距的，主

迈不过友情╰/ 2021年09月24日 13:34/ 0 赞/ 676 阅读