^-^
二次元/音乐/深度学习
BERT简介以及两种训练方式
字数总计:752   |   阅读估时:2分钟
  1. 写在前面
  2. 训练方式
    1. Masked Language Model
    2. Next Sentence Prediction