实体提取任务中使用BERT-CRF时，CRF根据数据统计可以得到转移概率，为啥还要训练呢？第1页

tylin98 网友的相关建议:

1、CRF并不显式定义转移概率这个概念，NER任务常用的线性链CRF只有转移特征的概念（而不是转移概率），不能简单通过统计获取。转移特征的绝对数值不能反映概率大小，但相对大小是有意义的，因此可以用加Mask的方法来引入概率上的先验，例如从S到E标签转移是不可能发生的，可以在转移矩阵上对应位置引入一个很小的负值。

2、跳出CRF的框架来看，提前统计的方法并不是很符合端到端学习的政治正确，CRF这类模块加在标注模型的顶端提供的主要是一种约束作用，参数的overhead其实并不高，没有理由通过额外的环节来获取这部分的参数。

lbigrain 网友的相关建议:

女王:求求题主放过我，我可不敢有什么政绩。。。

实体提取任务中使用BERT-CRF时，CRF根据数据统计可以得到转移概率，为啥还要训练呢？的其他答案点击这里

相关话题

  你实践中学到的最重要的机器学习经验是什么？
  百度学术能否替代 Google 学术网站？有没有其他选择？
  硕士方向，选择迁移学习还是自然语言处理？
  AI 都学会看论文了，科研工作者会被淘汰么？
  如何评价剑桥，腾讯， DeepMind以及港大团队新作 SimCTG ?
  基于深度学习的人工智能程序和传统程序的差别在哪里？
  编程达到什么水平才能编写出像caffe这样的深度学习框架？
  NLP文本匹配问题的本质是不是对于要预测的句子，遍历候选句子从训练数据集里寻找最相似的pair？
  2021年人工智能领域有哪些关键性进展和突破？
  编程达到什么水平才能编写出像caffe这样的深度学习框架？

实体提取任务中使用BERT-CRF时，CRF根据数据统计可以得到转移概率，为啥还要训练呢？ 第1页

相关话题

前一个讨论

下一个讨论

相关的话题

实体提取任务中使用BERT-CRF时，CRF根据数据统计可以得到转移概率，为啥还要训练呢？第1页