百科问答小站 logo
百科问答小站 font logo



BERT可以用于文本聚类吗? 第1页

  

user avatar   ceng-guan-rong-72 网友的相关建议: 
      

可以,但是不容易。

得弄清聚类的目标是什么。

众所周知聚类本身是不定项的,于是要把握你的聚类方向,只能靠特征。

聚类所用的特征或者信息是否有与你的聚类目标有关,有没有,有多少,和够不够,另外有多少背离或者影响你的聚类目标。

那么问题来了,bert做向量,聚出来的是啥,心里有数吗,是话题领域?语言风格?还是时间年代?不好说啊。

因此,哪怕是聚类,定义一下你的聚类目标,根据目标设计一些数据集和下游方案,整点finetuning或者套个submodel训一下,再不行加点人工特征,可能更好。




  

相关话题

  为什么编程语言语法的设计不往缩小与自然语言的差别的方向发展,或者说在这个方向发展得这么慢呢? 
  如何评价MSRA视觉组最新对spatial attention mechanism分析论文? 
  2021年人工智能领域有哪些关键性进展和突破? 
  如何看待华为 4 月 25 日发布的盘古智能大模型?在这个行业处于什么水平? 
  深度学习应用在哪些领域让你觉得「我去,这也能行!」? 
  深度学习与机器学习的关系是什么? 
  2021 年了,机器/深度学习还有哪些坑比较好挖? 
  谷歌翻译原理是什么,从语言A到B,中间是否要翻译成中介语言C(如英语)? 
  有监督和无监督学习都各有哪些有名的算法和深度学习? 
  为什么 Bert 的三个 Embedding 可以进行相加? 

前一个讨论
自然语言处理方向研究生好找工作吗?
下一个讨论
大学时在学科排名 A+ 的学院就读是什么体验?





© 2025-06-04 - tinynew.org. All Rights Reserved.
© 2025-06-04 - tinynew.org. 保留所有权利