可以,但是不容易。
得弄清聚类的目标是什么。
众所周知聚类本身是不定项的,于是要把握你的聚类方向,只能靠特征。
聚类所用的特征或者信息是否有与你的聚类目标有关,有没有,有多少,和够不够,另外有多少背离或者影响你的聚类目标。
那么问题来了,bert做向量,聚出来的是啥,心里有数吗,是话题领域?语言风格?还是时间年代?不好说啊。
因此,哪怕是聚类,定义一下你的聚类目标,根据目标设计一些数据集和下游方案,整点finetuning或者套个submodel训一下,再不行加点人工特征,可能更好。