百科问答小站 logo
百科问答小站 font logo



做中文 NLP 的时候,大家为啥不用拼音? 第1页

  

user avatar   wu-wo-cao 网友的相关建议: 
      

首先这引入了两个新问题,多音字问题。同音字问题。然后。。。这还是要分词。所以意义在哪里。


user avatar   maigo 网友的相关建议: 
      

该从哪里开始吐槽呢?

  1. 给汉语文本注音本身就是一项颇有难度的NLP课题。
  2. NLP中的通用方法是以「词」为单位的。把汉字转换成拼音之后,如果依然是以字为单位,那么还是没法处理。如果要分词,那么没必要转换成拼音。



  

相关话题

  为什么不能有把中文想法直接转换成电脑程序的编程呢? 
  如何理解attention中的Q,K,V? 
  NLP文本分类的本质是不是其实是找相似,对于要分类的句子,在训练集里找最相似的句子? 
  在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks? 
  如何看待FAIR提出的8-bit optimizer:效果和32-bit optimizer相当? 
  如何评价1700亿参数的GPT-3? 
  为什么编程语言语法的设计不往缩小与自然语言的差别的方向发展,或者说在这个方向发展得这么慢呢? 
  数据挖掘、机器学习、自然语言处理这三者是什么关系?这几个怎么入门啊? 
  为什么Transformer要用LayerNorm? 
  准研一,导师NLP方向,导师接下了一个项目让我跟着手工标数据,请问是不是在PUA我? 

前一个讨论
虚拟电话号存在的意义到底是什么?
下一个讨论
JavaScript 有必要缓存 for 循环中的 Array.length 吗?





© 2025-06-17 - tinynew.org. All Rights Reserved.
© 2025-06-17 - tinynew.org. 保留所有权利