首页
查找话题
首页
做中文 NLP 的时候,大家为啥不用拼音?
做中文 NLP 的时候,大家为啥不用拼音? 第1页
1
wu-wo-cao 网友的相关建议:
首先这引入了两个新问题,多音字问题。同音字问题。然后。。。这还是要分词。所以意义在哪里。
maigo 网友的相关建议:
该从哪里开始吐槽呢?
给汉语文本注音本身就是一项颇有难度的NLP课题。
NLP中的通用方法是以「词」为单位的。把汉字转换成拼音之后,如果依然是以字为单位,那么还是没法处理。如果要分词,那么没必要转换成拼音。
做中文 NLP 的时候,大家为啥不用拼音? 的其他答案 点击这里
1
相关话题
国内外厂商发布的各类 AI 智能音箱,优缺点分别是什么?
word2vec 相比之前的 Word Embedding 方法好在什么地方?
如何看待 ICLR2021 的拒稿被评为 ACL2021 的 Best Paper?
基于深度学习的自然语言处理在 2016 年有哪些值得期待的发展?
AI 都学会看论文了,科研工作者会被淘汰么?
为什么这么多 NLP 大牛硕士毕业去企业不留在学术界?
深度学习应用在哪些领域让你觉得「我去,这也能行!」?
NLP文本匹配问题的本质是不是 对于要预测的句子,遍历候选句子 从训练数据集里寻找最相似的pair?
cv/nlp等方向的就业困难是全球性的吗?
国内外厂商发布的各类 AI 智能音箱,优缺点分别是什么?
前一个讨论
虚拟电话号存在的意义到底是什么?
下一个讨论
JavaScript 有必要缓存 for 循环中的 Array.length 吗?
相关的话题
如何评价 2015 版的 Magi 搜索引擎?
AI领域的灌水之风如何破局?
如何看待 ICLR2021 的拒稿被评为 ACL2021 的 Best Paper?
如何评价MSRA视觉组最新对spatial attention mechanism分析论文?
如何看待学霸君的高考机器人 Aidam 高考全国文科数学卷考了 134 分?
在CV/NLP/DL领域中,有哪些修改一行代码或者几行代码提升性能的算法?
如何看待NLP领域最近比较火的prompt,能否借鉴到CV领域?
主题模型(topic model)到底还有没有用,该怎么用?
Transformer是如何处理可变长度数据的?
请问下大家训练 SimCSE 时, loss 有没有这样的情况?
如何理解Inductive bias?
如何评价浪潮发布的2457亿参数源1.0智能大模型?与GPT-3相比如何?处于AI模型领域什么水平?
做中文 NLP 的时候,大家为啥不用拼音?
请问刘知远老师提供的网易新闻标注数据集开源吗?
Pytorch有什么节省显存的小技巧?
请问下大家训练 SimCSE 时, loss 有没有这样的情况?
BERT可以用于文本聚类吗?
为什么 Siri 听懂了我的话,还是不能做出有效的回答或准确的操作?
Transformer是如何处理可变长度数据的?
有哪些令你印象深刻的魔改transformer?
Transformer是如何处理可变长度数据的?
如何看待学霸君的高考机器人 Aidam 高考全国文科数学卷考了 134 分?
为什么Transformer适合做多模态任务?
为什么 Bert 的三个 Embedding 可以进行相加?
硕士方向,选择迁移学习还是自然语言处理?
如何看待2021年秋招算法岗灰飞烟灭?
多模态方面,有哪些牛组值得我们follow他们的工作?
当前深度学习理论基础薄弱是否意味着我们应该放弃深度学习应用(计算机视觉、自然语言处理)?
BERT可以用于文本聚类吗?
如何理解Inductive bias?
服务条款
联系我们
关于我们
隐私政策
© 2025-05-23 - tinynew.org. All Rights Reserved.
© 2025-05-23 - tinynew.org. 保留所有权利