首页

CTC和Encoder-Decoder有什么关系? 第1页

1

maigo 网友的相关建议:

是否把 LSTM + CTC 看成编码器 + 解码器的结构，我觉得是一个无所谓的问题。

其实任何一种网络结构，都可以看成编码器 + 解码器，只要把网络的低几层看成编码器，高几层看成解码器就行了。但对于 LSTM + CTC 来说，到底把哪几层看成编码器，哪几层看成解码器，并没有一个明确的界限，不像注意力网络中，编码器与解码器中间有一个注意力层的结构是跟其它层不同的。所以说 LSTM + CTC 是编码器 + 解码器，不能算错，但没什么意思。

2. 变长序列的端到端学习方法，我觉得有三种主流思路，除了 CTC 和注意力以外，还有 transducer。下面这篇文章就比较了三种方法用于语音识别的效果：

我对它们的总结是这样的：

CTC和Encoder-Decoder有什么关系? 的其他答案点击这里

1

相关话题

  2018年了，MXNet 发展的如何了？
  经过足够长的时间， AlphaGo 的棋谱能收敛到一张上吗？
  从应用的角度来看，深度学习怎样快速入门？
  为什么学习深度学习感觉无法入门？
  如何评价 MSRA 最新的 Deformable Convolutional Networks？
  如何看待最近一段时间旷视科技Face++、阿里、小米、京东、科大讯飞和地平线等相继在南京建立研发中心？
  什么是meta-learning?
  强化学习和自适应控制的关系是什么？
  大家推荐一下，哪些学校的导师有在做量化交易、股票预测的？
  KL散度衡量的是两个概率分布的距离吗？

前一个讨论

如何看待Meta（恺明）最新论文ViTDet：只用ViT做backbone（不使用FPN）的检测模型？

下一个讨论

计算流体力学（CFD）里应用注意力机制（attention）是否可行？

相关的话题

  现在tensorflow和mxnet很火，是否还有必要学习scikit-learn等框架？
  如何评价Kaiming He的Momentum Contrast for Unsupervised?
  类似AlphaGo一样的人工智能什么时候才可以击败RTS（如星际）顶级选手？
  应届硕士毕业生如何拿到知名互联网公司算法岗（机器学习、数据挖掘、深度学习） offer？
  为什么神经网络具有泛化能力？
  人工智能领域有哪些精妙的数学原理？
  为什么机器学习解决网络安全问题总是失败?
  什么是蒙特卡罗 Dropout(Monte-Carlo Dropout)？
  生成对抗网络的毕设怎么上手？
  行人轨迹预测有哪些有效的方法和普遍的base方法？或者public dataset?
  什么是meta-learning?
  如何评价 Face++ 旷视科技最新出品的检测专用 backbone 网络 DetNet ？
  视觉算法的工业部署及落地方面的技术知识，怎么学？
  2020到2021年小样本学习取得重大进展了吗？
  神经网络中的能量函数是如何定义的？
  如何评价陈天奇团队新开源的TVM？
  实验室一块GPU都没有怎么做深度学习？
  石头和塑料袋对于计算机传感器的差别在于什么？为什么无人驾驶系统会依然存在对周围环境的误判？
  当前深度学习理论基础薄弱是否意味着我们应该放弃深度学习应用(计算机视觉、自然语言处理)？
  如何看待Geoffrey Hinton的言论，深度学习要另起炉灶，彻底抛弃反向传播？
  2019年NeurIPS有哪些糟糕的论文？
  如何评价基于游戏毁灭战士（Doom）的AI死亡竞赛大赛结果？
  如何评价AlphaGo Zero？
  大家推荐一下，哪些学校的导师有在做量化交易、股票预测的？
  反馈控制理论在优化、机器学习等领域有哪些应用？
  目标检测算法中Two-stage算法速度慢,到底在哪里?
  2019年，计算机视觉领域，你推荐哪些综述性的文章？
  有没有什么可以节省大量时间的 Deep Learning 效率神器？
  如何看待周志华等人的新书《机器学习理论导引》？
  如何看待NLP领域最近比较火的prompt，能否借鉴到CV领域？

© 2025-05-20 - tinynew.org. All Rights Reserved.
© 2025-05-20 - tinynew.org. 保留所有权利