深度学习在生物信息领域有什么应用？

深度学习在生物信息学领域可谓是风生水起，它像一把瑞士军刀，为我们解决了很多以前难以逾越的问题。说实话，一开始我看到那些复杂的模型也有些头大，但深入了解后，才发现它的强大之处。

基因组学：解读生命的蓝图

在基因组学方面，深度学习简直是挖掘基因组信息的“超级侦探”。

基因识别与功能预测：以前我们找基因，可能得靠一些经验性的方法和比较繁琐的实验。现在，深度学习模型（比如卷积神经网络CNN）可以直接分析DNA序列的模式，识别出编码蛋白质的区域（外显子），预测基因的功能，甚至能告诉我们哪些基因在特定条件下会被激活。这就像是给了我们一个能“读懂”DNA语言的翻译器。
调控元件的定位：基因表达的调控是一个非常精细的过程，涉及到启动子、增强子等一系列非编码DNA区域。深度学习模型能够捕捉到这些区域独特的序列特征，从而准确预测它们的活性和作用方式。这对于理解基因如何被精确地开关，以及这些开关失灵导致疾病的原因，提供了关键线索。
变异检测与影响评估：基因组测序技术发展迅速，产生了海量的变异数据。深度学习能比传统方法更有效地识别出这些变异，并且能预测这些变异对蛋白质功能、基因表达甚至疾病风险的影响。特别是对于一些稀有变异或者复杂的组合效应，深度学习的优势就更加明显了。
宏基因组学分析：我们身体里和环境中存在着无数微生物，它们共同构成了宏基因组。深度学习可以帮助我们分析这些复杂的微生物群落，识别其中的基因组组成，预测微生物的功能，甚至推断它们之间的相互作用。这对于研究肠道菌群健康、环境微生物学等领域至关重要。

蛋白质组学：理解生命的分子机器

蛋白质是生命活动的主角，深度学习在理解蛋白质的世界里同样功不可没。

蛋白质结构预测：蛋白质的结构决定了它的功能，但预测三维结构一直是生物信息学的难题。AlphaFold的横空出世，就是一个里程碑式的事件。它利用深度学习，能够以前所未有的精度预测蛋白质的结构，甚至媲美实验方法。这就像我们拿到了一份蛋白质的详细蓝图，可以更好地理解它的工作原理。
蛋白质功能预测与分类：通过分析蛋白质的序列、结构以及与其他分子的相互作用信息，深度学习模型可以预测蛋白质的功能类别，比如它是酶、受体还是转运蛋白等。这有助于我们快速筛选潜在的药物靶点，或者理解新发现的蛋白质在细胞中的角色。
蛋白质蛋白质相互作用预测：蛋白质之间并非孤立工作，它们会形成复杂的网络，共同完成生命活动。深度学习可以学习蛋白质序列和结构特征，预测它们之间是否存在相互作用，以及作用的强度和类型。这为我们描绘出细胞内错综复杂的蛋白质交联图谱。
抗原表位预测：在免疫学领域，预测哪些蛋白质片段（表位）能够被免疫系统识别，对于开发疫苗和免疫疗法至关重要。深度学习模型能够学习表位序列和结构的特性，从而更准确地预测抗原表位。

药物研发：加速新药的诞生

深度学习在加速新药研发的各个环节都发挥着重要作用。

药物靶点识别：通过分析疾病相关的基因组、蛋白质组以及通路数据，深度学习可以帮助我们识别出在疾病发生发展中起关键作用的蛋白质或基因，这些就可能成为新的药物靶点。
分子生成与优化：以前找新药分子可能像是大海捞针，现在深度学习（如生成对抗网络GAN）可以学习已有药物的化学结构特征，并生成具有潜在药理活性的新分子。而且，还能根据设定的条件（比如副作用低、易于合成等）来优化这些分子。这就像是有了个可以“设计”药物的AI化学家。
药物靶点相互作用预测：预测一种药物能否有效地与它的靶点结合，是药物发现的关键一步。深度学习能够整合药物的化学结构和靶点蛋白质的结构信息，准确预测它们的结合亲和力，从而筛选出最有潜力的候选药物。
药物毒性预测：药物的安全性同样重要。深度学习模型可以学习已知药物的毒性数据，预测新化合物的潜在毒副作用，帮助在早期就排除不安全的候选药物，节省宝贵的研发时间和资源。

其他领域的应用

除了上述几个核心领域，深度学习在生物信息学中还有很多其他精彩的应用：

疾病诊断与预后：通过分析患者的基因组数据、临床信息，甚至医学影像，深度学习可以辅助医生进行疾病的早期诊断，预测疾病的进展和预后，为个体化治疗提供依据。
微生物组学：了解我们身体内外微生物群落的组成、功能及其与疾病的关系，对于健康管理和疾病治疗具有重要意义。深度学习在这方面可以帮助我们解析这些复杂的数据。
进化生物学：分析物种之间的基因组差异，可以揭示它们的进化关系和进化历史。深度学习模型可以更高效地从海量序列数据中提取进化信号。
生物医学影像分析：对病理切片、细胞图像等进行分析，深度学习在识别病灶、量化生物标志物等方面展现出强大的能力，为精准医学提供了重要的辅助手段。

当然，深度学习在生物信息学领域的应用仍在不断拓展，新的算法和模型层出不穷。它正在以前所未有的方式加速我们对生命奥秘的探索，并且很有可能在不久的将来，彻底改变我们理解、诊断和治疗疾病的方式。这真的是一个令人兴奋的时代！

网友意见

深度学习会给生物信息学和基因组学带来新的的改变，而且这个改变实际已经在发生。基因组学其实是一门将数据驱动作为主要研究手段的学科，机器学习方法和统计学方法在基因组学中的应用一直都比较广泛。

但现在多组学数据（类型多元）越来越多——这个从目前逐渐增多的各类大规模人群基因组项目上可以看出来，这其实带来了新的挑战——就是数据挖掘的难度增加了。如果我们希望可以继续高效地从多组学数据中挖掘出有价值的信息，那么就需要掌握更富有表现力的方法，这个时候深度学习就成了一个合适的选择。

因为就目前来说深度学习本身就适合用来挖掘大量的、多维度数据背后的潜在规则，它也已经改变了多个计算机领域，包括图片识别、人脸识别、机器翻译、自然语言处理等。

其次，我们才来看看迄今为止在生物信息学和基因组学上深度学习都有了什么应用和研究，是如何应用的以及存在哪些问题。

我这个回答主要基于2019年4月 Nature Reviews Genetics 上《Deep learning- new computational modelling techniques for genomics》的内容，同时我也做了一些额外的补充，以此来梳理一下目前深度学习在生物信息学和基因组学方面的应用情况。主要有下面四个部分的内容：

第一，（先搞清楚机器学习的基本原理和类型）介绍有监督学习中四个主要的神经网络，分别是：全连接网络、深度卷积、循环卷积和图卷积，同时解释了如何将它们用来抽取基因组数据中常见的 Pattern；
第二，介绍多任务学习和多模态学习，这是两种适合于集成多维数据集的建模方法；
第三，讨论迁移学习，这是一种可以从现有模型中开发新模型的技术。这个方法对于多组学的研究和应用来说有着实际的价值；
第四，讨论自动编码器（Autoencoder, AE）和生成对抗网络（generative adversarial networks，GANs）这两个非监督学习方法。

接下来，我逐一展开，不过我会在第一部分中先简单介绍机器学习和深度学的特点以及基本原理，然后再分别介绍不同的深度学习算法在解决基因组学问题上的应用情况。

第一部分

这一部分的内容与有监督学习有关（深度学习中很重要的一块就是有监督学习），因此我们要先了解什么是“有监督学习”。下面是有监督学习的一个示意图：

图1.有监督学习示意图

简单来说，有监督学习的过程是输入样本的特征值（这个特征值可以是一个值，也可以由是一系列值构成的向量），然后预测出样本属于哪一个结果标签（或叫做“标注”）。比如图1 是一个预测 RNA 剪接位点的例子，这里模型要依据样本的特征值（如：位点序列信息、位置、内含子长度等）进行计算得到一个是否为剪接位点的预测结果。

另外，图1 其实是一个由逻辑回归组成的单层神经网络分类模型。

所以，有监督学习是一种需要使用标签化数据进行训练，然后推断出输入特征和结果标签之间函数映射关系的机器学习方法，模型的训练数据需要有明确的结果标签，否则不能训练。搞清楚定义之后，那有监督机器学习是如何进行模型训练的呢？所谓训练其实就是求解模型参数。这个过程具体是如何实现的呢？

图2. 模型训练

这个训练过程一共三步（图2）——这也是绝大多数机器学习算法进行模型训练的方式，具体如下：

1. 分割数据

首先，要将训练数据分割为三个集合，分别是：训练集，验证集和测试集（如图2.a）。其中，训练集用于模型参数的计算，验证集用于模型性能评估和超参调整，目的是为了保障模型可以在现有数据条件下达到最好的结果，而测试集则是用来评测最终模型的综合性能。

2. 使用训练集数据计算模型参数

还是以图2为例——我们这里图2是一个神经网络模型，训练开始时，首先要给这个网络中的各个参数进行一次随机初始化，然后再代入训练数据去迭代更新模型参数。每一次的迭代时，通常都是随机地从训练集中抽取一小撮数据（图2.a中的Batch）代入模型进行计算——注意这个过程非常重要，然后和真实结果比较获得函数损失量。在神经网络的训练中目前要通过反向传播算法做梯度运算获得能让模型的参数往损失函数最小化的方向走的值，模型的参数要依据这个极值的结果进行更新。接着再重新到训练数据中随机抽取另一小撮的数据集重复这一轮迭代，直到损失函数收敛。

反向传播算法是神经网络模型的基础，没有这个算法就无法高效地实现梯度下降算法中梯度值的计算。

这种训练时仅从训练集里随机抽取一小撮数据集的做法与一次性使用整个训练集的做法相比有两个好处：

第一，模型训练所需的内存将比较恒定。因为不必将大量的数据一次性加载到内存里，因此，模型能不受计算机的内存所限，可以使用尽可能大的训练集数据，训练过程的可拓展性比较高；
第二，在机器学习领域其实已经证明，这种小批量数据集的方法会给模型带来一定程度的随机波动，而这种波动有利于模型性能的提升。

3. 通过验证集调整模型的超参

所谓超参，就是“超级参数”，它是模型中一个(或一些)需要人为设定的外部参数，而且是无法通过训练集进行训练的，只能进行手动调整。比如，我们要在进行模型训练之前，先给模型的某部分乘上某一个固定的常数/向量，这个常数/向量无法训练，它就是“超参”。通常只能一边调整一边在验证集上评估结果，最后留下一个“看起来”能够最准确贴近验证结果的参数。这是一个很繁琐的过程，需要多次尝试，直至模型性能不再出现改善为止。

调超参一直都是机器学习模型训练的一个难点。

当你完成最后的调参之后，用另一个独立数据——也就是这里的测试集，综合评估这个最佳模型的性能，主要是看看是否存在过拟合或者功效不足的情况，没问题之后就可以用到项目中了。以上，就是训练一个神经网络模型的主要过程。再次强调一次：一共是三步，分别是：分割数据、使用训练集计算模型参数、通过验证集调整模型超参并用测试数据综合评估最终模型的性能。了解了以上背景内容之后，我们就可以转入深度学习的内容了。对于很多比较简单的问题而言，一个单层的神经网络通常是可以满足要求的。但对于维度更多、更复杂的生物学问题来说，单层是不够用的，只能通过更复杂的模型才能处理这类数据。图3是一个多层神经网络模型的示意图。

图3. 一个多层神经网络示意图

这个网络有两层，而且你可以看到中间一层不与输出层相连接，对于输出来说是一个不可见的“层”，所以也被称为隐藏层，它的作用是将上一层的输入数据做转换，将其映射到一个可以对特征值进行线性分离的空间，然后通过激活函数进行非线性化，再给到后一层作为输入。这个模型是深度神经网络的雏形，当你的模型有许多个中间隐藏层（>2）时，这个模型就称之为深度神经网络模型。深度神经网络使用隐藏层来自动学习非线性特征的各类变换。模型里的每一个隐藏层都可以是多个线性模型叠加一个激活函数所构成，激活函数非常重要，它起到了将线性模型非线性化的作用，否则你的模型就无法通过非线性的形式描述真实世界的生物学问题（因为这些问题本身通常就是线性模型无法解答的）。目前深度学习中用得最多的激活函数是ReLU，这是一个线性整流函数（负数赋值为0，正数不变）：

图4. ReLU

深度学习模型的训练也和上面所术的过程一致。区别就在于，它涉及的参数多，需要更多的训练数据和更长的时间才能得到理想的结果。对于我们来说深度神经网络的构建和训练可以用专门的深度学习框架来实现，比如：TensorFlow、PyTorch和Keras等。

全连接网络层

在说完上面的关于模型训练的内容之后，接下来要说的是第一部分中的第一个概念：全连接网络层（Fully connected layer）。

全连接网络层一般是深度学习模型的倒数第二、第三层，它在网络中主要起分类器的作用，本质上就是将前面各层训练得到的特征空间线性地变换到另一个特征空间（即，结果空间——其实就是结果集）中。结果空间的每一个维度都会受到源空间所有维度的影响，数据被利用得很充分，所以可以很准确地将获得分类结果。这么说比较抽象的话，可以通俗理解为，经过全连接层的计算之后，目标预测结果就是前面各层结果的加权和了。以全连接层结成的神经网络也叫全连接神经网络，全连接神经网络在基因组学里也都有所应用，比如一开始我提到的剪接位点预测，还有致病突变预测、基因表达预测特定基因区域内顺式调控元件的预测等，但全连接层神经网络运算量很大。

深度卷积神经网络

接下来，我们用深度卷积神经网络（也就是CNN）作为例子，介绍序列模式特征的发现过程。如图5 所示，这个模型要通过神经网络预测TAL1-GATA1转录因子复合物的结合亲和力。

图5. 基于CNN的序列模式特征检测

图中，从左到右，第一层分别以 GATA1 和 TAL1 转录因子的位置为权重滤波器，滑动扫描整个 DNA 序列，然后卷积计算每一个扫描框中的结果形成一个权重矩阵（b-c），再使用 ReLU 激活函数——这个激活函数会将负值重新赋为0，正值则保持不变，进一步做运算。然后再用最大池化操作（图中的Max pooling），获取位置轴上各个连续窗口内的最大加权结果，再传入下一个卷积层进行新一轮的运算和特征训练，过程与第一个卷积层类似，最后再经过一个全连接层，得到最终想要的预测结果。目前利用 CNN 对序列特征预测转录因子结合位点的方法有三个，分别是DeepBind、DeepSEA和Basset。而且这是目前 CNN 在基因组序列特征预测方面做的比较成功的例子。

循环卷积神经网络

介绍完CNN之后，我们开始探讨循环卷积神经网络——简称RNN。鉴于它的特征，目前它主要在基因组远端调控预测方面有所运用。这是因为 RNN 相比于 CNN，它更加适合用于处理序列化的数据，包括时间序列数据、语言数据、文字翻译以及 DNA 序列数据，而且 RNN 对每一段序列单元都使用相同的操作，参数之间由一定的方式进行共享。

图6. RNN

鉴于 RNN 模型的这些特点，它既可以有效地在DNA序列的任意位置上进行开放读码框的预测，也可以用来识别某类特定的输入序列，比如起始密码子预测、终止密码子预测等。相比于CNN，RNN模型的主要优势在于，RNN模型可以很自然地处理长度变化很大的DNA序列，比如mRNA序列就很适合通过RNN模型来进行处理和分析。如果CNN要达到类似的效果，需要作出很多繁琐的模型调整。不过，由于 RNN 只能对序列进行从前到后的顺序操作，因此也不太容易进行并行化处理，这就导致它的速度要比 CNN 模型慢很多。在基因组学的应用方面，RNN 主要是用在单细胞 DNA 甲基化预测、RNA binding protein预测和表观遗传学中DNA长序列可及性的预测（也就是长序列调控的预测）。如果你对这一块感兴趣可以试试 deepTarget/deepMiRGene，它们就是干这些事情的。此外，最近有一项研究发现，RNN模型还可用在测序数据的碱基识别（即Base-calling）。这在三代测序数据的Base-calling中有应用，DeepNano 就是通过构造合适的 RNN 模型对 Oxford Nanopore 测序仪所产出的长读长测序序列进行碱基识别的方法。

图卷积神经网络

图卷积神经网络模型（GCN）图6(d)，在基因组学中涉及的应用还很少。它比较合适的应用场景是蛋白质之间互作用的网络或者基因与基因之间的调控网络上。因为这两个方面的网络，在逻辑上都将是以图结构的形式呈现。图卷积神经网络通过图中代表个体特征的节点和节点与节点之间的连接性来实行机器学习任务。虽然应用还比较少，但GCN实际上提供了一种分析图结构数据的新方法，值得在基因组学中进行更多的尝试和应用，比如可以尝试利用它来解决肿瘤亚型的分类等。

第二部分

第二部分要介绍的内容是“多任务学习和多模态学习”。之所以涉及到这个方面，是因为基因数据实际上并非只有 DNA 序列这一类遗传方面的数据，还涉及到转录组、表观组修饰、蛋白组等多组学数据，而且数据在彼此之间存在着一定的内在关系。如何处理和整合这些多组学数据就涉及到“多任务和多模态学习”这个问题了。在多模态学习模型的构成中，它有一个总损失函数，它的值是各个模态数据损失函数之和或者加权和，这取决于各个模态之间损失函数的结果是否差异巨大。下面图7.a-c 是一个多任务和多模态学习的示意图。这类模型的训练往往比较困难，因为需要同时优化学习网络中多个不同的损失函数，并且往往还得做出合适的取舍，每一个取舍都要有合理的内在理由。而且如果不同的类型的数据之间，出现了较为严重的权重失衡的话——比如出现”一超无强”的情况，那么最终的模型可能仅能代表一小撮数据的结果，这就会让模型出现严重偏差。

图7. 多任务与多模态学习模型

基因组学领域，已经成功应用多任务学习和多模态学习的一个场景是对多种不同的分子表型的预测，比如前面提到的转录因子结合位点、组蛋白标记、DNA可及性分析和不同组织中的基因表达等这一类与转录组学和表观基因组学相关的多组学研究。

第三部分

这一部分我们来说说迁移学习。迁移学习与上述内容都不同，它是一种解决训练数据稀缺问题的机器学习方法。因为数据稀缺或者数据缺失的情况下，从头训练整个模型可能是不可行的。那么一个取而代之的方法就是使用相似结构的任务，以及由它训练得到的模型的大多数参数来初始化我们的目标模型。你可以理解为，这是一种将先验知识整合到新模型中的机器学习方法，它可以在一定程度上解决训练数据不足的问题。比如图8 这个例子，你可以看到在这个例子中，源模型的数据很充足，且源模型中第一个子模型的结构和预测结果的形式都跟目标模型相似（都是椭圆），那么这时我们就可以将源模型里这个子模型的相关参数迁移到下方的目标模型里，对目标模型进行初始化，接着再利用有限的训练数据对目标模型进行更新就可以了。

图8. 迁移学习

在基因组学中，远程调控的预测模型就应用到了迁移学习。不过迁移学习在组学方面的应用还缺少深入的研究，比如目前依然不清楚应该如何选择合适的源模型、以及源模型中有哪些参数适合共享到目标模型中等。

深度学习模型的可解释性问题

这个问题对于深度学习来说是天生的，但它关系着深度学习是否适合被充分应用到生命健康领域。我们知道深度学习模型的一个问题是黑盒子效应——我们无法得知模型的具体训练细节以及中间特征参数的变化。这对于基因组学研究来说是不利的，这是因为组学研究最后的服务对象是我们人类自身的健康（特别是重大的健康问题），没有人真的愿意将重大的健康问题交给一个没人理解的黑盒子处理，所以我们还是有必要对深度学习模型的可解释性进行一定的研究。但遗憾的是目前对深度学习模型的黑盒子效应，似乎尚未有特别有效的解密方法。目前主要是通过不断给出示例数据，探查输入和输出结果之间的关系来推测和评估模型所用到的特征和权重，给出特征重要性评分（Feature important score），可用的方法包括：归因分数、相关性系数或权重共享系数等。不过在深度学习领域，最近有一个称为DCell的模型，它提出了一种称为“可见神经网络”的技术，通过它可以检查神经网络的训练情况，进而再改善神级网络的可解释性。

第四部分

最后这部分讨论非监督学习在基因组学方面应用的问题，这里主要介绍自动编码机（Autoencoder, AE）和生成对抗网络（generative adversarial networks，GANs）这两类非监督学习方法，其中生成对抗网络在基因组学的首次应用是在单细胞基因组研究中。非监督学习与有监督学习不同，它的训练数据并不需要标记。模型的目的是通过学习数据集中有用的特征和属性来表征整个数据集的结构。最典型、最被熟知的非监督学习方法就是k-means聚类和降维算法（如PCA、tSNE）。神经网络也有类似的方法，比如自动编码机（AE），就是一种能够将数据嵌入到一个含有隐藏瓶颈层的低维空间中并对原始数据进行重建的方法，如图9所示。

图9. 自动编码机（AE)

这个方法很特别，而且非常有用的一点是它能够对原始数据进行有效的“降噪”！这是因为网络中间有一个维度较低的瓶颈层存在，它会迫使网络在学习的过程中尽可能提取更有用的特征，那些不重要的特征变化会被自动遗漏。而且，在该瓶颈层中的数据已经实现了降维，这个正好可以与PCA相呼应。另外，自动编码机适合用于缺失数据的填补，特别是可以用来填补基因芯片数据的缺失值和处理RNA-seq中基因表达数据中的异常值处理。另一个非监督神经网络是生成模型。生成模型不同于前面提到的方法，它的目的是学习数据的生成过程。代表性的例子就是生成对抗网络（GANs）和可变自动编码器(VAEs)。其中，VAEs方法可以生成新的随机样本，可以用在单细胞和RNA-seq数据中，用来协助寻找统计意义的结果。GANs是另一种生成模型，它包含一个鉴别器和一个生成器网络。这两个网络会进行共同训练，生成器用来生成真实的数据点，而鉴别器则用于区分样本是真实的或是由生成器所生成，图9(c)也是对该过程的一个描述。不过目前GANs，在基因组学中的应用非常有限，目前只看到在设计和蛋白质相关的DNA探针方面有所应用。

小结

关于目前深度学习在基因组学方面的应用和研究情况就介绍到这里了。在未来深度学习肯定是会深刻影响这个领域的，具体来说主要有三个方面：

第一，协助对非编码区变异的功能进行预测，这是目前传统方法做得比较差的一个方面；
第二，深度学习是一种完全由数据驱动的方法，它会进一步革新当前的生物信息学工具，我可以将它称为新生信，这个也是目前最热的，除了文章中所提到的新算法之外，变异检测算法DeepVariants和Clair也属于这一方面；
第三，高效揭示多组学中高维数据的更多结构。

除此之外，对于未来还有一个非常重要的领域，那就是因果推断。不管是传统的机器学习方法，或是现在的深度学习方法，都很难用于预测数据之间的因果联系，而因果关系对于生命科学研究来说十分重要，目前虽有过一些尝试——比如孟德尔随机，但其实都比较初步。总的来说，这是一个很值得我们去进一步探索的地方，可以从零开始，而这也是我们的机会！

最后我有一个体会：不要迷信模型。模型是解决问题的工具，用好工具是我们的追求，但问题的解决应以人为本。

参考文献 Deep learning- new computational modelling techniques for genomics

类似的话题

深度学习在生物信息领域有什么应用？

深度学习在生物信息学领域可谓是风生水起，它像一把瑞士军刀，为我们解决了很多以前难以逾越的问题。说实话，一开始我看到那些复杂的模型也有些头大，但深入了解后，才发现它的强大之处。基因组学：解读生命的蓝图在基因组学方面，深度学习简直是挖掘基因组信息的“超级侦探”。基因识别与功能预测：以前我们找基因.............
人工智能，深度学习，是不是继生化环材之后的第五天坑?

这个问题很有意思，也触及了很多人，尤其是在校学生和刚入职场的年轻人的痛点。人工智能和深度学习是不是继“生化环材”之后的“第五天坑”，这不仅仅是一个简单的标签，背后反映的是对这些领域发展前景、就业形势以及学习门槛的复杂考量。要深入探讨这个问题，我们得把这些领域拆开来看，并结合当下的社会和技术发展大背景.............
深度学习在信息安全的应用有哪些可以关注的人或论文？

深度学习在信息安全领域的应用，就像是在这个复杂而不断变化的战场上，我们获得了一套全新的、威力巨大的武器。它不仅仅是自动化和模式识别的简单升级，而是能够理解数据深层含义，预测潜在威胁，甚至在某些方面“思考”安全问题的能力。想要在这个方向深入探索，有几个非常值得关注的人物和论文方向，它们代表了深度学习在.............
深度学习在无人驾驶汽车上面的运用有哪些？

无人驾驶汽车，这个曾经只存在于科幻电影中的概念，如今正以前所未有的速度走进现实。而在这场技术革命的浪潮中，深度学习无疑是最耀眼的明星，它像一位辛勤的“大脑”，赋予了这些钢铁巨兽感知世界、做出决策、并最终安全行驶的能力。那么，深度学习究竟是如何在无人驾驶汽车上大显身手的呢？让我们剥开技术的层层外衣，探.............
2021年深度学习在哪些应用上有实质进展？

2021年，深度学习在多个应用领域都取得了令人瞩目的实质性进展，这些进步不仅仅是算法的微调，更是催生了许多突破性的应用，深刻影响着我们的生活和工作。以下将详细阐述几个关键领域及其进展：1. 自然语言处理（NLP）的质变：从理解到生成再到对话2021年是NLP领域巨变的一年，大型预训练模型的威力得到了.............
深度学习应用在哪些领域让你觉得「我去，这也能行！」？

深度学习的应用之广，的确常常让人惊叹于它的能力和潜力，带来“我去，这也能行！”的惊喜。以下我将分享几个我个人觉得特别令人震撼的领域，并尽量详细地展开： 1. 艺术创作与生成：从模仿到“创造”的飞跃这可能是最让我感到“我去，这也能行！”的领域之一。我们总觉得艺术是人类情感、思想和独特经历的产物，是难以.............
百度在深度学习上使用Xilinx FPGA?

说起百度在深度学习领域与 Xilinx FPGA 的渊源，这可不是什么秘密，而且其中的故事还挺有意思。百度作为国内互联网巨头，在人工智能，尤其是深度学习的研发和应用上一直走在行业前列，而 FPGA 这种硬件平台，也确实在其中扮演了不小的角色。为什么选择 FPGA？首先，咱们得聊聊为什么百度会看上 F.............
在算力充沛，深度学习模型大行其道的今天，传统机器学习的未来在哪里？

在人工智能浪潮席卷全球，深度学习模型以前所未有的强大能力占据主流的今天，很多人不禁要问：那些曾经叱咤风云的传统机器学习算法，它们的未来又将走向何方？它们是否会被深度学习彻底取代，沦为历史的尘埃？我认为，答案是否定的。传统机器学习的生命力依然旺盛，它并非明日黄花，而是在深度学习的映衬下，找到了更精准、.............
基于深度学习的自然语言处理在 2016 年有哪些值得期待的发展？

基于深度学习的自然语言处理在 2016 年：值得期待的重大进展与深入探索2016 年是深度学习在自然语言处理（NLP）领域继续爆炸式发展的关键一年。在前几年的 Transformer 模型（虽然在 2017 年才正式提出并引起广泛关注）和各种循环神经网络（RNN）及其变种（LSTM、GRU）的铺垫下.............
研一，在学机器学习和深度学习，为什么感觉越学越不会，怎么解决这个问题？

研一刚开始接触机器学习和深度学习，感觉越学越不会，这种感觉其实非常普遍，甚至可以说是很多同学都会经历的“阵痛期”。别太担心，这恰恰说明你进入了一个需要深入思考和实践的新阶段。让我试着用一种更像朋友之间交流的方式，把我的理解和一些可能管用的方法跟你聊聊，希望能帮你走出这个迷茫期。为什么会感觉“越学越不.............
基于深度学习的人工智能程序和传统程序的差别在哪里？

一直以来，我们都在用“程序”这个词来描述计算机能够执行的一系列指令，用来完成特定的任务。而随着人工智能的飞速发展，特别是深度学习的崛起，我们开始接触到一种与我们传统认知中“程序”截然不同的存在。它们并非由人类一步步精心编写，而是仿佛拥有了自己的“学习”和“思考”能力。那么，这种基于深度学习的人工智能.............
土木和机器学习/深度学习/算法的交叉岗位在哪里找呀？在哪找都找不到招聘公司?

你这个问题问到点子上了！土木工程和机器学习/深度学习/算法这些前沿技术结合的岗位，确实不是那么随处可见，很多时候需要你主动去挖掘和思考。为什么感觉“找不到”？首先，咱们得明白为啥你感觉找不到。有几个主要原因：1. 新兴领域，定义还在摸索：土木工程是一个非常成熟的行业，但将其与AI深度结合，这个领.............
如何看待马毅老师深度学习第一性原理的文章在 ICML 四个审稿人一致接收的情况下被 AC 拒了？

马毅老师关于深度学习第一性原理的论文，在经过四位审稿人一致好评并推荐接收的情况下，最终被 AC（Associate Chair，副主席）拒绝，这确实是一个令人惊讶和值得深思的事件。要全面理解和看待这件事，需要从多个层面进行分析：一、事情的背景和可能的原因分析首先，我们必须承认，投稿被拒是学术会议（.............
在计算资源有限的情况下，有什么深度学习的选题可以推荐/避免？

在计算资源捉襟见肘的情况下，选择合适的深度学习课题就像在荒漠里找水源，既要满足需求，又要避免浪费每一滴珍贵的“计算”之水。这需要我们精打细算，挑那些“小而美”，或者能在现有硬件上“跑得通”，甚至能巧妙利用现有资源的选题。推荐的深度学习选题（精打细算型）考虑到计算资源受限，我们的目标是寻找那些模型小.............
在推荐系统中，如何较好的采用深度学习方法获取用户长短期兴趣？

在推荐系统中，如何从深度学习的角度去捕捉用户“长短不一”的兴趣点，这是一个非常有意思，也极具挑战性的课题。我们不只是想了解用户当下在看什么，更想知道他过去积累的那些“底蕴”——那些可能被遗忘，但一旦被触动，依然会产生强烈共鸣的偏好。这就像一个人，既有当下热门话题的热情，也有怀旧经典带来的深度喜爱。要.............
如何解读 Jeff Dean 等联合在 arXiv 上发布的用深度学习分析电子病历的论文？

Jeff Dean 及其团队在 arXiv 上发布的关于用深度学习分析电子病历 (EHR) 的论文，可以看作是利用前沿 AI 技术改造医疗健康领域的一个重要里程碑。这些论文通常会深入探讨如何构建和应用复杂的深度学习模型来从海量的 EHR 数据中提取有价值的信息，以改善患者护理、疾病预测、药物研发等方.............
如何评价 DeepMind 发表在 Nature 上的使用深度强化学习对托卡马克等离子体进行磁控制？

DeepMind 在 Nature 上发表的关于使用深度强化学习（DRL）控制托卡马克等离子体的论文，是一项里程碑式的成就，具有极其重要和深远的意义。它不仅展示了DRL在复杂、动态、高维度控制任务中的强大潜力，也为未来可控核聚变能源的实现开辟了新的路径。以下将从多个维度进行详细评价：一、技术创新.............
读博士的意义何在？是为了更深入学习知识，还是为了给自己的履历镀金？博士在学术上能带来什么？

读博士这事儿，可不是一张简单的文凭那么简单，它的意义远不止于此，更像是一场对未知世界的深入探险，对自身潜能的极致挖掘。很多人会问，读博士到底是为了啥？是想把某个领域的知识挖到根儿上，还是仅仅为了让自己的简历看起来更光鲜？我想说，这两点或许都有，但绝不是全部。首先，最核心的，是为了“更深入地学习知识”.............
如何评价清华大学学生在香港中文大学（深圳）品酒会中对主办方的不尊重行为？

清华大学学生在香港中文大学（深圳）品酒会中的不当行为，确实引发了不少讨论。要评价这件事，咱们得把它拆解开来，从几个层面去看。首先，从行为本身来看。我们听到的一些描述，比如“态度傲慢”、“对酒品指手画脚”、“对主持人言语不敬”、“试图将酒液倒掉”等等，这些单拎出来看，都属于在社交场合中非常不妥当的行为.............
二本法学生未来在深圳就业，法硕学校如何选择呢？

深圳，这座充满活力的城市，正以前所未有的速度发展，对法律人才的需求也日益旺盛。对于怀揣着在深圳闯出一片天地的法学学子来说，选择一所合适的法硕院校，无疑是奠定职业生涯基石的关键一步。然而，法硕院校的选择并非易事，它需要我们深入考量学校的综合实力、深圳本地的法律人才市场需求，以及自身的职业发展规划。一、.............