百科问答小站 logo
百科问答小站 font logo



如何理解马氏距离,多维Mahalanobis距离是否要用到“互相关张量”来进行描述? 第1页

  

user avatar   frombeijingwithlove 网友的相关建议: 
      

一般谈到马氏距离是不能脱离开样本分布的,题主说的“互相关张量”应该指的是样本的协方差矩阵,这个也是和样本分布密切相关的,来看个例子:

左下角在二维空间中由一个分布产生的方块样本,这个分布的一条等高线如虚线的椭圆框所示,图中还有一个不属于该分布的圆圈样本。这是是一个典型的欧式距离会把分布外样本算的更近的例子,比如把绿色和蓝色样本单拎出来,就是左上角的图,蓝色小圆圈和中心的绿色方块更近了,这是因为单纯的欧式距离无法反应方块的分布。这种情况下,考虑用马氏距离。这里默认方块的分布可以由协方差矩阵很好描述(比如是个多维高斯分布),那对于任意两点x和y马氏距离的计算就是下面:

就是协方差矩阵,这样计算出的距离就像

@王赟 Maigo

说的一样不再是各向同性,对于方块的分布而言有个良好性质是分布的等高线上到中心的马氏距离相等了,因为马氏距离包含了方块本身分布的信息。进一步来理解,马氏距离可以表示为下面这样:

其实等效于做了个线性变换,然后在变换后的空间中求了下欧式距离,其中可以表示为,其中是个对角矩阵,对角线元素分别为协方差矩阵本征值的倒数开方,的行向量就是协方差矩阵的本征值。无论多少维,协方差矩阵的计算都是一样的,可以参考wiki上协方差矩阵的定义:

Covariance matrix

。关于为什么,为什么协方差矩阵就是这个椭圆的理解可以参考另一个答案

主成分分析PCA算法:为什么去均值以后的高维矩阵乘以其协方差矩阵的特征向量矩阵就是“投影”? - 達聞西的回答 - 知乎



  

相关话题

  各种机器学习算法的应用场景分别是什么(比如朴素贝叶斯、决策树、K 近邻、SVM、逻辑回归最大熵模型)? 
  蜗牛从10米深的井底爬,白天爬一米,晚上下落x米,其中x为[0,2]米的随机数,那么爬上的期望是多少? 
  有没有可能让计算机去理解代码,从而写代码? 
  数据库 与 数据仓库的本质区别是什么? 
  国外的程序员是如何保养「革命的本钱」? 
  如何评价周志华教授新提出的 Deep Forest 模型,它会取代当前火热的深度学习 DNN 吗? 
  精确率、召回率、F1 值、ROC、AUC 各自的优缺点是什么? 
  你从数据中发现了哪些奇妙的不为人知的知识或者见解? 
  中心极限定理的适用范围有哪些? 
  百度学术能否替代 Google 学术网站?有没有其他选择? 

前一个讨论
电影铁拳中,看到拳击手辉煌的时候能挣很多钱,开好车住豪宅。但是为什么,一旦遇到重大变故,就会一无所有?
下一个讨论
我学编程为什么难?是思维方式不对还是学习方式不对?





© 2024-05-20 - tinynew.org. All Rights Reserved.
© 2024-05-20 - tinynew.org. 保留所有权利