一句话解释:熵权法是在综合评价中运用信息论的求解权重的一种方法。
上面讲了什么叫综合评价。重点如下:
上面讲的是几何形变与拓扑指示。综合评价就是降维的过程。
CE,是综合评价(Comprehensive Evaluation)简写。
所有的综合评价只要是涉及多个评价对象都可以用SAISM模型来指示。比如环境监测综合评价、药物临床试验综合评价、地质灾害综合评价、气候特征综合评价、产品质量综合评价等等;在社会科学中广泛应用于总体特征和个体特征的综合评价。比如,社会治安综合评价,生活质量综合评价、社会发展综合评价、教学水平综合评价、人居环境综合评价等等。在经济学学科领域更为普遍。如,综合经济效益评价、小康建设进程评价、经济预警评价分析、生产方式综合评价、房地产市场景气程度综合评价等等
CE有三个关键技术。
上面的意思是指标的选取最重要。
上面的页面很长,但是流程图很重要。
第一个箭头指向的非常重要,就是要先规范化(归一化,无量纲化)数据。
也就是别愣头青一样见到一个表就直接用熵值法算权重。
熵权法是在规范化矩阵(规范化的数据)上算的权重!!
规范化的数据中是不能有负数,可以有0!
熵权法是一个客观方法,主要针对的是客观数据。
比如找砖家打分的这种就是主观性数据,一般不用熵权法的。尤其是AHP,ANP的那种数据。
※熵权法(the entropy weight method 简称EWM)是脱胎于信息论基本原理的解释,信息是系统有序程度的一个度量,熵是系统无序程度的一个度量;如果指标的信息熵越小,该指标提供的信息量越大,在综合评价中所起作用理当越大,权重就应该越高。熵权法是常用的一种求权重的方法。它是指一个随机变量与某一组随机变量间线性相依性的度量。
上面是熵权法一般吹水的解释。
上面是归一化矩阵,n为行,m为列。i为第i行,j为第j列
☆ 第jj项指标下第ii个样本值占该指标的比重:
☆ 第j项指标(列)的熵值:
上面有对数,所有要确定有没有意义。通常k取值如下。
☆ 第j项指标(列)的差异系数:
☆ 第j项指标(列)的权重:
其实就是对数有没有意义的问题。 log x 在熵权法中 x可以为0 因为前面的公式是 0*ln0 它还是等于0.
取什么对数的问题,
这个别纠结 取 ln log lg 三种都可以。
熵权法本质是来自信息论的,因此第一步正则化(规范化)最重要。
熵值的含义可以由题中的定义,也可以有无数种魔改的方法。比如用KL散度、JS差,等等等等。
熵权法是一种客观的方法,因此权重是变化的。比如增加了一行,其权重是变化的。
比如有5年的数据,每一年,每个指标的权重是不同的。
有问题可以点上面的按钮咨询我。