这是常见的一个步骤。
上面的原始矩阵中的每列要分析指标是正向还是逆向的。
第一、每一列(指标、维度、属性)的性质为如下四大类
对于振荡性指标与周期性指标,需要先进行转化,转化成正向指标或者负向指标进行处理这样才能保证每一列有严格的可比性。
第二、每一列(指标、维度、属性)都转化成数值的特征,每一列都是同一量纲。其中描述性的比较需要转化成数值型的比较
无量纲化式特别注意:为非数值型的属性,则需要转化成数值型的数据进行处理。
如描述性的属性,即非正规(Non-normal)模糊数,又称为一般性模糊数 (Generalized Fuzzy Numbers)可转化成五分制、十分制、百分制或者特定的数值。该数值可以通过特定的模糊运算进行转化。
其中五分制是最常见的模糊数值的转化。
第三、原始矩阵的预处理——在进行规范化之前,原始矩阵的每列必须是正向指标,或者负向指标。
设某物种最适合的生长的酸碱环境为6.3-7.3区间,偏离此区间成线性的危害。酸碱度分别为8.2,7.1,6.9,5.3,6.1对该物种的危害可进行如下换算。
正向与逆向最好记忆的是排名。
某个人考了第一名,这个人最牛逼。 所以排名是负向指标。
同向化非常重要。
比如上面流程图中的从原始矩阵,到规范化矩阵,就是同向化,且正向化的过程。
常见的六大类归一化方法及注意事项
其中极差法最常用。
很多论文,包括硕士与博士论文,错就错在没有分析指标是正向还是逆向。
这会导致极端的错误。
比如得出美国抗击新冠的效果最好。
因为美国感染新冠的人最多,治愈的人也最多。