问题

熵权TOPSIS法和投影寻踪法解决数学建模评价类问题各有什么特点?

回答
在数学建模的评价类问题中,我们常常需要对多个方案(或事物)根据多个评价指标进行综合评价,以选出最优的方案。熵权TOPSIS法和投影寻踪法是两种常用的多指标决策分析方法,它们各有千秋,适用于不同场景。

熵权TOPSIS法:客观赋权,贴近理想

熵权TOPSIS法是一种客观赋权方法,它充分利用了数据本身的信息含量来确定指标的权重,然后结合TOPSIS(Technique for Order Preference by Similarity to Ideal Solution)的思想,将方案与理想最优解和最劣解的相对距离作为评价依据。

特点详解:

1. 客观赋权,数据驱动: 熵权法的核心在于“熵”。熵是衡量信息混乱程度的指标。在评价问题中,我们认为信息量越大的指标(即指标值的变异程度越大)包含的信息越多,对最终评价结果的影响也应该越大。熵权法通过计算每个指标的“信息熵”来衡量其不确定性,再从“信息量”的角度反推出指标的权重。这种方法不依赖于主观经验,完全基于原始数据来分配权重,避免了人为因素的干扰,使得评价结果更加客观和可信。
具体过程:
数据标准化: 首先,需要对原始数据进行标准化处理,消除不同量纲的影响。常用的标准化方法有最大最小标准化、Zscore标准化等。
计算指标变异性(熵): 对标准化后的数据,计算每个指标的“信息熵”。熵值越小,说明该指标的变异性越小,信息量越少;熵值越大,变异性越大,信息量越多。
计算指标权重: 根据信息熵计算出每个指标的“信息量”,再将各指标的信息量进行归一化,得到各指标的权重。权重值越大,表明该指标对评价结果的贡献越大。
构建正负理想解: 利用计算出的指标权重,结合原始(或标准化后)数据,确定评价对象中各指标的最优值(正理想解)和最劣值(负理想解)。
计算相对贴近度: 分别计算每个评价对象与正理想解和负理想解的距离(通常使用欧氏距离),然后计算每个评价对象与正理想解的相对贴近度,即与负理想解的距离与(与正理想解的距离 + 与负理想解的距离)的比值。
排序: 相对贴近度越大的评价对象,其综合评价结果越优。

2. 兼顾最优与最劣,贴近理想: TOPSIS法的思想是“离优靠劣”,即评价对象越接近最优方案,越远离最劣方案,其评价结果就越好。它通过计算方案与正负理想解之间的相对距离来排序,这种方法直观地反映了方案的优劣程度,易于理解和操作。
优势: 这种方法不仅考虑了方案的“好”,也考虑了方案的“不好”,能够更全面地反映方案的优劣。

3. 适用性广: 熵权TOPSIS法适用于各种多指标评价问题,尤其是在指标权重难以确定或需要避免主观性时,它能提供一个相对可靠的评价结果。

4. 局限性:
对原始数据敏感: 如果原始数据本身存在较大的噪声或异常值,可能会影响熵值的计算和最终的权重分配。
信息冗余处理: 对于高度相关的指标,熵权法可能无法很好地处理信息冗余的问题,可能会给相关性强的指标过高的权重。
无“维度”概念: TOPSIS法侧重于方案与理想解的“距离”关系,而没有直接考虑指标维度本身对决策的影响。

投影寻踪法:降维投影,寻找最优轨迹

投影寻踪法(Projection Pursuit Regression, PPR)最初用于高维数据的探索性分析和模式识别,其核心思想是将高维数据投影到低维空间,并在低维空间中寻找最佳投影方向,以最大限度地暴露数据的结构信息,特别是隐藏在数据中的“孤立点”或“异常点”,并基于这些投影值进行评价和排序。

特点详解:

1. 降维与特征提取: 投影寻踪法最显著的特点是能够将高维数据投影到低维空间(通常是二维或一维),从而大大降低数据的复杂度。在这个降维过程中,它会寻找“最佳投影方向”,这个方向能够最大程度地反映数据的某些特征,例如分散性、偏离度等。
核心目标: 寻找一个或一组投影方向(投影函数),使得被投影后的数据点能够最大化某个“指标函数”。这个指标函数的设计是投影寻踪法的关键,它通常用来衡量投影数据的“奇异性”或“信息量”。
“踪”的体现: “寻踪”之意在于找到数据在低维投影空间中的“轨迹”或“模式”。

2. 寻找“踪迹”,揭示本质: 投影寻踪法通过最大化投影指标函数来找到最佳投影方向,这个方向往往能够揭示数据中隐藏的、最能区分不同方案的特征。评价对象在这些最优投影方向上的投影值,可以被视为其综合评价得分。
指标函数设计: 常见的投影指标函数包括:
最大化方差: 投影后的数据方差越大,说明数据越分散,可能包含更多信息。
最大化偏离度: 寻找与整体“平均”或“正常”状态偏离最大的数据点,这有助于发现异常的方案。
结合两者: 也有一些指标函数会综合考虑方差和偏离度。

3. 对异常数据敏感,突出局部特征: 由于投影寻踪法旨在最大化某种“奇异性”指标,它对数据中的异常值或局部特征非常敏感。这意味着如果某个方案在某个指标上表现出极端的、非典型的特征,投影寻踪法更容易将其凸显出来。
优势: 这种对异常的敏感性使其在发现“亮点”或“短板”方面表现出色。
局限性: 如果异常值是由于数据错误或者不具备代表性的特殊情况,可能会导致评价结果的偏颇。

4. 数据驱动的权重生成(隐式): 投影寻踪法并不显式地计算指标权重,但它通过寻找最佳投影方向,实际上是在某种程度上“隐含”地生成了权重。那个被投影到最佳方向上的指标(或指标的组合),其对最终排序的贡献就相对更大。

5. 适用性:
高维评价: 当评价指标数量很多,且指标之间可能存在高度相关性时,投影寻踪法的降维能力非常有优势。
寻找“突出”的方案: 当评价目标是找出那些在某些方面表现特别突出(无论好坏)的方案时,投影寻踪法能发挥其优势。
模式识别与异常检测: 在评价问题的背后,如果存在识别特定模式或检测异常方案的需求,投影寻踪法也是一个不错的选择。

6. 局限性:
指标函数设计复杂: 最佳投影方向的选取依赖于投影指标函数的选择,而指标函数的选择往往需要一定的专业知识和经验,如何设计一个最能代表评价目标的指标函数是一个挑战。
权重解释性较弱: 相较于熵权法,投影寻踪法生成的“隐式权重”不容易被直接解释,缺乏直观的权重分配逻辑。
对数据分布假设: 不同的投影指标函数可能隐含着对数据分布的假设,需要注意。
计算量: 在寻找最佳投影方向的过程中,可能会涉及复杂的优化算法,计算量相对较大。

两种方法的比较总结:

| 特征 | 熵权TOPSIS法 | 投影寻踪法 |
| : | : | : |
| 核心思想 | 客观赋权,衡量方案与理想解的距离 | 降维投影,寻找最大化信息量的投影方向 |
| 赋权方式 | 客观赋权(基于指标熵) | 隐含赋权(通过投影方向) |
| 评价依据 | 方案与正、负理想解的相对贴近度 | 方案在最佳投影方向上的投影值 |
| 突出特点 | 评价结果客观,易于解释;兼顾优劣 | 降维能力强,善于挖掘隐藏信息和异常特征 |
| 优势场景 | 指标权重不确定,追求客观公正;方案简单明了 | 指标多且可能相关;需挖掘数据中“亮点”或“孤立点” |
| 局限性 | 对异常数据敏感;信息冗余处理不够理想 | 投影指标函数设计复杂;权重解释性弱 |
| 数据要求 | 需要一定的数据变异性以计算熵 | 对数据的分布和特征敏感,对异常值有较强反应 |

总结来说:

选择熵权TOPSIS法,当你希望客观地分配指标权重,并且评价的标准是方案的综合表现越接近最优、越远离最劣越好的时候。它是一种更“稳健”和“主流”的评价方法。
选择投影寻踪法,当你面对高维度的评价指标,或者希望挖掘数据中那些表现特别突出(哪怕是异常)的方案,并且不特别纠结于指标权重的显式表达时。它更侧重于发现数据的结构和模式。

在实际应用中,可以根据具体问题的特点、评价的目标以及数据的性质来选择最合适的方法,甚至可以尝试结合使用这两种方法,通过对比结果来增强评价的可靠性。 例如,可以先用熵权法计算出客观权重,然后将加权后的数据输入投影寻踪模型,实现一种“客观加权+特征挖掘”的融合。

网友意见

user avatar

TOPSIS的核心是什么

就是求正负理想点(解)的距离。

就上面一句话,有很多说道。所谓的投影看你怎么理解。

现在给你一个很比较深刻的改进方法。

上面的就是topsis方法,闵可夫斯基距离公式是附带的。

topsis 是针对归一化矩阵的。 O->N的方式就不多讲了。

熵权是求权重的,即吧闵可夫斯基距离公式变成了带权值的 闵可夫斯基距离公式。

范数为2的闵可夫斯基公式就是 欧式距离。

这里最核心最有讨论的地方不是求出两列的解

即到正理想点与到负理想点距离。

最有讨论的是妥协解。

  Neumann和Morgenstern在1944年提出的经典理性决策模型—期望效用理论,假设经济活动的主体决策总是遵循利益最大化或者成本最小化的完全理性原则。然而事实上,学术界用大量的实证研究表明人们在实际的决策中大多数情况下都表现出非理性的特点,决策主体存在一定的决策心理偏好。主体决策中的心理偏好一般是指在制定决策的过程中对决策所产生的利益和风险持有独特的看法和反应。学术界研究中经典的决策偏好模型包括有损失厌恶、心理账户、公平性等决策偏好。
  损失厌恶反映了决策者对收益和损失持有的风险偏好不一致,当面对收益时,人们表现为风险厌恶;当面对损失时,人们却表现为风险追逐,因此常常做出与完全理性偏离的决策。心理账户是指决策者会将客观等价的支出或收益在心理上划分到不同的账户中,在制定决策时对不同的账户持有不同的权重系数,总是以不同的态度对待等值的收益或者支出,进而做出带有偏差的决策。公平性偏好(Fairness Preference)是指决策者持有的利益分配心理基准,并在此基础上产生的对收益不公平结果的一种抵制行为。
  1979 年,美国普林斯顿大学心理学教授Daniel Kahneman和Amos Tversky将心理学与经济学研究结合,提出了关于不确定条件下的人类判断和决策的“前景理论”(prospect theory),也叫“展望理论”。该理论认为个人基于心理参考点的不同,会有不同的风险态度,参考点会影响个体对实际决策结果的心理感知,主观地衡量效用价值的“获得”和“损失”,从而导致偏离期望效用理论的非理性决策行为,在不同的风险预期条件下,人们的行为倾向是可以预测的。同一个问题经由不同的决策主体可能会有不同的决策结果。由前景理论引申出的四个基本结论:
  第一,确定效应,即大多数人在面临获利的时候是风险规避的;第二,反射效应,即大多数人在面临损失的时候是风险喜好的;第三,参照依赖,即大多数人对得失的判断往往根据参考点决定;第四,损失效应,即大多数人对损失比对收益更敏感。
  Kahneman他们最初的研究认为标准前景是一种简单前景;而后来Tversky和Kahneman(1992)进一步将原始前景理论拓展到包含任意多个结果的不确定前景及风险前景,形成积累前景理论。
  针对运作管理问题领域,Schweitzer和Cachon(2000)首次通过引入心理学的实验实证检验方法检验了包括前景理论在内的众多行为因素对报童决策偏差的影响,实验结果却排除了前景理论的解释作用。Nagarajan等(2014)[ ]基于累积前景理论的价值函数和非线性权重函数构建了综合模型,研究结论也对“前景理论用于分析运作管理问题”提出了质疑。但是,一些学者的研究结果认为,Schweitzer等人的实验结果恰恰说明前景理论具有报童模型的决策偏差的解释作用(Ho,2010 ;Long,2015;Zhao,2015,褚宏睿等,2015;丁小东,2016)
  前景理论在一定程度上解释了沉没成本效应对消费者决策的影响,而Thaler认为这种解释并不充分,Thaler(1985)提出的心理账户理论认为,沉没成本之所以会影响消费者决策,除了前景理论外,在消费者内心中还存在着一个“心理账户系统”,个体在做决策的过程中,该系统包含着一个心理估价的运算过程,会自发地对获得与损失进行计算,将不同的得失放入不同类别的心理账户中,并在选择前对此作出衡量,由于消费者对不同的经济结果存在心理上的权重,常常会导致决策违背经济学的规律,Thaler同时提出了非替代性(non-funiginility)是心理账户的一个基本特征[ ]。顾军波等人(2020)[ ]基于心理账户将前景理论拓展用于复合结果情形,证实在偏好的特定组合下,前景理论能够解释报童趋中效应,报童趋中效应可归因于基于多重心理账户建构的价值函数。

  总之上面是灌水的话,主要是深刻理解心理账户区间,以及决策偏好期间,并同函数以及排序与偏序结合契合起来。

上面是博士论文吹水用的。

客观性

  这取决于原始数据的特点,原始数据很多是基于统计数据,来源真实是最突出的一个特点。它不是基于拍脑袋得来的数据。

数据的标准化规范化(归一化)方法上存在着诸多的比较空间。

  上面提及了极差法、欧式距离法、均值标准化、Logistics函数、反三角函数、对数压缩数据法。六种形式的规范化方法。例子中采用了使用最为广泛的极差法。在实际的运用场景中,根据数据的特征分布,各种方法有其自身的特点与优势。因此SAISM中后续的方式方法不变,对不同的归一化方法所得的Q值排序情况的比较是今后进一步研究的一个方向。

求权重的方法存在着诸多的进一步研究的空间。

  在其它页面不算组合赋权法,列出了变异系数法、复相关系数、CRITIC法、熵权法、反熵权法、主成分分析、因子分析权数法、层次分析法、网络分析法11种方法。客观赋权法主要是通过数据本身的分布特征由不同的指导思想从而获得各个指标的权重。它更强调的更依赖的是数据本身。主观赋权法主要指专业领域人员依靠专业知识、经验,通过主观判断来确定指标权重的方法。主观赋权法中最为常用的AHP与ANP方法。客观赋权法的熵权法是用得最多的客观赋权方法。主观赋权法与客观赋权法各有优势,各有侧重点,为了调和两种方法出现了各种主客观组合赋权法。因此,VIKOR中保持其它的方式方法不变,对不同的赋权法最后所得的Q值排序情况进行比较是今后进一步研究的一个方向。

几何形变变换公式是今后进一步研究的最重要内容。

  VIKOR的几何形变变换公式,即用带权值的曼哈顿距离公式与切比雪夫距离公式。 根据开源网站 huaxuejia.cn/ism/D_S_N. 给出的距离公式最少有60种。因此把S抽象为一种几何形变方式,代表一种特定的意义如高期望值,中期望值等。把R抽象为另外一张几何形变方式,代表与S不同的特点意义如高悔恨值,中遗憾值。任意两个不同类型的距离公式,可以得到一组不同的博弈组合。因此,VIKOR中保持其它的方式方法不变,对不同的一组距离公式最后所得的Q值排序情况进行比较是今后最重要的一个研究方向之一。以此类推,经典的VIKOR是通过两个距离公式求妥协解,也可以把两级拓展到三级,甚至更多级。即可以是X、Y、Z三个维度,再通过三个维度求妥协值。

区段截取边界获得的实验设计是今后研究的一个重要方向。

  采用改进的Dephil法获取K值区间的过程虽然具有科学性,最终得到的边界值是可信的,但是其存在着明显的劣势,即它是基于特定专业人士的小群体。对于大的共同参与决策的群体,用统计的方式获得区段截取的边界值是今后研究的一个重要研究方向。


上面是一个例子。

上面是原始数据

把优看成100分, 良是90分 中是75分 差是 0分

然后自动计算,最后的结果如下:

就上面六种排序的可能。

至于区段截取就另外讨论了。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有