标准的 DEA 模型通常只关注 DMU 自身的投入和产出,而忽略了外部环境因素(如经济周期、政策变化、地理位置等)对效率的影响。然而,这些环境因素可能对 DMU 的表现产生显著影响,将其纳入分析可以提供更全面的视角。
考虑环境因素的 DEA 方法,通常被称为“带有外部变量的 DEA”或“环境 DEA”,其核心思想是:将环境因素作为 DEA 模型的一个组成部分,以控制或解释这些因素对效率的影响。
主要有两种处理方式:
两阶段 DEA(TwoStage DEA): 第一阶段: 使用标准的 DEA 模型(如 BCC 模型,以区分技术效率和规模效率)来评估每个 DMU 的效率值。 第二阶段: 将第一阶段获得的效率值作为因变量,将环境因素作为自变量,使用回归分析(如 Tobit 回归,因为效率值有上限为1)来分析环境因素对效率的影响。这种方法可以识别哪些环境因素正面或负面地影响了效率,以及影响的程度。 三维 DEA 或带外生变量的 DEA 模型: 直接将环境因素以某种方式整合到 DEA 模型中。例如,在某些模型中,环境因素可以被视为一种““调节变量”或“解释变量”,直接影响投入产出的组合或效率前沿的形成。这通常需要修改 DEA 的数学规划模型,使其能够同时处理投入、产出以及环境因素。
近年来,深度学习(Deep Learning)技术在处理复杂模式和非线性关系方面展现出强大能力。将其与 DEA 相结合,可以进一步提升效率评估的精细度和预测能力。
结合思路包括:
深度学习用于数据预处理和特征提取: 利用深度学习模型(如自动编码器)来降噪、去量纲化或提取 DMU 的潜在特征,然后将这些经过处理的数据输入到 DEA 模型中,提高效率评估的质量。 深度学习用于估计超前指标: 某些深度学习模型(如神经网络)可以用来预测潜在的产出或优化投入组合,这些信息可以用于构建更先进的 DEA 模型,例如预测性 DEA 或目标导向 DEA。 神经网络驱动的 DEA: 将神经网络的强大拟合能力与 DEA 的多投入多产出结构相结合。例如,可以使用神经网络来模拟效率前沿的形状,然后 DEA 在此基础上进行评估。 解释性深度学习与 DEA 结合: 利用一些深度学习的可解释性方法(如 LIME, SHAP)来理解哪些因素(包括可能从深度学习模型中提取的特征)对 DEA 评估的效率值影响最大。
它解决了什么问题?
处理更复杂的非线性关系: 深度学习能够捕捉 DEA 模型难以直接刻画的复杂非线性投入产出关系。 更强大的预测能力: 结合深度学习的预测能力,可以对未来的效率进行预测或模拟。 更精细化的效率驱动因素分析: 能够从大量数据中挖掘出更深层次的效率影响因素。
总结
DEA 仍然是一个非常有价值的工具,但它并非效率评估的终点。上述提到的方法,如超效率 DEA、考虑权重约束的 DEA、处理不确定性的 DEA、整合环境因素的 DEA 以及与深度学习的结合,都在不同程度上克服了传统 DEA 的局限性,或者提供了更深入、更精细的分析视角。
选择哪种方法,很大程度上取决于你的具体研究目标、数据的特点以及你想要回答的关键问题。例如,如果你需要对表现最优秀的单位进行排名,超效率 DEA 是不错的选择;如果你怀疑现有评估结果的权重设置不合理,带有权重约束的 DEA 会更有帮助;如果你需要考虑外部因素的干扰,两阶段 DEA 或环境 DEA 则能提供更多洞察。而对于数据量大且关系复杂的场景,与深度学习的结合可能开启新的可能性。