上海大学吧 关注:266,350贴子:2,172,094
  • 0回复贴,共1

常用分析方法|熵值法

只看楼主收藏回复

基本原理
熵值法是一种赋权方法,是指用来判断某个指标的离散程度的数学方法。离散程度越大,该指标对综合评价的影响越大。
在信息论中,熵是对不确定性的一种度量。信息量越大,不确定性就越小,熵也就越小;信息量越小,不确定性越大,熵也越大。根据熵的特性,我们可以通过计算熵值来判断一个事件的随机性及无序程度,也可以用熵值来判断某个指标的离散程度,指标的离散程度越大,该指标对综合评价的影响越大。
优缺点
优点:
1. 可操作性强。算法比较简单,excel 操作即可完成
2. 客观精确。指标的能客观的计算出指标权重,有较高的可信度和精确度
3.数据结果客观。是可以确保在确定指标权重时不受主观因素的影响,指标权重可以根据特定的公式和公司数据计算,使评价结果更加客观、准确和科学。
缺点:
1. 过于依赖样本。随着样本变动权重会产生波动(如果样本分布不均或存在异常值,结论可能会失真)
2. 需结合业务经验。无法体现指标之间的关联性(如相关性、层级关系(一级指标和三级指标放一起评估就很奇怪)等),需要结合业务经验来选择指标
计算步骤
1)构造初始评判矩阵
假定对某个系统的评价体系有 m个样本,n个指标,构造其初始评判矩阵X=(xij)max。

其中xij表示第i个样本下的第j个指标的赋值。xij≥0。i =1,2,…,m;j=1,2,…,n。
2)数据标准化处理
数据标准化也叫异质指标同质化,在数据采集过程中,由于不同指标的计量单位不统一,需要对数据进行标准化,消除指标之间的量纲差异,得到指标同质化的矩阵P=(Pij)mxn,
正向指标:

负向指标:

其中,正向指标和负向指标代表着不同的含义,正向指标表示数值越大越好(常应用到效益型指标计算),负向指标表示数值越小越好(常应用到风险指标或成本指标计算)。参考所要评价系统的类型,选择不同的指标。
3)计算第i个样本下的第j个指标的特征权重Y

4)计算指标信息熵值和熵权
计算第j个指标的熵值:

计算信息熵冗余度:

计算第j个指标的熵权:

处理多指标赋权的问题时,熵值法可以消除人为主观赋值带来的结果偏差,规避主观因素的影响,提高评价结果的客观性和准确性。


IP属地:陕西1楼2024-04-09 10:06回复