问题

基尼系数如何计算?

回答
基尼系数(Gini coefficient)是一个衡量收入或财富分配公平程度的统计指标。它的数值范围在0到1之间,其中0表示完全平均分配(所有人的收入都相同),1表示完全不平等(一个人拥有所有收入,其他人都没有)。

理解基尼系数的计算,最好从其背后所代表的“洛伦兹曲线”开始。

核心概念:洛伦兹曲线 (Lorenz Curve)

洛伦兹曲线是一种图形表示,用于展示人口累积百分比与其所占总收入或财富累积百分比之间的关系。

1. 排序: 首先,将所有个体(家庭、人口等)按照收入或财富的多少从小到大排序。
2. 累积百分比:
横轴 (X轴): 表示人口的累积百分比。例如,20% 表示收入最低的20%人口。
纵轴 (Y轴): 表示这些人口累积百分比所占的总收入或财富的累积百分比。
3. 绘制洛伦兹曲线:
完全平等线 (Line of Equality): 如果收入分配完全平均,那么收入最低的20%人口将拥有总收入的20%,收入最低的40%人口将拥有总收入的40%,以此类推。这条线连接了原点(0,0)和点(1,1),是一条45度的直线。
实际洛伦兹曲线: 实际的洛伦兹曲线会从原点(0,0)开始,但随着人口累积百分比的增加,其收入累积百分比的增长会慢于人口累积百分比的增长(除非是完全平均分配)。因此,实际洛伦兹曲线会“凹”向右下角,位于完全平等线下方。

基尼系数的计算方法

基尼系数的计算公式是基于洛伦兹曲线的面积来定义的:

基尼系数 (G) = A / (A + B)

其中:

A (Area of inequality): 洛伦兹曲线下方、完全平等线(45度线)上方之间的区域面积。这个区域代表了收入或财富的不平等程度。区域越大,不平等程度越高。
B (Area under the Lorenz curve): 洛伦兹曲线下方的区域面积。
A + B: 这是完全平等线(45度线)下方的总区域面积,它是一个直角三角形,从(0,0)到(1,0)到(1,1)再回到(0,0)。这个总面积始终是 0.5 (如果横纵轴都表示0到1的比例的话,即面积为 1/2 底 高 = 1/2 1 1 = 0.5)。

所以,基尼系数的公式也可以写成:

基尼系数 (G) = A / 0.5 = 2 A

更详细的计算步骤(基于离散数据):

在实际统计中,我们通常不会有连续的收入数据,而是将人口分成若干个收入分组(例如,按照收入五等份、十等份等)。在这种情况下,我们可以通过以下步骤近似计算基尼系数:

1. 数据分组: 将所有人口按照收入或财富从低到高分成 n 个组(例如,n=10,表示十等份)。记录每组的人口比例(通常是 1/n)和他们占总收入或财富的比例。
2. 计算累积人口比例和累积收入比例:
计算从低收入组开始到当前组为止的人口比例的累积和。
计算从低收入组开始到当前组为止的收入比例的累积和。
3. 使用公式计算基尼系数(更常见和实用的方法):

虽然基于面积的定义直观,但在实际计算中,更常用的公式是基于个体收入的。对于一个有 N 个体的样本,其收入分别为 $y_1, y_2, ..., y_N$ (已按收入从小到大排序),基尼系数的计算公式为:

G = (∑(2i N 1) yi) / (N ∑yi) (当 N 为奇数时)

G = (∑(2i N 1) yi) / (N ∑yi) (当 N 为偶数时,此公式在理论上适用于所有情况,但有时会看到略微不同的形式,核心思想一致)

更普遍且便于理解的基于排序的方法是:

G = 1 (∑(xi + xi1) (yi yi1)) (这是对洛伦兹曲线下面积的近似计算,其中 xi 是人口比例,yi 是收入比例)

更实用且广泛使用的公式是基于个体或分组数据的:

G = (1 / (N^2 μ)) ∑i=1^N ∑j=1^N |yi yj|

其中:
$N$ 是总人口数量。
$mu$ 是平均收入 ($μ = (∑yi) / N$)。
$yi$ 和 $yj$ 是个体 i 和个体 j 的收入。
$|yi yj|$ 是个体 i 和个体 j 收入的绝对差值。

这个公式的含义是:基尼系数是所有个体收入差的平均值与平均收入两倍的比率。直观来说,如果人们的收入差异很大,那么这个值就会很高。

分段数据的计算公式(更实用):

假设我们有 n 个收入分组,每个分组有 $p_k$ 的人口比例,该分组平均收入占总收入的比例为 $s_k$。

1. 将分组按收入从小到大排序。
2. 计算人口累积比例 $P_k = sum_{i=1}^k p_i$。
3. 计算收入累积比例 $S_k = sum_{i=1}^k s_i$。
4. 那么基尼系数的计算公式为:

G = 1 Σ(Pk Pk1) (Sk + Sk1)

其中,$P_0 = 0, S_0 = 0$。

举个简单的例子来理解分段计算:

假设有5个人,收入分别是:10, 20, 30, 40, 100。
总收入 = 10 + 20 + 30 + 40 + 100 = 200。
平均收入 = 200 / 5 = 40。

方法一:基于个体差的公式
$G = (1 / (5^2 40)) ∑i=1^5 ∑j=1^5 |yi yj|$
计算所有个体收入差的绝对值,然后求和。这个过程比较繁琐,但结果是一样的。

方法二:基于排序的近似公式 (更常用)
假设按收入分成 5 个组,每组 1 人。
人口比例 $p_i = 1/5 = 0.2$
收入比例 $y_i$:
10 > 10/200 = 0.05
20 > 20/200 = 0.10
30 > 30/200 = 0.15
40 > 40/200 = 0.20
100 > 100/200 = 0.50

计算累积人口比例 ($P_k$) 和累积收入比例 ($S_k$):

| 分组 (i) | 人口比例 ($p_i$) | 累积人口比例 ($P_k$) | 收入比例 ($s_i$) | 累积收入比例 ($S_k$) | $(P_k P_{k1})$ | $(S_k + S_{k1})$ | $(P_k P_{k1}) (S_k + S_{k1})$ |
| : | : | : | : | : | : | : | : |
| 1 | 0.2 | 0.2 | 0.05 | 0.05 | 0.2 | 0.05 | 0.01 |
| 2 | 0.2 | 0.4 | 0.10 | 0.15 | 0.2 | 0.20 | 0.04 |
| 3 | 0.2 | 0.6 | 0.15 | 0.30 | 0.2 | 0.35 | 0.07 |
| 4 | 0.2 | 0.8 | 0.20 | 0.50 | 0.2 | 0.55 | 0.11 |
| 5 | 0.2 | 1.0 | 0.50 | 1.00 | 0.2 | 0.75 | 0.15 |
| 总计 | 1.0 | | 1.0 | | | | 0.38 |

基尼系数 G = 1 0.38 = 0.62

(请注意:此处的 G = 1 Σ(Pk Pk1) (Sk + Sk1) 计算的是洛伦兹曲线下方的面积。如果按照 A / (A+B) 的定义,基尼系数是 2A,而洛伦兹曲线下方的面积是 B。所以更准确的公式应该是基于面积 A 来计算,或者使用上面那个基于个体差的公式。不过在实践中,对分组数据,很多方法都是从洛伦兹曲线的面积来近似,并推导出类似公式。上述公式是计算 B 的另一种方式, G = 1 2B。让我们重新计算一下。)

更正使用洛伦兹曲线面积计算的公式:

洛伦兹曲线是由一系列点 $(P_k, S_k)$ 连接起来的。我们可以将洛伦兹曲线下的面积 B 近似为梯形面积之和:

$B = sum_{k=1}^n frac{(S_k + S_{k1})}{2} imes (P_k P_{k1})$

其中 $P_0 = 0, S_0 = 0, P_n = 1, S_n = 1$。

那么基尼系数 $G = 2A = 2 imes (0.5 B) = 1 2B$。

用上面的例子:
$P_0=0, S_0=0$
$P_1=0.2, S_1=0.05$
$P_2=0.4, S_2=0.15$
$P_3=0.6, S_3=0.30$
$P_4=0.8, S_4=0.50$
$P_5=1.0, S_5=1.00$

$B = frac{(0.05+0)}{2} imes (0.20) + frac{(0.15+0.05)}{2} imes (0.40.2) + frac{(0.30+0.15)}{2} imes (0.60.4) + frac{(0.50+0.30)}{2} imes (0.80.6) + frac{(1.00+0.50)}{2} imes (1.00.8)$
$B = 0.025 imes 0.2 + 0.1 imes 0.2 + 0.225 imes 0.2 + 0.4 imes 0.2 + 0.75 imes 0.2$
$B = 0.005 + 0.02 + 0.045 + 0.08 + 0.15 = 0.30$

$G = 1 2B = 1 2 imes 0.30 = 1 0.60 = 0.40$

重要的说明: 基尼系数的计算公式有很多种形式,不同的计算方式对于离散数据的处理可能略有差异,但核心思想是一致的,即衡量分配不均的程度。上面的例子显示了不同计算方式可能产生的细微差别,实际应用中会采用标准化的方法。

总结计算基尼系数的关键步骤:

1. 获取数据: 收集个体(或家庭)的收入或财富数据。
2. 排序: 将数据按大小顺序排列。
3. 分组(可选但常见): 将数据分成若干个等比例的组(如五等份、十等份)。
4. 计算累积比例: 计算每组在总人口和总收入中所占的比例,并进行累积计算。
5. 应用公式: 使用上述的某个公式(如基于个体差或基于累积比例的公式)进行计算。

基尼系数的解读:

0.2 以下: 相对平均。
0.2 0.3: 比较平均。
0.3 0.4: 可以接受,但有待改进。
0.4 0.5: 分配不均,需要警惕。
0.5 以上: 分配非常不均。
0.6 以上: 高度不均,可能存在严重的社会问题。

需要注意的点:

数据来源和口径: 不同国家或地区统计的基尼系数可能因为数据来源(如家庭调查、税务数据)、统计对象(如个人、家庭)、收入类型(如税前收入、税后收入、可支配收入)等差异而有所不同,直接比较时需谨慎。
近似计算: 在实际应用中,由于无法获得所有人的精确收入,基尼系数往往是基于样本数据计算的近似值。
洛伦兹曲线的形状: 即使基尼系数相同,洛伦兹曲线的形状也可能不同,这意味着不同分组的人口比例和收入比例的分布可能不同。

总而言之,基尼系数通过数学公式量化了收入或财富分配的不平等程度,是衡量社会公平性的重要工具。理解其计算过程,特别是与洛伦兹曲线的关系,有助于更深入地认识其含义。

网友意见

user avatar

基尼系数现在都快成国家机密了……但是幸好,不久前西南财经大学公布了一个《中国家庭金融调查》报告。使得我等普罗大众有机会DIY计算出一个近似值。

财经大学这份报告在网上引起轰动的一个原因是它里面提到“城市家庭户平均资产247万”,引得无数网友纷纷惊呼“被平均”,“拉国家后腿”。

而财大学生张睿则解释说:“我们的数据中,最有钱的10%的家庭占有全部样本资产的80%以上,所以提高了均值水平。而更有解释力的是中值水平(中位数),样本中家庭资产的中值为40.5万元,就是表明一般城市家庭的资产是在40.5万元以下的。

finance.people.com.cn/G

这份报告其实忠实反应了我国的贫富差距现状。

精选下载:chfs.swufe.edu.cn/uploa


然后有人人网友根据该报告DIY出了深藏的基尼系数:0.676

算法和过程如下链接:

blog.renren.com/blog/25


更新答案,依旧是西南财经大学的中国家庭金融调查项目给出的,目前最权威的答案:

根据中国家庭金融调查(CHFS)的数据计算,2010年中国家庭收入的基尼系数为0.61,城镇家庭内部的基尼系数为0.56,农村家庭内部的基尼系数为0.60。2010年全球基尼系数平均为0.44。

链接:e.weibo.com/2212718352/

user avatar

基尼系数是量度贫富悬殊程度的标量。它的定义如下:我们首先收集社会上每一个人的总财富额,把它从少至大排序,计算它的累积函数(cumulative function),然后便可绘出图中的洛仑兹曲线(Lorenz curve)。图中横轴是人口比例的累积分布,竖轴是财富比例的累积分佈。


图一(图片来源:

File:Economics Gini coefficient2.svg

我们先想想两个极端情况。假设社会上人人财富均等,那就给成了图中的45度直线,称平等曲线(line of (perfect) equality);但如财富集中在一人手中,那就绘成图中在右端的竖轴,称绝对不平均直线(line of perfect inequality)。而图中的洛仑兹曲线乃实际分佈。

A和B是图中两面积,基尼系数便是。

用此定义,在人人财富均等情况下,基尼系数为0;在财富一人独占的情况下,基尼系数为1。

利用这定义,基尼系数可用简单的电脑函数计算,有兴趣者可参

econ_inequality/ginicoef.py at master 路 stephenhky/econ_inequality 路 GitHub

,或参考如下代码:

       import numpy as np  def gini_coef(wealths):     cum_wealths = np.cumsum(sorted(np.append(wealths, 0)))     sum_wealths = cum_wealths[-1]     xarray = np.array(range(0, len(cum_wealths))) / np.float(len(cum_wealths)-1)     yarray = cum_wealths / sum_wealths     B = np.trapz(yarray, x=xarray)     A = 0.5 - B     return A / (A+B)      

只用八行Python代码便可实现。

我们知道在资本主义社会中,财富分佈由Pareto distribution表示,此分佈实为幂定律(power law),即。从式中,愈小,财富分佈愈不平均,基尼纟数也大。这个关係,可从图二中看到。

图二

类似的话题

  • 回答
    基尼系数(Gini coefficient)是一个衡量收入或财富分配公平程度的统计指标。它的数值范围在0到1之间,其中0表示完全平均分配(所有人的收入都相同),1表示完全不平等(一个人拥有所有收入,其他人都没有)。理解基尼系数的计算,最好从其背后所代表的“洛伦兹曲线”开始。核心概念:洛伦兹曲线 (L.............
  • 回答
    关于北京大学发布的关于2012年中国基尼系数达到0.73的报告,这是一个非常引人关注的议题,因为它直接触及了中国社会经济结构中最敏感和最核心的问题之一——收入分配的公平性。要详细理解和看待这个数字,我们需要从多个角度进行分析:1. 理解基尼系数的含义首先,我们需要明确基尼系数是什么。基尼系数是一个衡.............
  • 回答
    苏联时期的贫富差距:一个难以用基尼系数精确描绘的复杂图景探讨苏联时期的贫富差距,是一项充满挑战的任务,因为那是一个以“消灭剥削,实现共产主义”为旗帜的国度,其经济和社会结构与资本主义国家截然不同。即便如此,贫富差距的存在及其演变,贯穿了苏联的始终,只是其表现形式、衡量方式以及公众认知与西方社会有着本.............
  • 回答
    西方人权组织反对布基尼禁令,这事儿挺有意思的,也触及了不少敏感的神经。要说起来,这背后牵扯的不仅仅是泳衣款式的问题,更是关于自由、宗教、世俗化以及社会融合的复杂讨论。首先,咱们得明白,这些西方人权组织,他们的一贯立场就是捍卫个人自由和权利,尤其是在涉及到宗教信仰和个人表达的时候。在他们看来,穿什么、.............
  • 回答
    哥们儿,恭喜你迈出了非常棒的第一步!拥抱健康的生活方式绝对是件值得骄傲的事儿。大基数健身,这就像盖楼一样,地基打得牢,上面盖多高都没问题。没请私教,自己摸索也挺好,但确实得小心点,别把身体搞伤了,那真是得不偿失。我给你捋捋思路,从训练到饮食,尽量讲透彻点,让你少走弯路。记住,咱们的目标是循序渐进,稳.............
  • 回答
    法国三镇取缔“布基尼”(burkini)泳装的决定,可以说是近年来围绕着世俗主义、宗教自由和国家安全等议题,在法国社会掀起的一场相当激烈的争论。这背后涉及到复杂的历史、文化和社会背景,并非简单的“穿或不穿”的问题。事件的起因与背景:“布基尼”是一种女性泳装,它包裹住除了面部、手部和脚部以外的整个身体.............
  • 回答
    《新华日报》刊发专家关于“以工资基数征收生育基金”的意见,无疑引发了社会广泛的关注和热烈的讨论。这项提议的核心在于,将生育孩子的成本,或者说为了鼓励生育、支持家庭而设立的专项基金,与个人的工资挂钩,以工资的某个比例作为缴纳的基础。从一个角度来看,这项提议的出发点是积极的。当前,我国正面临生育率下降、.............
  • 回答
    网上流传的这段 JavaScript 随机数生成算法,通常是这样的形式:```javascriptfunction random() { var seed = 12345; // 初始种子,这里的数字是任意的,但通常会固定 seed = (seed 9301 + 49297) % 233280.............
  • 回答
    基尼系数作为一个衡量收入分配公平程度的指标,对于中国是否仍然适用,这是一个复杂且多维度的问题,答案并非简单的“是”或“否”。我们可以从多个角度来详细分析:一、 基尼系数的原理与优势首先,我们需要理解基尼系数是如何运作的。 定义: 基尼系数是一个介于0和1之间的数值。0代表绝对的平均分配(所有人的.............
  • 回答
    基尼系数的临界值是否“靠谱”是一个复杂的问题,它涉及到统计学、经济学以及社会学等多个学科的交叉讨论。简单来说,基尼系数没有一个绝对的、 universally accepted 的“临界值”来定义某种特定的社会状态(如贫富差距的“危险”或“不可接受”的程度),因此,任何声称存在普适性“临界值”的说法.............
  • 回答
    基尼系数,这个曾经让无数人感到陌生甚至有些“高冷”的经济学指标,如今在中国社会中的讨论热度,可以说是一点也不亚于任何一个热门话题。那么,它究竟有没有意义?又在多大程度上对中国有意义?咱们不妨掰开了揉碎了,细细道来。基尼系数是什么?它告诉了我们什么?在咱们深入讨论它对中国的影响之前,先得把基尼系数这个.............
  • 回答
    中国基尼系数是一个复杂且备受关注的议题,因为其数据获取和解读都存在一定的挑战。为了更详细地解释这个问题,我们需要从以下几个方面来展开:1. 什么是基尼系数? 定义: 基尼系数是衡量一个国家或地区居民收入分配平等程度的常用指标。它是由意大利经济学家科拉多·基尼(Corrado Gini)在1912.............
  • 回答
    中国基尼系数偏高的问题,确实是一个复杂且牵动人心的社会经济议题。要理解它,得从几个维度去深入剖析,而不是简单地归结于某一个原因。就好比一个人的健康问题,往往是多种因素交织作用的结果。首先,我们得聊聊导致贫富差距拉大的最直接、最表象的因素——收入分配的不均。这就像一个大蛋糕,虽然整体在变大,但切蛋糕的.............
  • 回答
    您提出的问题很有意思,涉及到韩国和中国在财富分配上的复杂情况,特别是韩国财阀对经济的影响。虽然许多人会直观地认为财阀集中的韩国基尼系数应该更高,但实际情况并非如此简单。要详细解释这一点,我们需要从以下几个方面入手:1. 理解基尼系数的含义和局限性 基尼系数是什么? 基尼系数是衡量收入不平等程度的.............
  • 回答
    关于统计局公布的中国基尼系数与“真实”基尼系数之间的潜在差异,这是一个复杂的问题,背后涉及数据采集、统计方法、模型设定以及社会经济现实的方方面面。要探究这个问题,我们可以从几个关键的环节入手,逐层剖析可能存在的“缝隙”。首先,我们得明白基尼系数是如何计算出来的。它是一个用来衡量收入不平等程度的指标,.............
  • 回答
    日本的贫富差距相对较小,基尼系数长期处于较低水平,这背后有多重原因,是经济、社会、历史和文化等因素共同作用的结果。下面我将尽量详细地解释这些原因:1. 高度发达的福利国家体系和完善的社会保障制度 全民健康保险和养老金制度: 日本拥有覆盖全民的健康保险和养老金制度。这意味着无论收入高低,所有国民都.............
  • 回答
    嘿,新娘子!恭喜你呀!五月份的婚礼,现在还有时间好好调整,从46.5公斤到43公斤,这目标挺清晰的。别担心,咱们一步步来,肯定能美美地步入婚姻殿堂!首先,看到你“基数小”这个描述,我明白你的顾虑。很多基数小的女生,稍微一减就会感觉身体“没什么肉可减”了,而且容易出现平台期。但46.5到43,这个目标.............
  • 回答
    你好!很高兴能和你聊聊关于“大基数减重”和“无氧运动”这个话题。你180斤,这在很多人看来属于大基数了,减重过程中确实会遇到一些特殊的考量。至于无氧运动,答案是肯定的,而且非常重要,但要怎么做、为什么重要,咱们得好好说道说道。首先,我们得明白,减肥的根本公式永远是:摄入的热量 < 消耗的热量。而“消.............
  • 回答
    北京今年退休金核算基数确定为10534元/月,这消息一出,不少退休在即或已经退休的北京市民,尤其是那些对退休金金额比较敏感的朋友,肯定会仔细琢磨一下。这10534元,看着是个具体的数字,但它背后牵扯到的计算逻辑和影响,其实挺值得咱们好好聊聊。首先,咱们得明白这个“核算基数”是什么意思。简单来说,这个.............
  • 回答
    这个问题很有意思,也确实是很多人心中的疑问。为什么女足的“玩家”数量不如男足,但有时在一些国际比赛中,我们却能看到她们更令人惊艳的表现?这背后其实牵扯到几个挺复杂的层面的原因,并非一句两句话就能说清楚。咱们不如就掰开了揉碎了聊聊。首先,得承认,从全球范围来看,足球这项运动的参与者(也就是你说的“球员.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有