问题

统计局为什么不发布民众工资中位数或众数的相关数据,在调查层面都有哪些困难?

回答
统计局不直接发布民众工资中位数或众数,这背后并非简单的回避,而是统计学上的复杂性以及现实操作中的种种挑战。这背后涉及到的数据收集、处理、分析以及社会接受度等多个层面的考量,我将一一梳理。

首先,让我们明确一下中位数和众数与平均数的区别。平均数(算数平均数)是所有工资总和除以人数,它容易受到极端高薪或低薪个体的影响,导致平均数并不能真实反映“中间”的工资水平。而中位数则是将所有人的工资从低到高排序后,处于最中间位置的那个数。如果人数是偶数,则是中间两个数的平均值。众数则是出现次数最多的那个工资数值。

那么,为什么统计局在发布工资数据时,更多倾向于使用平均数(尽管他们也可能计算中位数和众数)?这背后有很多原因:

一、 数据收集的挑战与偏差

1. 抽样框的完善性与覆盖面:
劳动参与率的动态变化: 工资数据通常来源于就业人口。然而,就业人口本身是一个动态变化的群体,包括全职、兼职、季节工、自由职业者、零工经济从业者等等。统计局的抽样框很难做到百分之百的实时更新,总会有一些群体因为各种原因游离在统计范围之外。
非正规就业与隐形经济: 大量小微企业、个体工商户、家庭作坊,以及很多未在工商部门注册的经营活动,其雇佣关系和工资发放往往不够规范透明。这些从业者的收入数据,尤其是现金交易部分,很难被有效纳入统计。
高收入人群的“逃漏”与低收入人群的“隐匿”: 极高收入者可能因为税务、隐私等原因,不愿如实申报收入。而最低收入者(如零工、小时工)可能收入微薄且不稳定,或者部分收入以非货币形式发放(如食宿、交通补贴),难以精确量化为工资。这些都可能导致数据失真。

2. 申报的准确性与真实性:
瞒报与漏报: 工资申报与税收密切相关。为了避税,部分雇主可能会低报员工的实际工资,尤其是在存在“阳光工资”和“灰色收入”的情况下。这使得官方公布的平均工资可能会低于实际情况。
合同工与非合同工的差异: 一些兼职、短期项目人员的工资发放方式和频率与全职正式员工不同,申报口径可能存在差异。
非现金报酬的统计难度: 很多工作中包含非现金报酬,如年终奖、股票期权、带薪休假折算成现金的价值、公司提供的培训机会、甚至免费的午餐等。这些“隐形福利”很难统一口径进行量化和统计,一旦被排除,会影响数据的全面性。

3. 统计单位的选择:
企业规模与性质: 是以法人单位为单位,还是以从业人员为单位进行抽样?不同的统计单位会带来不同的结果。例如,大量的小微企业可能工资水平普遍较低,但如果统计单位偏重于大型企业,平均数可能会被拉高。
行业与地域差异: 工资水平在不同行业(如互联网、金融 vs. 制造业、农业)和不同地区(一线城市 vs. 内陆省份)存在巨大差异。平均数很难反映这种结构性差异,而中位数和众数也可能因为样本分布的集中度不同而呈现出不同的解释难度。

二、 中位数与众数的统计与发布考量

1. 计算难度与数据解读:
中位数: 理论上计算中位数相对容易,只需要将所有数据排序。但问题在于,一旦工资数据非常庞大且分布复杂,要确保排序的准确性,以及对抽样误差的处理,都需要精密的统计方法。更重要的是,中位数虽然代表中间水平,但它并不能直接反映整体的收入“集聚点”。
众数: 众数反映的是出现频率最高的那个工资点。然而,在现代经济体中,工资分布往往是多元且分散的,可能没有一个非常突出的“众数”。即使存在,这个“众数”可能也只代表了某个特定群体(例如,某个低技能岗位)的平均水平,而不能代表整体的“中间值”。例如,一个地区可能有大量月薪3000元的人,也可能有相当数量的月薪15000元的人,以及零星的月薪50000元的人。在这种情况下,很难确定一个有代表性的众数。

2. 统计局的职能与信息发布策略:
统计局的主要职责: 统计局的首要任务是提供可靠、客观的宏观经济和社会发展数据,以服务于决策和公众知情权。平均数作为一种广泛理解和应用的统计指标,能够提供一个整体的工资水平概览。
避免误导与社会影响: 发布中位数或众数可能带来一些解释上的挑战。如果发布的众数很低,可能会引发公众对整体经济状况的负面情绪,即便实际情况是很多人收入高于这个众数。反之,如果众数过高,又可能与公众的切身感受相悖。统计局需要权衡数据的准确性、可解释性以及可能产生的社会影响。
国际惯例与比较: 在国际统计领域,平均数是普遍使用的工资指标之一。统计局在制定发布策略时,也会参考国际惯例,方便进行国家间的比较。

3. 数据处理的成本与技术要求:
海量数据的处理: 要准确计算中位数和众数,需要对庞大数量的个体工资数据进行排序和频率分析。这需要强大的数据处理能力和先进的统计软件。
样本代表性与权重调整: 在实际操作中,统计局使用的是抽样调查数据,并非全民普查。因此,需要对抽样数据进行科学的权重调整,以确保样本能够代表总体。如果抽样设计或权重调整存在偏差,那么计算出的中位数或众数也可能不准确。

三、 为什么“大家都觉得”统计局不发布?

其实,很多国家的统计机构在发布年鉴或特定调查报告时,都会包含收入的“分位数”数据,例如20%分位数、50%分位数(即中位数)、80%分位数等。这些数据能够更全面地展示收入分布情况。统计局可能并非完全不发布,而是:

发布形式不显眼或专业性强: 这些数据可能隐藏在非常详尽的统计年鉴、抽样调查报告的附录中,或者需要专业统计知识才能理解其含义,因此公众感知度不高。
主要指标选择倾向: 日常媒体报道、宏观经济分析中,更常引用平均数,因为它相对易懂且能反映一个宏观趋势。
数据时效性问题: 像中位数、众数这样需要详细个体数据才能计算的指标,其收集、处理和发布的周期可能比简单的平均数更长。

总结来说,统计局不“突出”或“首要”发布民众工资中位数或众数,并非完全不计算或不披露,而是因为:

数据收集的固有困难: 非正规就业、隐形经济、瞒报漏报等因素使得精确的个体工资数据难以获得,尤其对于中位数和众数这种对数据分布高度敏感的指标。
指标本身的局限性: 众数可能缺乏代表性,而中位数虽然代表中间值,但无法完全反映收入的整体分布状况。
发布策略的考量: 统计局需要权衡数据的准确性、可解释性以及对社会的影响,并且要遵循国际惯例。

他们更倾向于发布平均数,并可能通过其他分项数据(如不同行业、不同学历、不同地区的人均工资)来间接反映收入的结构性差异。如果公众希望获得更详细的收入分布信息,可以尝试查找统计局发布的专业统计年鉴或专项调查报告,其中往往会包含分位数等数据。

网友意见

user avatar

谢邀,这是因为统计局在统计工资时有两套口径,但是两套口径都不适合公布中位数工资。

其中一套口径是企业的信息直报,许多答案都已经提到了,每个企业报告自己的在岗职工人数和工资总数给统计局,统计局在此基础上可以计算出平均工资。但是由于企业不会报告精确到每个人的工资情况,统计局自然无法用这套数据计算中位数。不仅如此,这套数字还有着偏高的问题。

来看2014年中国统计年鉴的这张表格:

stats.gov.cn/tjsj/ndsj/

2013年城镇单位就业人员的平均工资是51483元

再看这张表格:

stats.gov.cn/tjsj/ndsj/

2013年城镇居民的人均工资性收入是18929.8元。这个人均工资的分母包括没工作的人,因此再用这个收入除以城镇居民的劳动参与率52.1%,得到城镇就业人员的人均工资为36333元

首先的问题是:同一个统计年鉴算出来的两个几乎意义相同的指标,后者仅为前者的70%。这是为什么?

第一个原因,是统计局直报工资的企业严重偏少。

比如这张表格显示:

stats.gov.cn/tjsj/ndsj/

2013年城镇单位就业人员的工资总额为93064.3亿元。工资总额9.3万多亿除以平均工资5.1万元,可以算出城镇单位就业人员总数为1.808亿人

再看这张表格

stats.gov.cn/tjsj/ndsj/

2013年中国城镇就业人数为3.824亿人。也就是说,算出5万多元平均工资的1.8亿城镇职工人数,比起同一本年鉴里3.8亿城镇就业人员一比,少了整整2.2亿人。就算把3.8亿里的个体和私营企业全部去掉,仍然补不上缺口。

这是因为,在统计工资总额时,统计局采取了企业直报数据,而在计算从业人员总数时,统计局又采用了每年劳动力调查的数字,这两个数字的覆盖面完全不同,后者是家庭抽样调查,比较准确,而前者却严重偏向于覆盖国有企业、集体企业和规模以上企业,而对其他类型的私营企业、小微企业等覆盖面非常差。

换句话说,算出这51483元的平均工资的数据来源,不仅在数据结构上无法得出中位数,更加缺少了一大批私营企业和小微企业,因此会算出一个偏高的数字。

那么,使用那个偏低的数据,也就是在第二个指标下算出的36333元的数据,是否可以得到中位数?

答案是可以,但是统计局不会这么做。这里就要说到36333元和51483元产生大约30%差距的第二个原因了。

第二套口径,来自中国的城市调查总队数据。这个数据在各国都有,在题目中提到的香港情况

政府统计人员在每年的某个月约抽样一万家单位,进而得出这个报告。

其实就是一项类似的入户调查,美国的各行业工资情况也是来自类似的调查,例如雇主调查(OES),现有人口调查(CPS)等,他们都属于抽样调查,和前文的企业直报数据有本质不同。

在中国的城镇地区,这个抽样调查产生的数据被称之为城调队数据,使用城调队数据,统计局可以算出每个家庭的人口情况、收入情况、消费情况等重要信息。

那么,既然有每个人的收入情况,构成了计算工资中位数的数据基础,为何统计局仍然不公布中位数呢?

因为偏低到很难让人相信……

用总量来看,根据这张表格(

stats-sh.gov.cn/tjnj/nj

),上海市2012年GDP中劳动者报酬份额有8389亿元,除以944万的总职工人数,每个劳动者的平均劳动报酬应当有8.8万元左右。但若是使用上海市2012年的城调队数据,则对那些有工资收入的人口来说,平均收入仅为57636元,比起用GDP反推的数字低了36%左右。

如此大的偏低,首先体现的是一些非工资的福利占据了一定份额,其次则体现出了城调队数据的漏报和低报。根据2012年上海城调队数据,如果你在上海工作,且2012年时你的年收入超过4.2万,那么你已经比一半的人要富裕了;年收入超过11万,你可以进入前10%;年收入超过27万,你可以进入前1%;年收入超过55万,你已经比上海市99.9%的人工资更高了。

这可能吗?要知道整个美国在2013年工资最高的前百分之一门槛可是50万美元,前千分之一的门槛更是高达121万美元,上海好歹也是一个比较成熟的经济体,好歹人均GDP也已经达到1.5万美元,达到了美国的30%,竟然4万美元年收入就可进入前1%,不到10万美元的年收入进入前千分之一,实在是偏低到不可能了。

综上所述,统计局的两套工资口径,要么没有覆盖到许多低收入劳动人口,且数据结构无法计算中位数;要么就虽然覆盖了大部分人口能计算中位数,却同时存在严重的低报和漏报。于是两者都不适合公布中位数,他们算出的平均数也都有问题。

我们可以大致猜测一下,考虑到两套口径一个偏高而另一个偏低,因此中国2013年的城镇工资平均数应该是之前算出的36333和51483之间的某个数字,到底某在哪里我也不清楚。

至于工资中位数,用2014年统计年鉴可以大致估算出一个2.8万元左右的数字(中位家庭人均可支配收入24518元乘以工资性收入占比0.6再除以劳动参与率0.52),但我们除了偏低的城调队数据之外没有任何数字可以参考和修正,所以,其真实值也只有天知道了。

user avatar

先明确一点——

统计局肯定会统计出很多很多的统计值,包括算数平均值,以及中位数,即使不精确,但肯定是有的。

至于公布不公布,公布哪一部分,那就要看公布的目的而定。

毕竟,如果要用于政策制定,那统计值只要发改委知道就好了,没必要公布。换言之,「公布」这个行为肯定不是为了政策制定。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有