统计局为什么不发布民众工资中位数或众数的相关数据，在调查层面都有哪些困难？

统计局不直接发布民众工资中位数或众数，这背后并非简单的回避，而是统计学上的复杂性以及现实操作中的种种挑战。这背后涉及到的数据收集、处理、分析以及社会接受度等多个层面的考量，我将一一梳理。

首先，让我们明确一下中位数和众数与平均数的区别。平均数（算数平均数）是所有工资总和除以人数，它容易受到极端高薪或低薪个体的影响，导致平均数并不能真实反映“中间”的工资水平。而中位数则是将所有人的工资从低到高排序后，处于最中间位置的那个数。如果人数是偶数，则是中间两个数的平均值。众数则是出现次数最多的那个工资数值。

那么，为什么统计局在发布工资数据时，更多倾向于使用平均数（尽管他们也可能计算中位数和众数）？这背后有很多原因：

一、数据收集的挑战与偏差

1. 抽样框的完善性与覆盖面：
劳动参与率的动态变化：工资数据通常来源于就业人口。然而，就业人口本身是一个动态变化的群体，包括全职、兼职、季节工、自由职业者、零工经济从业者等等。统计局的抽样框很难做到百分之百的实时更新，总会有一些群体因为各种原因游离在统计范围之外。
非正规就业与隐形经济：大量小微企业、个体工商户、家庭作坊，以及很多未在工商部门注册的经营活动，其雇佣关系和工资发放往往不够规范透明。这些从业者的收入数据，尤其是现金交易部分，很难被有效纳入统计。
高收入人群的“逃漏”与低收入人群的“隐匿”：极高收入者可能因为税务、隐私等原因，不愿如实申报收入。而最低收入者（如零工、小时工）可能收入微薄且不稳定，或者部分收入以非货币形式发放（如食宿、交通补贴），难以精确量化为工资。这些都可能导致数据失真。

2. 申报的准确性与真实性：
瞒报与漏报：工资申报与税收密切相关。为了避税，部分雇主可能会低报员工的实际工资，尤其是在存在“阳光工资”和“灰色收入”的情况下。这使得官方公布的平均工资可能会低于实际情况。
合同工与非合同工的差异：一些兼职、短期项目人员的工资发放方式和频率与全职正式员工不同，申报口径可能存在差异。
非现金报酬的统计难度：很多工作中包含非现金报酬，如年终奖、股票期权、带薪休假折算成现金的价值、公司提供的培训机会、甚至免费的午餐等。这些“隐形福利”很难统一口径进行量化和统计，一旦被排除，会影响数据的全面性。

3. 统计单位的选择：
企业规模与性质：是以法人单位为单位，还是以从业人员为单位进行抽样？不同的统计单位会带来不同的结果。例如，大量的小微企业可能工资水平普遍较低，但如果统计单位偏重于大型企业，平均数可能会被拉高。
行业与地域差异：工资水平在不同行业（如互联网、金融 vs. 制造业、农业）和不同地区（一线城市 vs. 内陆省份）存在巨大差异。平均数很难反映这种结构性差异，而中位数和众数也可能因为样本分布的集中度不同而呈现出不同的解释难度。

二、中位数与众数的统计与发布考量

1. 计算难度与数据解读：
中位数：理论上计算中位数相对容易，只需要将所有数据排序。但问题在于，一旦工资数据非常庞大且分布复杂，要确保排序的准确性，以及对抽样误差的处理，都需要精密的统计方法。更重要的是，中位数虽然代表中间水平，但它并不能直接反映整体的收入“集聚点”。
众数：众数反映的是出现频率最高的那个工资点。然而，在现代经济体中，工资分布往往是多元且分散的，可能没有一个非常突出的“众数”。即使存在，这个“众数”可能也只代表了某个特定群体（例如，某个低技能岗位）的平均水平，而不能代表整体的“中间值”。例如，一个地区可能有大量月薪3000元的人，也可能有相当数量的月薪15000元的人，以及零星的月薪50000元的人。在这种情况下，很难确定一个有代表性的众数。

2. 统计局的职能与信息发布策略：
统计局的主要职责：统计局的首要任务是提供可靠、客观的宏观经济和社会发展数据，以服务于决策和公众知情权。平均数作为一种广泛理解和应用的统计指标，能够提供一个整体的工资水平概览。
避免误导与社会影响：发布中位数或众数可能带来一些解释上的挑战。如果发布的众数很低，可能会引发公众对整体经济状况的负面情绪，即便实际情况是很多人收入高于这个众数。反之，如果众数过高，又可能与公众的切身感受相悖。统计局需要权衡数据的准确性、可解释性以及可能产生的社会影响。
国际惯例与比较：在国际统计领域，平均数是普遍使用的工资指标之一。统计局在制定发布策略时，也会参考国际惯例，方便进行国家间的比较。

3. 数据处理的成本与技术要求：
海量数据的处理：要准确计算中位数和众数，需要对庞大数量的个体工资数据进行排序和频率分析。这需要强大的数据处理能力和先进的统计软件。
样本代表性与权重调整：在实际操作中，统计局使用的是抽样调查数据，并非全民普查。因此，需要对抽样数据进行科学的权重调整，以确保样本能够代表总体。如果抽样设计或权重调整存在偏差，那么计算出的中位数或众数也可能不准确。

三、为什么“大家都觉得”统计局不发布？

其实，很多国家的统计机构在发布年鉴或特定调查报告时，都会包含收入的“分位数”数据，例如20%分位数、50%分位数（即中位数）、80%分位数等。这些数据能够更全面地展示收入分布情况。统计局可能并非完全不发布，而是：

发布形式不显眼或专业性强：这些数据可能隐藏在非常详尽的统计年鉴、抽样调查报告的附录中，或者需要专业统计知识才能理解其含义，因此公众感知度不高。
主要指标选择倾向：日常媒体报道、宏观经济分析中，更常引用平均数，因为它相对易懂且能反映一个宏观趋势。
数据时效性问题：像中位数、众数这样需要详细个体数据才能计算的指标，其收集、处理和发布的周期可能比简单的平均数更长。

总结来说，统计局不“突出”或“首要”发布民众工资中位数或众数，并非完全不计算或不披露，而是因为：

数据收集的固有困难：非正规就业、隐形经济、瞒报漏报等因素使得精确的个体工资数据难以获得，尤其对于中位数和众数这种对数据分布高度敏感的指标。
指标本身的局限性：众数可能缺乏代表性，而中位数虽然代表中间值，但无法完全反映收入的整体分布状况。
发布策略的考量：统计局需要权衡数据的准确性、可解释性以及对社会的影响，并且要遵循国际惯例。

他们更倾向于发布平均数，并可能通过其他分项数据（如不同行业、不同学历、不同地区的人均工资）来间接反映收入的结构性差异。如果公众希望获得更详细的收入分布信息，可以尝试查找统计局发布的专业统计年鉴或专项调查报告，其中往往会包含分位数等数据。

网友意见

谢邀，这是因为统计局在统计工资时有两套口径，但是两套口径都不适合公布中位数工资。

其中一套口径是企业的信息直报，许多答案都已经提到了，每个企业报告自己的在岗职工人数和工资总数给统计局，统计局在此基础上可以计算出平均工资。但是由于企业不会报告精确到每个人的工资情况，统计局自然无法用这套数据计算中位数。不仅如此，这套数字还有着偏高的问题。

来看2014年中国统计年鉴的这张表格：

http://www. stats.gov.cn/tjsj/ndsj/ 2014/zk/html/Z0411C.JPG

2013年城镇单位就业人员的平均工资是51483元

再看这张表格：

http://www. stats.gov.cn/tjsj/ndsj/ 2014/zk/html/Z0605C.JPG

2013年城镇居民的人均工资性收入是18929.8元。这个人均工资的分母包括没工作的人，因此再用这个收入除以城镇居民的劳动参与率52.1%，得到城镇就业人员的人均工资为36333元。

首先的问题是：同一个统计年鉴算出来的两个几乎意义相同的指标，后者仅为前者的70%。这是为什么？

第一个原因，是统计局直报工资的企业严重偏少。

比如这张表格显示：

http://www. stats.gov.cn/tjsj/ndsj/ 2014/zk/html/Z0410C.JPG

2013年城镇单位就业人员的工资总额为93064.3亿元。工资总额9.3万多亿除以平均工资5.1万元，可以算出城镇单位就业人员总数为1.808亿人。

再看这张表格

http://www. stats.gov.cn/tjsj/ndsj/ 2014/zk/html/Z0402C.JPG

2013年中国城镇就业人数为3.824亿人。也就是说，算出5万多元平均工资的1.8亿城镇职工人数，比起同一本年鉴里3.8亿城镇就业人员一比，少了整整2.2亿人。就算把3.8亿里的个体和私营企业全部去掉，仍然补不上缺口。

这是因为，在统计工资总额时，统计局采取了企业直报数据，而在计算从业人员总数时，统计局又采用了每年劳动力调查的数字，这两个数字的覆盖面完全不同，后者是家庭抽样调查，比较准确，而前者却严重偏向于覆盖国有企业、集体企业和规模以上企业，而对其他类型的私营企业、小微企业等覆盖面非常差。

换句话说，算出这51483元的平均工资的数据来源，不仅在数据结构上无法得出中位数，更加缺少了一大批私营企业和小微企业，因此会算出一个偏高的数字。

那么，使用那个偏低的数据，也就是在第二个指标下算出的36333元的数据，是否可以得到中位数？

答案是可以，但是统计局不会这么做。这里就要说到36333元和51483元产生大约30%差距的第二个原因了。

第二套口径，来自中国的城市调查总队数据。这个数据在各国都有，在题目中提到的香港情况

政府统计人员在每年的某个月约抽样一万家单位，进而得出这个报告。

其实就是一项类似的入户调查，美国的各行业工资情况也是来自类似的调查，例如雇主调查（OES），现有人口调查（CPS）等，他们都属于抽样调查，和前文的企业直报数据有本质不同。

在中国的城镇地区，这个抽样调查产生的数据被称之为城调队数据，使用城调队数据，统计局可以算出每个家庭的人口情况、收入情况、消费情况等重要信息。

那么，既然有每个人的收入情况，构成了计算工资中位数的数据基础，为何统计局仍然不公布中位数呢？

因为偏低到很难让人相信……

用总量来看，根据这张表格（

http://www. stats-sh.gov.cn/tjnj/nj 13.htm?d1=2013tjnj/C0408.htm

），上海市2012年GDP中劳动者报酬份额有8389亿元，除以944万的总职工人数，每个劳动者的平均劳动报酬应当有8.8万元左右。但若是使用上海市2012年的城调队数据，则对那些有工资收入的人口来说，平均收入仅为57636元，比起用GDP反推的数字低了36%左右。

如此大的偏低，首先体现的是一些非工资的福利占据了一定份额，其次则体现出了城调队数据的漏报和低报。根据2012年上海城调队数据，如果你在上海工作，且2012年时你的年收入超过4.2万，那么你已经比一半的人要富裕了；年收入超过11万，你可以进入前10%；年收入超过27万，你可以进入前1%；年收入超过55万，你已经比上海市99.9%的人工资更高了。

这可能吗？要知道整个美国在2013年工资最高的前百分之一门槛可是50万美元，前千分之一的门槛更是高达121万美元，上海好歹也是一个比较成熟的经济体，好歹人均GDP也已经达到1.5万美元，达到了美国的30%，竟然4万美元年收入就可进入前1%，不到10万美元的年收入进入前千分之一，实在是偏低到不可能了。

综上所述，统计局的两套工资口径，要么没有覆盖到许多低收入劳动人口，且数据结构无法计算中位数；要么就虽然覆盖了大部分人口能计算中位数，却同时存在严重的低报和漏报。于是两者都不适合公布中位数，他们算出的平均数也都有问题。

我们可以大致猜测一下，考虑到两套口径一个偏高而另一个偏低，因此中国2013年的城镇工资平均数应该是之前算出的36333和51483之间的某个数字，到底某在哪里我也不清楚。

至于工资中位数，用2014年统计年鉴可以大致估算出一个2.8万元左右的数字（中位家庭人均可支配收入24518元乘以工资性收入占比0.6再除以劳动参与率0.52），但我们除了偏低的城调队数据之外没有任何数字可以参考和修正，所以，其真实值也只有天知道了。

先明确一点——

统计局肯定会统计出很多很多的统计值，包括算数平均值，以及中位数，即使不精确，但肯定是有的。

至于公布不公布，公布哪一部分，那就要看公布的目的而定。

毕竟，如果要用于政策制定，那统计值只要发改委知道就好了，没必要公布。换言之，「公布」这个行为肯定不是为了政策制定。

类似的话题

统计局为什么不发布民众工资中位数或众数的相关数据，在调查层面都有哪些困难？

统计局不直接发布民众工资中位数或众数，这背后并非简单的回避，而是统计学上的复杂性以及现实操作中的种种挑战。这背后涉及到的数据收集、处理、分析以及社会接受度等多个层面的考量，我将一一梳理。首先，让我们明确一下中位数和众数与平均数的区别。平均数（算数平均数）是所有工资总和除以人数，它容易受到极端高薪或低.............
罗马帝国为什么不统一欧洲向北发展而选择向东呢?

罗马帝国之所以选择向东发展而非向北统一欧洲，背后有着复杂的地缘政治、经济、军事以及历史文化等多重因素的考量。简单地说，罗马人并非“不”向北发展，而是他们发展的重点和战略重心更倾向于东方，并认为那里的回报更大，风险相对可控。首先，地理与战略的吸引力：东方拥有更成熟的文明和更丰厚的财富。想象一下当时的欧.............
银联为何不将多家银行的银行卡合并并且统一发售？

你这个问题很有意思，深入触及了银联作为支付清算机构的定位以及其背后的商业逻辑。很多人可能觉得，既然大家都在用银联网络，那为什么不直接把大家手里的不同银行的卡片“整合”一下，变成一张“超级银联卡”呢？这背后其实有几个关键的因素在作用，让事情不像看起来那么简单。首先，得明白银联的角色。它更像是一个“高速.............
《天工开物》这种科技著作不是促进社会发展吗，通古斯满清统治者为什么偏偏要毁掉他？

“通古斯满清统治者”这样一个说法，实在是有些混淆了历史事实。首先，满清政权建立于17世纪，而《天工开物》成书于17世纪30年代。当《天工开物》横空出世之时，统治中国的是明朝，并非满清。那么，为什么会有“满清统治者毁掉《天工开物》”这种说法流传呢？这其中可能涉及几个层面的误解和历史事件的交织。首先，需.............
为什么西方会发生宗教统治？

西方历史上，宗教统治并非单一原因或固定模式，而是一个漫长而复杂的演变过程，受到政治、社会、经济、文化及思想等多种因素的交织影响。要理解为何会出现“宗教统治”，我们首先需要明确这个概念的内涵，它通常指的是宗教机构（特别是教会）在政治、法律、社会生活乃至意识形态上拥有巨大的、甚至压倒性的影响力，能够塑造.............
为什么日本人统治东三省十四年却没有发现大庆油田？

日本人统治东三省长达十四年（从1931年“九一八事变”到1945年日本战败），他们确实对中国东北地区的资源进行了详尽的勘探和开发。然而，大庆油田之所以在他们统治期间未被发现和大规模开发，并非因为日本人不努力，而是由于以下几个关键原因的综合作用：1. 对油气资源的认知和勘探重点的偏差：传统认知：.............
为什么知乎上那么多推荐优惠券的话题，而且还统统设置成评论由作者筛选后发出？

知乎上之所以充斥着大量推荐优惠券的话题，并且这些话题的评论区往往是“作者筛选后发出”，这背后其实隐藏着一个相当成熟的商业模式和用户心理的结合。让我来跟你好好掰扯掰扯。首先，我们得明白，知乎虽然表面上是知识分享平台，但其本质上仍然是一个商业公司，需要通过各种方式变现。推荐优惠券恰恰是一种低成本、高转化.............
为什么高中不直接开设高等数学、线性代数、概率统计这几门课呢？

这个问题挺有意思的，也确实是很多对数学充满好奇的同学会想到的。为什么高中数学就停在那些看起来“初级”的阶段，而高等数学、线性代数、概率统计这些听起来更“硬核”的学科，却要等到大学才能接触呢？这背后其实是有一套教育理念和循序渐进的考量在里面的。咱们一点点捋清楚：1. 知识的阶梯性：基础是根本数学这玩意.............
为什么量子统计里不考虑粒子处在能量叠加态的情况，只考虑了每个能量本征态上的粒子占据数？

这个问题触及了量子统计力学最核心的几个概念，解释清楚这个问题，需要我们一步步地剖析。首先，我们得明确，量子统计力学研究的是大量粒子组成的宏观系统的统计行为，而当我们谈论“粒子处在能量叠加态”时，这属于微观粒子的量子行为。这两者之间存在一个从微观到宏观的过渡，而这个过渡正是量子统计力学需要解决的问题。.............
西晋的统一为什么不长久？

西晋，一个在历史上短暂闪耀却又迅速陨落的王朝，其统一未能长久，原因错综复杂，并非单一因素所致。要深入剖析，我们需要从政治、经济、军事、社会等多个层面，细致地梳理其衰败的脉络。首先，政治制度的根本缺陷是西晋统一不稳固的基石。晋武帝司马炎“传子不传贤”的继承制度，虽然避免了曹魏末年“九品中正制”带来的士.............
刘秀彻底统一之后，为什么不迁都长安？

刘秀，即汉光武帝，在推翻王莽新朝、恢复汉朝统治后，并没有选择将首都迁往西汉旧都长安，而是选择了洛阳作为首都。这是一个经过深思熟虑的决定，背后有多方面的原因，我们可以从以下几个角度来详细探讨：一、战乱破坏与长安的地理劣势战乱摧残下的长安：自王莽篡位，天下大乱以来，长安作为西汉时期的政治中心，.............
伊朗摆脱阿拉伯人的统治后为什么还坚信敌人的宗教？为什么不恢复古波斯的信仰？

伊朗在摆脱阿拉伯人统治后之所以仍然坚信伊斯兰教（其在统治时期被认为是“敌人的宗教”），而不是恢复古波斯的信仰，是一个复杂且多层面的历史、文化和政治过程的结果。以下将从几个关键角度进行详细阐述：1. 历史背景：阿拉伯人征服波斯公元7世纪的阿拉伯征服：公元7世纪中期，阿拉伯哈里发国迅速扩张，征服了当.............
国家为什么不统一建好居住小区，然后以实惠的价格出售给国人？那个地级省，市卖地卖的好就被国家优先发展?

您提出的问题非常有价值，也触及了许多人对房地产市场和国家发展政策的疑问。为什么国家不统一建设好居住小区并以实惠价格出售？为什么某些地区会因为卖地收入高而获得优先发展？这背后牵扯到复杂的经济、政治、社会和历史因素。我将尝试详细地为您解析。一、为什么国家不统一建设好居住小区并以实惠价格出售？理论上，国家.............
北宋为什么不统一大理？

北宋之所以未能统一大理，并非是简单的军事实力不足或地缘政治上的疏忽，而是多种因素交织作用下的复杂历史选择。要理解这一点，我们需要深入探究当时的北宋王朝所处的内外部环境，以及它对大理国的认知和战略考量。首先，我们必须认识到北宋的立国之本和其核心战略目标。宋朝的建立，很大程度上是为了结束五代十国的混乱局.............
在清朝康熙以后，为什么统治者不向全国推广满语，鼓励汉人学习满语？

康熙之后的清朝统治者，确实没有在全国范围内大力推广满语，也没有积极鼓励汉人学习满语。这背后的原因相当复杂，涉及到政治、文化、经济以及满族统治者自身的考量。虽然满族入关后，满语曾一度享有特殊地位，甚至在早期有过推广的意图，但最终未能成为全国性的通用语言。1. 满汉文化的巨大差异与融合的挑战：首先，我们.............
蚊子蟑螂这些害虫国家为什么不统一清除

.......
东亚汉字文化圈（主要是中日韩）为什么不统一简化字的规范，进而降低学习成本，加深东亚文化一体化呢？

东亚汉字文化圈，特别是中国、日本、韩国，在历史上曾共享一套表意文字系统，这无疑是促进文化交流、理解与融合的强大纽带。然而，时至今日，为何这三个国家（或者说主要区域）未能统一简化字的规范，以降低学习成本、加深文化一体化，这是一个值得深入探讨的问题。其背后涉及的因素错综复杂，既有历史演变的原因，也有政治.............
为什么国内要强分民族？为什么不统一归化成中华民族来实现民族融合？

这个问题触及了一个非常核心且复杂的话题，涉及到中国历史、文化、政治和社会等多个层面。要理解为什么中国至今仍保留民族划分，而非强行统一归化，需要深入剖析其背后的原因。历史的烙印：多元共存的根基首先，中国并不是历史上一个单一民族的国度。我们常说的“中华民族”是一个集合概念，是在漫长的历史进程中，由众多原.............
为什么编程语言有这么多种类？为什么不统一成一种语言呢？

这个问题触及了计算机科学的核心，也是许多开发者在职业生涯中会反复思考的。为什么世界不是像我们期待的那样简单，只有一个完美的工具包揽一切？实际上，编程语言的丰富多样，恰恰是技术发展、人类需求以及对“最优解”不断探索的生动体现。想象一下，如果我们只有一个尺子，它只能测量厘米，但我们要加工一块木头，需要精.............
美国为什么不尝试统一世界？

美国之所以不尝试统一世界，这背后有着极其复杂而深刻的历史、文化、政治和现实考量，绝非一个简单的“为什么”就能解释清楚。如果美国真要“统一世界”，那将是一场史无前例的全球性浩劫，其后果之严重，甚至可能超出我们目前能想象的范畴。首先，我们必须认识到“统一世界”这个概念本身的模糊性和危险性。它意味着要建立.............