百科问答小站 logo
百科问答小站 font logo



如何获取微观数据? 第1页

  

user avatar   drpmdb 网友的相关建议: 
      

谢谢知乎圆桌的邀请 @Joe De。我很多年前做过两个,都是地级市层面的,一个方言数据库,一个市委书记数据库。

方言数据库:最开始写paper并没有想到用这个,手里本来只有统计局地级市层面的经济数据,文章写了几个版本后发现卖点不够,故事讲的不够新颖,模型也并不算创新,审稿人不认帐。后来打算改变策略,引入新的变量,也就是这个方言,从而把原本只写"政治边界与经济影响"的故事改成了"政治与方言(做为文化的一个proxy),谁对经济的影响更显著"这么个故事。

数据库本身是基于县级层面的数据,大概2,477个县的方言,通过不同的归类方法(aggregate),最终得到对应地级市层面的主要方言。数据方面主要来自于中国语言地图集现代汉语方言大辞典等著作。这个数据库,与其说是自己(和一位认真负责的助研 - 南大的小伙子,目前已脱离学术去了华泰)一点点的收集和系统化,不如说是基于前人多年的辛苦成果,我们将其电子化(量化)。换了个讲故事的策略后效果还是显著的 - 论文经过1年多的反复修改,最终发在了Journal of Comparative Economics:Economic integration in China: Politics and Culture

方言数据库一瞥,以及基于这个方言数据画的中国方言地图(其中一张):



官员数据库:这个的研究方向一开始就定好了,所以曲折不多,投稿等相对都比较顺。最开始的启发来源于国内关于官员晋升那层看不见的天花板的讨论(比如人民网的官员天花板困局),以及张军和周黎安等老师关于中国地方官员晋升锦标赛模式这方面的研究等。对这方面有兴趣的朋友可以移步我另一篇回答:钱粮胡同:有什么分析中国经济的好书推荐?,里面介绍了张军老师的一本书:《不为公众所知的改革》。

这本书写的很真实,读的时候就感觉好像在和作者聊家常一样,舒服自然...就像张军自己说到的,这本书就好像一本回忆录,从莫干山会议年轻经济学者们是如何激烈争论价格改革的,到巴山轮会议上经济学家讨论当时的中国应该怎样调控正在经历通货膨胀的宏观经济,再到深圳特区试验的前后,通篇充满有意思的故事和照片,读起来感觉畅快有料。

如果更偏学术一点的话,可以读读:张军和北大周黎安老师合编的《为增长而竞争 - 中国增长的政治经济学》,读后能够对这个领域的研究有一个比较快速详细的了解。

话说回来,这个官员数据库也是地级市层面的,收集了1990年到2011年期间23个省份234个地级市898位市委书记的个人公开信息,同时还做了几十份问卷调查。数据来源一般都是人民网,百度以及各地方政府网站。如果有些信息已经看不到了,会通过google cache或者其他渠道获得。

不得不说的是,我比较幸运,在做这两个数据库的时候都遇到了极其给力的助研。官员数据库的助研认真,耐心而且专业(华政的一个小姑娘,后来回归老本行读了法律),不光是巨大的官员信息收集工作(数据库和变量等已经提前设计好),还有官员的官职等分类工作:收集需要的是耐心和责任心,确保了数据的完全与准确;分类就比较难了,需要对中国政治系统有较深的了解,对于不同官员的官职级别,异地交流等都有比较清晰的认识,如此,才可以准确的分类并追踪样本期间官员的调动和晋升等过程。数据库不仅收集了基本的信息,如性别,年龄,民族,出生地,教育经历等,也包含了各种政治相关信息。基于这些数据,我们就可以创建衍生变量,来详细了解官员这些年的晋升路径,以及是否有一些潜在的规律可循。

官员数据库一瞥:

论文最后发在了Modern China,有兴趣的朋友可以移步:Career Backgrounds of Municipal Party Secretaries in China

想说的是,其他答案提到的相对公开或常规的微观数据库对于研究或练手还是有价值的,获取也相对容易。然而,如果讲故事的水平还不够高,或是吨位不够,或者是方法/ 模型还没到惊为天人的份儿上,那就静下心来,花些时间自己做个数据库,对于研究或发表还是有帮助的 - 哪怕仅仅是设计数据库以及信息收集的过程,中间也会学到很多,这本身就是一种学习与锻炼。

憋不住多废话两句,虽然自己动手获取微观数据既花时间也未必有直接的收益(论文发表),然而我还是比较鼓励有生之年有志之士多少要尝试一次。做个未必准确的类比(重在体会精神):我现在不做学术了,在金融业,工作原因平时会接触大量的数据,有些部门(比如某些银行的压力测试部门),他们利用大型数据是直接拿来就放到模型里用,数据背后对应的每一家公司或是业务,他们完全没概念,数据对于他们来说就是数字,没别的,更别提数据本身的质量问题等,也因此在最终得出压力测试结果的时候,我总是持有保留意见(但是只要能忽悠央行就算过关) - 这类如果放在学术圈儿,有点类似那些拿来公开数据套几个模型就跑不深挖的人。还有一些部门,也做大量的数据收集和模型分析,然而这些部门会先把对应的公司或业务和不同的部门反复讨论,搞懂数据本身再跑模型,这个过程有点像自己收集微观数据一样,虽然费时费力,但是对于数据本身会有更深刻的认识,解释力也会变强。

无论怎样,我觉得,不管你倾向于直接获得CHIPs或CHNS,还是愿意自己动手建个独特的数据库,抑或把两者结合起来使用,重点不在于你用什么做什么,而是本身对研究的态度

想混,怎么搞都能过关;想严肃点儿,态度决定一切


user avatar   slowmover 网友的相关建议: 
      

我们

明尼苏达人口中心

IPUMS International

项目提供了 1982 年和 1990 年的

中国人口普查 1% 样本

,行政区划具体到地级。此外还有其他 70 多个国家的人口普查数据可以免费下载。

如果对美国问题感兴趣,

IPUMS USA

IPUMS CPS

绝对不容错过。IPUMS USA 公开的 complete count 数据最新更新到 1880 年美国人口普查。我们现在手上正在处理 1940 年美国人口普查的 complete count 数据,预计在 2017 年上线。如果研究者有需要的话可以和我们联系,获取最新的原始数据。我们还提供

在线分析

1850 - 2012 年美国每年的 ACS 样本和每十年的人口普查 1% 样本的功能,免费注册后即可使用。

除美国外,

North Atlantic Population Project

项目还提供了加拿大、英国、冰岛、挪威和瑞典的 complete count 人口普查历史数据。下载都是免费的。

暂时处于公测阶段的

Terra Populus

项目则整合了世界各地的人口与环境数据,其中包括地理、气象等多方面的信息。

讲个有意思的事情。美国人口普查数据的原始记录有一部分是从摩门教的 LDS Church 那里拿来的。为什么 LDS Church 会有这些资料呢?因为摩门教认为,如果你受了洗礼,那么你也可以为你已经死去的祖先洗礼,并且与你的祖先在天堂重聚。因此,摩门教徒的一大爱好就是拼命去搜集各种与自己祖先有关的资料。事实上,世界上最大的系谱网站 Ancestry.com 的数据很多都是从 LDS Church 那里得到的。


user avatar   sijichun 网友的相关建议: 
      

稍微多说两句。

其实华人在海外,尤其是欧美社会遇到的很大的一个问题是意识不到种族的重要性。近代以前,中国基本都是处于一个“国家=天下”的状态。这就导致了很多中国人在面对近现代以威斯特法伦体系为基准形成的“民族国家”没有形成一个明确概念,因而在欧美,尤其是在北美(USA/Canada)这种移民国家里生活的时候政治上十分受挫。

不管你承认也好,否认也罢,一个人在美国的社会认定更多地来自于一个人的种族(race)而非阶级(class).以我们最关心的教育为例:大学录取会很大程度上根据你的种族来决定录取标准,而不是社会阶层,更不是政治倾向。不管家境如何,只要你是亚裔,那么你就有大概率碰到录取标准的歧视问题。

在这个前提下,任何一个有智商的人都能够看出来:在美国这个大背景下,在争取自身(个人/族群)权益的过程中,种族的优先级是排在最前面的,其次才是政治倾向和意识形态。因为大多数情况下你在填表的时候,不会让你选你是conservative还是liberal,只会让你选你是“white",“Asian”还是“Hispanic”. 而事实上,只要一个族群能够意识到美国社会种族优先的前提下,内部的政治光谱不仅不是问题,反而是优势,一个很好的例子就是犹太人。

犹太人在美国有多成功想必不用多说。但是犹太人并没有把自己局限在左翼或者右翼,而是通过在不同政治光谱上的发展,成功的让自己的种族在美国取得优势。说右翼,犹太人里面的一大票银行家企业家大家也有所耳闻;说左翼,犹太人中的囧叔,主持界传奇larry king,喜欢谈笑风生的华莱士等等都是业界传奇。这样他们右手掌控了经济和政治力量,左手掌控了舆论和传媒的力量,最终让族群取得成功。可见,以族群利益为先,则族内各个政见派系均受益;以政见利益为先,则族群分崩离析。

反观以叫兽为首的旧华“精英社会活动家“是怎么做的呢?不仅不去积极组织和联络真正能起到作用的政治基本盘(一个越来越壮大的华人群体),反而主动地去做出例如:损害自己族群的利益以换取一小撮外部政治利益(SCA5),试图不断的分裂族群内部力量(亚裔内部细分法案)等等赤裸裸乃至荒唐可笑的背叛种族利益的行为。这种叫兽,如果不是脑子进了水,那就只能是因为政治觉悟和政治水平实在太差,吃枣药丸


----------------------------


断脊之犬,狺狺狂吠。 一开始看到这篇文章我特别震惊,不单单是文章内容,更重要的作者身份:美国百人会会长及首个法学院院长?这样的人竟然说出如此粗鄙之语?不过回想一下,这倒是解决了我一直以来的疑问。

作为一个在美国各个领域都有杰出贡献的种族,作为一个平均收入和学历都远超平均线的种族,作为一个贡献了马友友,关颖珊,刘玉玲等杰出人才的种族,为什么美国华人的政治地位如此的低下?为什么华人的权益总是受到系统性的侵害和歧视?最重要的是,为什么华人,尤其是旧华人及其后代的自我认同和民族荣誉感低到令人发指?现在看来,这些旧华人中的“精英”“社会活动家”政治水准低到不堪占了很大一部分原因

其实在美国待过一段时间的人都明白,各个族群之间有竞争,有合作,也有斗争。但得到尊敬的条件只有一个:拥有力量。这个力量可以是经济力量,可以是知识力量,当然也可以是政治力量。所以这次大选华人主动出击,参与助选的行为我是非常认同的:重要的不是你站在哪一条队,而是展现能够左右选战结果的政治力量,这才是华人赖以发展的基础。相反,任何一种任凭意识形态洗脑而站队的行为都是政治水准低下的弱智行径。

其实稍微看了看叫兽的个人经历,未免有些可怜他。作为一个数次试图否认和摆脱自己华人身份的“社会活动家”,他的“习得性无助”十有八九也是在成长的过程中一步一步建立起来的。在中国崛起,新华人一步步向前的大背景下,他就像一头曾经被锁链拴住的幼象,完全没有意识到力量的对比总是会转化的,而华人政治家真正的基本盘只有自己。在这种情况下,旧华人的社会认知,一种貌似平等实则歧视的社会认知,只会进一步地被抛弃,最终由新华人引领实现真正的社会平等。旧华人畏畏缩缩的活了一百多年,却连美国这个国家的一点基本精神都没有学到,而这些分明写的很清楚:The land of the free and the home of the brave.

毕竟,大清都亡了,也请你们这些遗老遗少们滚回历史的尘埃里吧。 -------------------

原答案

这个所谓教授才真是把“歧视”二字阐释的淋漓尽致。


user avatar   zhaodd 网友的相关建议: 
      

稍微多说两句。

其实华人在海外,尤其是欧美社会遇到的很大的一个问题是意识不到种族的重要性。近代以前,中国基本都是处于一个“国家=天下”的状态。这就导致了很多中国人在面对近现代以威斯特法伦体系为基准形成的“民族国家”没有形成一个明确概念,因而在欧美,尤其是在北美(USA/Canada)这种移民国家里生活的时候政治上十分受挫。

不管你承认也好,否认也罢,一个人在美国的社会认定更多地来自于一个人的种族(race)而非阶级(class).以我们最关心的教育为例:大学录取会很大程度上根据你的种族来决定录取标准,而不是社会阶层,更不是政治倾向。不管家境如何,只要你是亚裔,那么你就有大概率碰到录取标准的歧视问题。

在这个前提下,任何一个有智商的人都能够看出来:在美国这个大背景下,在争取自身(个人/族群)权益的过程中,种族的优先级是排在最前面的,其次才是政治倾向和意识形态。因为大多数情况下你在填表的时候,不会让你选你是conservative还是liberal,只会让你选你是“white",“Asian”还是“Hispanic”. 而事实上,只要一个族群能够意识到美国社会种族优先的前提下,内部的政治光谱不仅不是问题,反而是优势,一个很好的例子就是犹太人。

犹太人在美国有多成功想必不用多说。但是犹太人并没有把自己局限在左翼或者右翼,而是通过在不同政治光谱上的发展,成功的让自己的种族在美国取得优势。说右翼,犹太人里面的一大票银行家企业家大家也有所耳闻;说左翼,犹太人中的囧叔,主持界传奇larry king,喜欢谈笑风生的华莱士等等都是业界传奇。这样他们右手掌控了经济和政治力量,左手掌控了舆论和传媒的力量,最终让族群取得成功。可见,以族群利益为先,则族内各个政见派系均受益;以政见利益为先,则族群分崩离析。

反观以叫兽为首的旧华“精英社会活动家“是怎么做的呢?不仅不去积极组织和联络真正能起到作用的政治基本盘(一个越来越壮大的华人群体),反而主动地去做出例如:损害自己族群的利益以换取一小撮外部政治利益(SCA5),试图不断的分裂族群内部力量(亚裔内部细分法案)等等赤裸裸乃至荒唐可笑的背叛种族利益的行为。这种叫兽,如果不是脑子进了水,那就只能是因为政治觉悟和政治水平实在太差,吃枣药丸


----------------------------


断脊之犬,狺狺狂吠。 一开始看到这篇文章我特别震惊,不单单是文章内容,更重要的作者身份:美国百人会会长及首个法学院院长?这样的人竟然说出如此粗鄙之语?不过回想一下,这倒是解决了我一直以来的疑问。

作为一个在美国各个领域都有杰出贡献的种族,作为一个平均收入和学历都远超平均线的种族,作为一个贡献了马友友,关颖珊,刘玉玲等杰出人才的种族,为什么美国华人的政治地位如此的低下?为什么华人的权益总是受到系统性的侵害和歧视?最重要的是,为什么华人,尤其是旧华人及其后代的自我认同和民族荣誉感低到令人发指?现在看来,这些旧华人中的“精英”“社会活动家”政治水准低到不堪占了很大一部分原因

其实在美国待过一段时间的人都明白,各个族群之间有竞争,有合作,也有斗争。但得到尊敬的条件只有一个:拥有力量。这个力量可以是经济力量,可以是知识力量,当然也可以是政治力量。所以这次大选华人主动出击,参与助选的行为我是非常认同的:重要的不是你站在哪一条队,而是展现能够左右选战结果的政治力量,这才是华人赖以发展的基础。相反,任何一种任凭意识形态洗脑而站队的行为都是政治水准低下的弱智行径。

其实稍微看了看叫兽的个人经历,未免有些可怜他。作为一个数次试图否认和摆脱自己华人身份的“社会活动家”,他的“习得性无助”十有八九也是在成长的过程中一步一步建立起来的。在中国崛起,新华人一步步向前的大背景下,他就像一头曾经被锁链拴住的幼象,完全没有意识到力量的对比总是会转化的,而华人政治家真正的基本盘只有自己。在这种情况下,旧华人的社会认知,一种貌似平等实则歧视的社会认知,只会进一步地被抛弃,最终由新华人引领实现真正的社会平等。旧华人畏畏缩缩的活了一百多年,却连美国这个国家的一点基本精神都没有学到,而这些分明写的很清楚:The land of the free and the home of the brave.

毕竟,大清都亡了,也请你们这些遗老遗少们滚回历史的尘埃里吧。 -------------------

原答案

这个所谓教授才真是把“歧视”二字阐释的淋漓尽致。




  

相关话题

  为什么县城里总是听到凤凰传奇的歌和《摇摆哥》《伤不起》《终于你做了别人的小三》这样的歌曲? 
  布热津斯基的「奶头乐」理论有什么更深的内涵吗? 
  中国怎么在78年后取得了超英敢美的成就?为什么78年以前没有? 
  资本主义社会中,为什么是无产阶级代表了先进生产力? 
  财政宽松和货币宽松哪个更容易产生资本市场泡沫? 
  如何看待5线城市Z世代女消费者:用1万块的iPhone,开30万的BBA,但父母一年的生活开支仅5万? 
  网上流传全国范围内房价下跌的说法,是怎么一回事? 
  《国富论》中的「人为一己之私,终成大众之富」该如何理解?这句话是否正确? 
  应试教育给中国带来了什么? 
  北大女生包丽自杀完全是 PUA “泡学”导致的吗? 

前一个讨论
我们这一代人是否会面临医疗体系的崩溃?
下一个讨论
向女孩表白后,她说:「曾经沧海难为水,除却巫山不是云。」,该怎么回复?





© 2024-05-17 - tinynew.org. All Rights Reserved.
© 2024-05-17 - tinynew.org. 保留所有权利