百科问答小站 logo
百科问答小站 font logo



有哪些「神奇」的数据获取方式? 第1页

  

user avatar   yiqin-fu 网友的相关建议: 
      

导师是研究非洲经济的,分享过两个故事:

他一个同行去乌干达找数据,某次从政府大楼出来的时候,发现工作人员在把大量纸张送到附近的垃圾场。他跑到垃圾场一看,居然是乌干达的历史数据!工作人员说这些没什么用,所以领导叫扔了。导师的同行及时抢下,后来组织当地人和他的学生扫描清洗,现已做成世界上最大的乌干达数据库。

第二个故事更厉害。导师的导师很想研究竞选口号对投票结果的影响。在穷国家,我们担心竞选人为了讨好民众,会承诺“私人物品”而非惠及所有百姓的福利(比如承诺“当选后给你这个村修条路”、“当选后招你这部落的人进内阁”)。

要想研究“承诺私人物品”会不会赢得更多票数,你不可能让竞选人赌上自己的职业生涯来帮你做实验,所以传统的研究方法是“事后观察”。

运气好的话,竞选口号播出的电视信号是逐步在全国开通的,那你可以比较先收到和后收到电视台信号的区域。运气好的话,电视信号在某个地方突然断了一个月,那你可以比较一直有信号的和信号断了的区域。这些方法都需要很多其他条件成立,还需要很多后期统计处理。更重要的是,穷地方多半没有收视率和民调数据,所以研究基本没戏。

不过导师的导师非常神奇。他出生在非洲国家贝宁,国家动乱后辗转去了美国西北大学读博,贝宁局势稳定后他成了贝宁新领导层的朋友。有了前述研究想法后,他居然说服了贝宁各个派别的总统候选人帮他做这个实验。


2001 年各家的竞选口号,一半讲“私人好处”(“选上了我给你这个村子修路”),一半讲“公共利益”(“选上了我会进行全国改革”)。

当然了,各派系只同意在自身优势较大的选区做这个实验,所以实验结果也有局限性。其他技术细节(例如溢出问题)这里不再展开。

论文:nyu.edu/gsas/dept/polit

普通人想做实验也不是不可以,只是要冒生命危险。有斯坦福和达特茅斯教授 2014 年向美国蒙塔娜州选民随机邮寄印有竞选人信息的传单,不过传单设计很容易让人以为是官方资料,所以教授和所在大学被政府以“企图影响竞选结果”为由而严重警告,面临罚款。研究当然也就此结束。

导师本人没什么故事。不过他有一回去非洲某国家机关要历史数据,对方找给他一沓册子,说咦这里还真有一套,你可以拿走了。导师说,既然册子只有这么一套,我还是借阅几天、扫描完归还。对方说,我们留着也没用,你就拿走吧。

导师就拿回国了...


user avatar   metrodatateam 网友的相关建议: 
      

把这个问题吵火了,然后让微信部门的人看到。然后等待版本更新。


user avatar   datacastle-90 网友的相关建议: 
      

这是我看到的最准确的总结。

总的来说,就是中国的高考相对公平,所以性价比极高,所以其他活动都可以适当让步。




  

相关话题

  机器学习包含哪些学习思想? 
  如何看待深圳针对网络平台利用大数据「杀熟」问题立法:违法者最高可重罚 5000 万? 
  你是如何走上数据分析之路的? 
  如何看待近百位科学家联合发文回应「 p 值显著标准应降至0.005」? 
  Kaggle如何入门? 
  如何证明数据增强(Data Augmentation)有效性? 
  为何以范剑青老师的 Sure Independence Screening 为代表的筛选法没有流行呢? 
  相关性分析和回归分析要具有一致性吗? 
  如何评价诺奖得主 Thomas J. Sargent「人工智能其实就是统计学」的观点? 
  一直很热闹的数据库领域,有哪些事情让你感觉眼前一亮? 

前一个讨论
马克思对中国是否了解,有在文章中提到过中国吗?
下一个讨论
中国首个地下云图网开建 预报地震能否实现?





© 2024-05-21 - tinynew.org. All Rights Reserved.
© 2024-05-21 - tinynew.org. 保留所有权利