百科问答小站 logo
百科问答小站 font logo



历史学专业是如何分析数据的呢? 第1页

  

user avatar   shan-nuo-36 网友的相关建议: 
      

别闹,除了最近这一二百年,你能拿到啥数据?你拿到的数据都是0.00X%的量。分析啥?还有,你拿数据推导历史事件九成九就是历史事件他不应该是历史的本来面目。


user avatar   47221845990 网友的相关建议: 
      

谢邀,目前采取的办法是基本不分析数据。

国内的中国史研究的重点还在解读文本的方面,数据意识比较薄弱,停留在数据的整理与列表展示的层面上。能比较自如地使用数据图已经是很少见了,如果会算平均数和方差那就可以自称专家了。

重考据的传统当然是一方面的,但这种风气也不都是学术源流。“历史研究应该是什么样的”这个问题,本就不都是由问题意识引领的,教育体系、出版机制乃至意识形态机器的因素都不容忽视,甚至可能比问题意识本身更重要一点。仅就教育体系为例,多年以来历史学研究生教育一直是不懂数学的青年学生最大的庇护所之一,这个体制就是对数学不友好的。即便你想说数据也很少有同侪听得懂,更别提打动审稿人和编辑了——别忘了,大多数编辑也是在这个体系里培养的。

此外,18世纪以前中国历史上,容易量化且能够较为全面反映社会面貌的史料本身也比较少,提取为数据以后往往不可靠或不好用。即便近代(包括17-18世纪“早期近代”)有一些稍微好用一些的史料,整理起来也非易事,而且整理出来也未必能很好地覆盖历史事实,总有找不到资料、找到资料但难以量化、量化后和其他部分无法对接(例如离散型数据的年分对不上)的情况。

@Manolo 一直在分享一些关于史料量化分析的研究动态,其中外国的多、中国的少。你查查这些文章的投稿周期就知道这种研究有多难做。这都是做出来了的,死在沙滩上的(例如我手里一篇做了三年的文章可能就会是这个命运)就更不知凡几。

当然,我还是比较希望学历史的人能够学一些数理统计、数据分析工具知识,主要目的不在于做研究,而是为了将来转行找工作方便。

————————

我想强调一个简单的道理:画出来的饼是假的,不是真的。如果你自己没有在历史研究中独立进行过数据收集与处理的工作,仅仅看过别人吹牛,就不要出来高谈阔论了,你距离做实事的人还很远

研究前景展望里灌鸡汤,谁都会,可谁来做实事啊?去年北京大学数字人文工作坊上人人都说希望有同行能收集数据以便演讲者分析,但没有一个人上来讲实际收了多少资料、写了几条数据,光有概念、等着摘桃子,甚至有人只在C++里定义了一组变量就能上来作报告,这就是业界生态:吹概念的、吹方法的、吹理念的高谈阔论,可是靠这些人是出不了进展的。

我强烈建议在这个话题下面讲计量方法在史学研究里有多么多么好的人,自己动手做一个小的研究:收集你家乡那个省级单位及下属府州县各级学校在明清两朝的学校学额,然后凭借直觉写一篇论文,去投一个CSSCI刊物试试,看看编辑会怎么看待你。不吃苦光灌鸡汤让别人吃苦,我看不惯。


user avatar   grant87 网友的相关建议: 
      

对于经济学、商科的学生来说,使用数理统计的方法做文章的套路可能理所当然:观察到一个现象,提出因果关系假说,收集大量合适的数据跑回归,得出结论,再对结论做robust检验,基本上这篇文章就能立住了。

但是遗憾的是,很多时候,这个套路在历史研究当中是行不通的。

首先,年代越久,数据缺失的情况越严重。你做一个当下的上市公司,几年的年报拿到了,所有数据一应俱全。但是你做一个历史问题,可能每个三五年拿到一组数据。从这些数据里你可以看出一些基本趋势,但跑回归远远不够。一些做计量的人文章很奇怪,年代断限当不当正不正的,为什么?因为就这一段数据相对全,前面缺,后面也缺。但其实这个起止节点,和重大历史分期可能一毛钱关系都没有。诸如此类。

其次,数据的错讹造假问题更难验证。你拿到了古代国家进出口贸易量的增减变化,你用来分析变化趋势,那走私的数据你没有怎么办?或者说官方贸易数据本来出入对不上,是做的假账你如何得知?于是一些人跑出来的结论,会和文献记载的社会常态相去甚远。

根据之前经验观察,我觉得对于16世纪以来东亚和东南亚海上贸易史的研究,是坑比较多的领域。因为总有人能零零碎碎搞到一些独家的航海日志和货物记录,然后自己有哪一段就用计量手段处理哪一段,自己有哪类货物的资料,就去处理哪一类资料,最后做出来一些非常奇怪的东西来。的确,只要你用他选的这些数据,用那套算法,就能得出那个结论。但是这种数据选择方式合理吗?他说合理就合理,你没有其他数据可以拿来反驳他。

当然,确实有一些人把计量玩得很好,但这对数据本身的靠谱性依赖程度太高了。那么除了这些搞计量的人,其他历史学家怎么用数据呢?仍然是通过各种文献档案的综合分析,发现问题,提出假设,而有限的是数据材料,与文献互证。比如说某个结论,我们可以从其他文字材料中获得巨大支撑,那么我们通过有限的数据,发现两者是相互支持的,就可以成立了;但如果要抛开其他文献,单用数据回归出一个结论,操作也难,也并没有必要。

所以总结一下我的观点,在很多情况下,历史数据不是要什么有什么,而是只能有什么用什么,而且存在数据缺失,真伪不易鉴别等问题,而且没有人可以重现历史场景,没法通过数据分析的方式检验结论的强健性。现在都说大数据时代,数据越多,统计学的威力越大,算出来的东西越靠谱。但反过来也是一样,数据越少,统计学的东西也就越巧妇那位无米之炊。

我觉得对于做19、20世纪研究的人来说,很多东西有了相对完整准确的档案记录,学习一些数理方法,可以做出一些前人没关注到的东西。但是时间越久,采用数理方法就越需要慎重,如果数据本身选择的不合适,不仅无法呈现规律,还会把整个研究引向奇怪的方向。

——————————————————————补充—————————————

跟一些知友沟通之后,发现对于这个问题的讨论可能没那么简单。

我不知道大家能不能认可一个前提:经济学家研究的经济史,不同于历史学家研究的历史上的经济问题;法学家研究的法律史,不同于历史学家研究的历史上的法律、制度问题。同样,在历史学的范畴内,用数学的方法处理数据,不同于把历史问题当成一个数学问题去处理。

一个数学问题,可以去逻辑推理,可以去归纳演绎,得出的结论可以被应用到经济等学科的实践当中,指导实践。但对于历史学来说,再完美的建模,再好的推理,如果推导出的这个演变本身是没有充分的史料支撑的,这个论证过程就不能成立。 如果你是搞政治学的,你拿历史说事,研究出一个新理论,应用到当前的社会实践中,这可能是个好的研究。但作为历史学,你搞出了一个直接证据不足的理论,来解释历史,可能随时都会被新出现的证据推翻的。我个人还是坚持认为,历史学是一个很实证的学科,有一分证据说一分话。我们研究的是每一分证据所传达的信息,而不是把没有证据支撑的空白部分圆起来。不是说这个填空的工作没有意义,而是说这不属于历史学的范畴。仅代表个人观点。




  

相关话题

  罗斯福新政(大萧条/经济危机)时期生产牛奶的工厂宁愿把牛奶倒掉也不给人民,为什么不让群众免费领取牛奶? 
  儒家教人做人处事,那为什么帝王的儿子兄弟相残比比皆是,难道他们没有大儒为师吗? 
  斯大林苏联在二战前对罗马尼亚有什么觊觎怎样施压导致了希特勒决心进攻苏联? 
  南宋怎么做才能抵御住蒙古的入侵? 
  如何评价张居正和冯保的关系? 
  为什么现代的(体制外)私人撰史者无法拥有像司马迁、班固、陈寿、范晔一样高的历史地位? 
  中世纪皇帝权力大吗? 
  如果当年元朝打下了日本,朱元璋会收复日本吗? 
  四大发明的真相到底是什么? 
  为什么大家不排斥天朝官方用汉奸这个具有歧视汉族性质的词来代表卖国贼? 

前一个讨论
如何评价 2018 年俄罗斯世界杯 F 组小组赛卫冕冠军德国 0:1 爆冷负于墨西哥?
下一个讨论
如何评价京东立项载重 40~60 吨,航程超 6000 千米的超重型无人机项目?





© 2024-05-13 - tinynew.org. All Rights Reserved.
© 2024-05-13 - tinynew.org. 保留所有权利