百科问答小站 logo
百科问答小站 font logo



如何看待70岁老教授花费2年时间让收藏在伯克利的中文古籍善本通过达摩院技术,以数字化方式回归故土? 第1页

  

user avatar   xi-er-weng 网友的相关建议: 
      

这个事儿,得从不同角度来看。

从技术开发的角度来看,阿里开发的这个古籍OCR系统准确率和实用性方面,算是目前市面上比较好的。其实,目前市面上的古籍OCR平台很少,除了书同文有一个付费系统之外,其他很多都还在画饼,比如北大的吾与点。汉典重光的问题还有不少,比如支持的字符集比较小,分区不够准确,对大小字混排的处理也有缺陷。不过毕竟目前免费,也没有限制,所以现在来看是很不错的。

从古籍整理研究的角度来看,其实意义没有那么大。

应当承认,古籍数字化这项工作是有极大意义的,但是这次把加州大学伯克利分校藏的这些宋元版数字化,够不上称为“回归故土”。一方面,这些宋元版早就影印出版了。中华书局2014年出版由周欣平先生主编的《柏克萊加州大學東亞圖書館藏宋元珍本叢刊》,囊括该校馆藏的41中宋元古籍。要是数字化算“回归”,那影印难道算不得回归?另一方面,人家伯克利图书馆早就把这些古籍都扫描放到网上了。国外许多公立高校图书馆和公立图书馆,基本都会将自己馆藏的古籍扫描放到网上公开。国内用户只要能申请到账号,自然可以查看图像,算不算回归?

这里插一句。国外公立图书馆在古籍数字化的态度上跟大陆的公立图书馆完全不一样。咱们的图书馆馆藏古籍,越是珍贵的越是秘不示人。近几年也就国图主持的中华古籍资源库值得称道,可是这个数据库也只能浏览,不提供下载。而且扫描拍照的工序也不够规范。比如日本的国立公文书馆和国立国会图书馆,图像上一定有色标和卡尺。国图的从来没有。这很不利于用户了解古籍原本的纸色、墨色和尺寸。

汉典重光上放出来的扫描图像清晰度一般,也没有色标和卡尺。UI设计得也不够亲切,操作上并不顺畅。而且也没有卷次的书签,不能方便的转跳。古籍介绍上连作者、版本信息、版式信息都没有,简陋得不行。比如《后村居士集》:

啥信息都没有。人家伯克利图书馆网站上的著录信息都比这丰富:

然后这本书的页面被搞得乱七八糟,真不知道是怎么回事。第一二页是莫名其妙地封底,第三、四页则不知道是正文什么地方:

人家伯克利图书馆这本书第一册的浏览界面是这样的:

这不比你达摩院捣鼓出来的玩意儿强多了?讲真,汉典重光数字化的专业性实在是不太够。陈力先生当然是老前辈了,他在文献学上的专业性不必质疑。只是在古籍数字化这一块,估计确实是没怎么接触过,也就任由达摩院自己去乱搞了。




  

相关话题

  元朝明明是外部入侵,为什么我们学元朝历史时还那么自豪? 
  如何看待成都捞女钓凯子买奢侈品,结果被反转羞辱? 
  为什么制造业的一些工厂没有年轻人来了?是什么导致了年轻人逃离工厂? 
  如何评价当年芒果台的电视剧《恰同学少年》? 
  为何太平天国称敌方为清妖? 
  法国十九世纪的高利贷资本主义,低生育率和缓慢的工业革命之间有着怎样的联系? 
  有哪些耗时很长的科学实验? 
  如何看待生活中经常出现「人工智能翻车」的情况,目前人工智能技术究竟发展到什么程度了? 
  兰州一幼儿园幼童吃饭时被呛,后因抢救无效死亡,哪些问题值得关注? 
  当代中国有哪些可以称得上重镇的城市? 

前一个讨论
就我一个人觉得《禁忌女孩》三观不正吗?
下一个讨论
如何看待大卫·贝克汉姆正式入选英超名人堂?





© 2024-05-20 - tinynew.org. All Rights Reserved.
© 2024-05-20 - tinynew.org. 保留所有权利