百科问答小站 logo
百科问答小站 font logo



如何看待70岁老教授花费2年时间让收藏在伯克利的中文古籍善本通过达摩院技术,以数字化方式回归故土? 第1页

  

user avatar   xi-er-weng 网友的相关建议: 
      

这个事儿,得从不同角度来看。

从技术开发的角度来看,阿里开发的这个古籍OCR系统准确率和实用性方面,算是目前市面上比较好的。其实,目前市面上的古籍OCR平台很少,除了书同文有一个付费系统之外,其他很多都还在画饼,比如北大的吾与点。汉典重光的问题还有不少,比如支持的字符集比较小,分区不够准确,对大小字混排的处理也有缺陷。不过毕竟目前免费,也没有限制,所以现在来看是很不错的。

从古籍整理研究的角度来看,其实意义没有那么大。

应当承认,古籍数字化这项工作是有极大意义的,但是这次把加州大学伯克利分校藏的这些宋元版数字化,够不上称为“回归故土”。一方面,这些宋元版早就影印出版了。中华书局2014年出版由周欣平先生主编的《柏克萊加州大學東亞圖書館藏宋元珍本叢刊》,囊括该校馆藏的41中宋元古籍。要是数字化算“回归”,那影印难道算不得回归?另一方面,人家伯克利图书馆早就把这些古籍都扫描放到网上了。国外许多公立高校图书馆和公立图书馆,基本都会将自己馆藏的古籍扫描放到网上公开。国内用户只要能申请到账号,自然可以查看图像,算不算回归?

这里插一句。国外公立图书馆在古籍数字化的态度上跟大陆的公立图书馆完全不一样。咱们的图书馆馆藏古籍,越是珍贵的越是秘不示人。近几年也就国图主持的中华古籍资源库值得称道,可是这个数据库也只能浏览,不提供下载。而且扫描拍照的工序也不够规范。比如日本的国立公文书馆和国立国会图书馆,图像上一定有色标和卡尺。国图的从来没有。这很不利于用户了解古籍原本的纸色、墨色和尺寸。

汉典重光上放出来的扫描图像清晰度一般,也没有色标和卡尺。UI设计得也不够亲切,操作上并不顺畅。而且也没有卷次的书签,不能方便的转跳。古籍介绍上连作者、版本信息、版式信息都没有,简陋得不行。比如《后村居士集》:

啥信息都没有。人家伯克利图书馆网站上的著录信息都比这丰富:

然后这本书的页面被搞得乱七八糟,真不知道是怎么回事。第一二页是莫名其妙地封底,第三、四页则不知道是正文什么地方:

人家伯克利图书馆这本书第一册的浏览界面是这样的:

这不比你达摩院捣鼓出来的玩意儿强多了?讲真,汉典重光数字化的专业性实在是不太够。陈力先生当然是老前辈了,他在文献学上的专业性不必质疑。只是在古籍数字化这一块,估计确实是没怎么接触过,也就任由达摩院自己去乱搞了。




  

相关话题

  如何看待徽州宴当事人侄子的回应:错在太有钱,狗价值70万? 
  当年那个犀利的韩寒是否已经离我们远去? 
  中国为什么没有像《宫本武藏:剑与禅》这样的巨作? 
  二战中国战场上最好的照片以及它背后的故事是什么? 
  古代为什么立嫡长子不立贤? 
  如何看待林志玲讨回《极限挑战》通告费,两天两期节目 400 万? 
  如果维京人在美洲站住脚,历史会如何发展? 
  中国热兵器发展真的是从清朝开始才落后于世界的吗? 
  文学专业要对历史了解到什么程度? 
  明朝军民府指什么,和府有什么区别? 

前一个讨论
就我一个人觉得《禁忌女孩》三观不正吗?
下一个讨论
如何看待大卫·贝克汉姆正式入选英超名人堂?





© 2024-05-09 - tinynew.org. All Rights Reserved.
© 2024-05-09 - tinynew.org. 保留所有权利