百科问答小站 logo
百科问答小站 font logo



如何看待70岁老教授花费2年时间让收藏在伯克利的中文古籍善本通过达摩院技术,以数字化方式回归故土? 第1页

  

user avatar   xi-er-weng 网友的相关建议: 
      

这个事儿,得从不同角度来看。

从技术开发的角度来看,阿里开发的这个古籍OCR系统准确率和实用性方面,算是目前市面上比较好的。其实,目前市面上的古籍OCR平台很少,除了书同文有一个付费系统之外,其他很多都还在画饼,比如北大的吾与点。汉典重光的问题还有不少,比如支持的字符集比较小,分区不够准确,对大小字混排的处理也有缺陷。不过毕竟目前免费,也没有限制,所以现在来看是很不错的。

从古籍整理研究的角度来看,其实意义没有那么大。

应当承认,古籍数字化这项工作是有极大意义的,但是这次把加州大学伯克利分校藏的这些宋元版数字化,够不上称为“回归故土”。一方面,这些宋元版早就影印出版了。中华书局2014年出版由周欣平先生主编的《柏克萊加州大學東亞圖書館藏宋元珍本叢刊》,囊括该校馆藏的41中宋元古籍。要是数字化算“回归”,那影印难道算不得回归?另一方面,人家伯克利图书馆早就把这些古籍都扫描放到网上了。国外许多公立高校图书馆和公立图书馆,基本都会将自己馆藏的古籍扫描放到网上公开。国内用户只要能申请到账号,自然可以查看图像,算不算回归?

这里插一句。国外公立图书馆在古籍数字化的态度上跟大陆的公立图书馆完全不一样。咱们的图书馆馆藏古籍,越是珍贵的越是秘不示人。近几年也就国图主持的中华古籍资源库值得称道,可是这个数据库也只能浏览,不提供下载。而且扫描拍照的工序也不够规范。比如日本的国立公文书馆和国立国会图书馆,图像上一定有色标和卡尺。国图的从来没有。这很不利于用户了解古籍原本的纸色、墨色和尺寸。

汉典重光上放出来的扫描图像清晰度一般,也没有色标和卡尺。UI设计得也不够亲切,操作上并不顺畅。而且也没有卷次的书签,不能方便的转跳。古籍介绍上连作者、版本信息、版式信息都没有,简陋得不行。比如《后村居士集》:

啥信息都没有。人家伯克利图书馆网站上的著录信息都比这丰富:

然后这本书的页面被搞得乱七八糟,真不知道是怎么回事。第一二页是莫名其妙地封底,第三、四页则不知道是正文什么地方:

人家伯克利图书馆这本书第一册的浏览界面是这样的:

这不比你达摩院捣鼓出来的玩意儿强多了?讲真,汉典重光数字化的专业性实在是不太够。陈力先生当然是老前辈了,他在文献学上的专业性不必质疑。只是在古籍数字化这一块,估计确实是没怎么接触过,也就任由达摩院自己去乱搞了。




  

相关话题

  女子地铁里当众让孩子下跪,乘客劝阻反被怼「我的孩子我想让他干嘛就得干嘛」,如何看待这种教育方式? 
  为什么中东没有像亚洲四小龙一样,靠发展贸易和加工业强大起来呢? 
  奥地利到底是怎么洗白的? 
  为什么遭受文革时期的摧残后还有很多人没有选择去报复社会?支持他们的是什么? 
  三国演义比起其他三个名著文笔如何,在整个小说界是什么水平? 
  知乎上一些回答是黑国军还是事实如此,国军真的很菜吗? 
  怎么样回答外国朋友“这个世界人人有寄托,为什么中国人没有信仰”这个问题? 
  如何看待两年前还领涨全国的大理房价,现已有新房跌了 2000元/㎡,二手房价格也创年内最大跌幅? 
  怎样解释蒙古帝国这一逆天的存在?蒙古帝国强大的武力之源究竟何在? 
  有没有关于西康省的地理历史知识? 

前一个讨论
就我一个人觉得《禁忌女孩》三观不正吗?
下一个讨论
如何看待大卫·贝克汉姆正式入选英超名人堂?





© 2024-11-21 - tinynew.org. All Rights Reserved.
© 2024-11-21 - tinynew.org. 保留所有权利