有时你遇到一篇古老的文献,PDF文档还是扫描版。又或者是遇到一幅网页版海报,上面的文字你完全看不懂。
但你无法把图片中的文字复制下来做进一步处理,是不是让人头大?
虽然市场上有很多OCR软件可以识别图片中的文字,但还是有种种局限性,比如无法识别文字排版,需要转成其他文件后才能处理,无法直接操作。
最近,一位来自MIT的学生Kevin Kwok解决了以上这些问题。他用计算机视觉算法写了个Chrome插件Naptha,可以直接识别网页图片中的文字,并直接对它们进行高亮、复制粘贴、翻译、修改等操作。
拾取图片中的文字
Naptha无需在电脑上安装App,直接在Chrome应用商店中搜索Project Naptha,就可以看到这款插件,一键安装后即可在Chrome浏览器中使用。
Naptha可以用于在线漫画、扫描文档,甚至连拍摄照片中的文字也能识别出来。
普通的网页文字自然不在话下:
如果是别人给你发过来的扫描文件也没关系,直接把文件拖到Chrome浏览器中(Chrome支持打开多种本地文件),Naptha就能识别。
对于照片中的图片,Naptha也能够读出。作者Kevin拍摄了一本书的封面,除了文字不清晰、竖向排列的情况,封面的书名和简介都能正常识别出来。
Naptha还支持读取表格文字,并将复制下来的文字粘贴到Excel里。
Kevin承诺,Naptha未来还会加入翻译、除去文字水印、直接在图片上修改文字等功能。这些功能目前还处在beta测试阶段,处于不稳定或者不可用状态。
不是OCR,是文本检测
光学字符识别(OCR)已经不是什么新鲜事了,虽然Naptha实现的功能看起来像OCR,但实际上它主要功能实际上是文本检测。
一般的OCR不包含语言模型,而Naptha则可以根据上下文的概率输出一系列字母。比如把一串字符判定成“hello”,而不是“he1 | o”。
OCR需要知道图片中的语言才能正确识别文本,Naptha使用的是一种称为“ 笔划宽度变换”的算法,该算法由微软研究院于2008年提出,它就像人一样,即使不知道是何种语言,也能猜到文字就在那里。
结合其他算法,如连通分量分析(识别不同的字母)、otsu阈值(确定字间距)、不相交的集合森林(识别文本行),Naptha可以非常快速地建立文本区域、单词和字母的模型,识别图中存在哪些特定字母。
通过一些基本的布局分析和文本度量,Naptha还可以找出文本的对齐参数、字体大小和字体粗细。有了这些信息,它可以在同一个地方以类似的字体重新打印文本,或者将文本改成同字体的其他文字。
传送门
博客地址:
Chrome插件下载地址:
今天为大家介绍 11 款 Chrome 必备插件,个个精品,绝对实用!让你朴实无华的浏览器,变身成为生产力 Max 的高效神器!
(文末可获取所有扩展离线包)
先给大家看看我目前一部分的 Chrome 插件:
沙拉词典,一个可以实现划词翻译的开源浏览器扩展。
市面上有不少同类插件,但沙拉词典最大的不同是可以实现:灵活的查词方式、多词典查询、单词发音、生词本同步等功能。
目前沙拉查词内置了剑桥词典、柯林斯高阶、有道词典、汉典等多个包括权威及互联网词典。
如果你现阶段正好在学习语言,沙拉词典也提供了包括生词本、历史查询记录等完善的单词管理功能。
虽然沙拉词典本身暂不支持云端同步,但提供了 WebDAV 的同步方式,你可以用坚果云同步你的词典数据。
你可以前往 Google 网上应用商店免费下载:沙拉查词-聚合词典划词翻译
众所周知,Chrome 在浏览器界素有「内存杀手」的称号,也让众多电脑配置较低的用户苦不堪言。尤其在开十几个标签页后,浏览器崩溃更是家常便饭。
OneTab 则可以将你暂时不用的标签页合并在一个标签页内,需要时再随时恢复,以此节省你电脑 99% 的内存!
你可以前往 Google 网上应用商店免费下载:OneTab
相信你经常会在浏览网页时,遇到自己喜欢,但却不知道歌名的背景音乐。AHA Music 可以帮助你自动识别当前网页播放的音乐。
从此以后再也不用发弹幕求 BGM,或者费劲的从口袋掏出手机,打开其它音乐 APP 的识曲功能了。
你可以前往 Google 网上应用商店免费下载:AHA Music - Music Identifier
出于众所周知的原因,Chrome 的同步功能的体验一言难尽,不少用户也因此转投诸如 Edge、Firefox 等其它浏览器。开源免费的 Floccus ,恰如其分的解决了不同浏览器、不同设备之间标签同步的问题。
Floccus 可以同步 Chrome、Firefox、Kiwi 等浏览器的书签,你可以借助 WebDAV,将书签数据同步在坚果云等同步网盘中。妈妈再也不用担心我换电脑啦~
具体的使用方法,可以参看这篇教程:不同浏览器书签同步方案 - 坚果云+Floccus 详细使用教程
你可以在前往 Google 网上应用商店免费下载:Floccus
尽管微软已经推出了基于 Chromium 内核的 Microsoft Eage 浏览器,然而现实情况是,还有许多网银、教务、政务网站仍然必须使用远古的 IE 浏览器才能正常访问。
IE Tab 可以实现 Chrome 内调用 IE 内核浏览网页。再也不用因为兼容问题,费力的到处找一年都用不到几次的 IE 浏览器了。
不过 IE Tab 只能在 Windows 平台免费使用,在 Mac 平台使用需要订阅高级版用户。
你可以前往 Google 网上应用商店免费下载:IE Tab
「颜值即正义」
不少人都安装了第三方的标签页美化插件,但对大多数用户来说,Chrome 浏览器原生的标签页管理已经提供了 更换壁纸、自定义导航 等选项了,基本可以满足大多数人的需求。
开启的方法也很简单,打开一个新的标签页,选择右下角的笔型图标就可以啦~
许多资讯网站,布满了各种挥之不去的广告和不必要的样式,为正常的浏览造成了极大不便。Clearly 则可以为网页换上统一且美观的界面,让你专注的浏览网页和阅读文章。
Chrome 中同类的阅读模式扩展有不少,但试用多款扩展后,我为什么最终选择了 Clearly?两个字:专注。
作为一款免费的阅读模式扩展,Clearly 提供了字体、翻译、页面背景、目录大纲视图等自定义选项,甚至还有语音阅读功能,但除此外,Clearly 没有任何不必要的功能,也没有什么付费版或免费版,整个界面简洁到恰到好处,让人欲罢不能
你可以前往Google 网上应用商店免费下载:Clearly
Srylus 脱胎于之前大名鼎鼎的网页美化扩展程序:Stylish,因窃取用户隐私被下架后,Stylish 的原作者在删除了所有分析功能后,推出了 Srylus。
Srylus 让用户可以通过更改 CSS 的方式,优化网页界面。即使你不会 CSS 技术也没关系,Srylus已经适配了不少美观好用的网站主题。
比方说:优化知乎字体和排版,为百度换上 Material Design 风格的主题(如下图)。
你只需在任意网址点击 Stylus 图标 ,然后选择「查找更多样式」,Stylus 就会列出适配当前网站的所有主题和模板。
你可以前往 Google 网上应用商店免费下载:Stylus
为什么专门为了黑夜模式选择一个插件,因为 Dark Reader 几乎完美适配了所有网站——我使用 Dark Reader 三个月以来,还没遇到过不兼容的情况。以我正在编辑的知乎页面为例:
Dark Reader 和 Stylus 类似,通过 CSS 方式修改网页样式,以实现黑暗模式的效果。当然,如果你不想改变网页本身的展示效果,又想让网页不那么刺眼,Dark Reader 提供了明亮模式的选项,切换后调整「亮度和对比度」即可~
哔哩哔哩助手,是一款专为知名弹幕视频网站 bilibili 服务的浏览器扩展程序。它可以提供:视频及弹幕下载、画中画(小窗播放)、推送管理和菜单和自动签到等实用功能。
值得一提的是,哔哩哔哩作者十分高产,插件更新也一直保持较高频率,请放心食用。
你可以前往 Google 网上应用商店免费下载:哔哩哔哩助手
IDM(Internetdownload Manage)是一款知名的下载工具,除了下载速度拥有优异的表现外,IDM 另外一个备受好评的功能,是软件内置的 Chrome 插件,可以直接解析并下载当前网页的视频。
不过 IDM 不是免费工具,在 20 天试用期结束后,需要付费才可以继续使用。
你可以前往 IDM 官网下载软件(内置 Chrome 扩展程序):IDM
如果你有批量下载图片的需求,就一定不能错过免费强大的 Fatkun。Fatkun 可以通过嗅探功能,一键选择当前网页所有图片,你可以根据高度、关键字或页面一键选择需要下载的图片。
对我个人来说,Fatkun 更实际的功能是突破某些网站无法下载图片,或是下载图片不可用的限制。
比如微信公众号下载的图片通常都是没法用的 webp格式,Fatkun 就可以自动转换成通用的 jpg 或 png 格式。
Fatkun 还内置了一些特别实用的脚本,例如天猫、淘宝商品图一键下载、B站和腾讯漫画一键下载等等。
如此免费又良心,下载后不用也是一种享受!
如果你暂时没有正确上网工具,可以从我提供的链接不限速下载以上所有离线工具(需登录坚果云账号):Chrome 扩展程序合辑
当然,小坚果还有更多超实用的 Chrome 拓展没有分享出来~最强广告拦截扩展、最强网页剪藏扩展、最强比价拓展等等~破 1K 赞,小坚果会全部分享出来哦!
本次分享就到这里啦,大家有好的 Chrome 插件可以在评论中留言,毕竟互相学习才能让我们进步嘛。
关注 坚果云 ,轻松 Get 高效应用!