百科问答小站 logo
百科问答小站 font logo



复旦博士开发小程序,2 分钟核对 800 幅核酸截图助力防控,疫情中你在哪个瞬间体会到了知识的力量? 第1页

     

user avatar   shitysheepy 网友的相关建议: 
      

这算啥,上次领导半夜打电话喊我加班说有个很重要的工作。 到了办公室才发现领导喊了十几个人,给了我们发了个excel表,上边有全县所有居民的身份证号,说需要把表里所有大于60岁和小于5岁的人挑出来,大约十几万人,每人负责1万人,然后给我们每人一台计算器,让我们一个一个根据身份证号里的年份计算年龄把不符合的删掉…… 我当时就傻了,领导是真的让我们用计算器一个一个去算………然后我说:领导,其实还有更简便的方法,就是今年是2022年,大于60岁的人出生年份在1962年之前,小于5岁的人出生年份在2017年之后,只要身份证号码符合这两个特点就可以了,不需要每个都用计算器去算。 领导说:恩有道理,这是个好办法。 大家也都附和说是好办法。 然后一屋子人愉快的干了起来……………………

感觉这里加个狗头更合适

没想到会有这么多人点赞。那就再讲一下我前单位的一个领导,这个领导特别不放心excel的自动求和功能,每次总要自己用计算器加一遍。关键他好多年前是做财务的,按计算器都是眼睛盯着电脑屏幕盲按,apm堪比职业电竞选手,又快又准。 但是一个财务人员不信任excel的函数功能在我看来就像研究基础物理的不信任量子物理学…所以我怀疑他单纯就是为了炫技…


user avatar   jzwa 网友的相关建议: 
      

这真的不太好意思能感受到知识的力量,更让我感受到了无知的力量。

一个OCR识别都能吹成这样。

我在百度上找了一个核酸检测报告的截图,时间比较早,但是也能凑合用。

可以看到,这上面有姓名,身份证号,检测机构,检测时间还有检测结果。

为什么可以识别呢,就是因为用了OCR识别库。

OCR的全称叫作“Optical Character Recognition”,即光学字符识别。它的作用就是识别并获取图像里的文字信息。

我们平时的拍照取照片里面的字用的就是这个技术。

那么问题回来了,如果我们要做这个「小程序」的话该怎么办。

如果是我的话:

第一步:调用需要的库,比如图像读取库,OCR库,文档处理库(比如pandas)

第二步:批量读取图片

第三步:把图片里面的文字读出来

第四步:用正则表达式把文字切分好,并保存在表格中

第五步:用一些纠错机制,检查下excel文档有没有常识性错误,比如位数不对的身份证号,错误的日期等等。

提交文档,结束。


这些东西交给一个大三的计算机本科生应该问题不大,因为都是现成的工具,只需要会查找,并复制粘贴就可以了。



往期回答推荐:

为什么国外小孩词汇只有2000个就能正常交流,而国内大学生4000个词汇量却是哑巴英语?

如何正确的从零开始学英语?

平凡:怎样自学雅思? 万字长文/雅思备考保姆式攻略


user avatar   chong-po-hei-an-93 网友的相关建议: 
      

三年了!已经三年了!

你们知道现在基层防疫宣传还是怎么宣传吗?什么铁脚板,什么烂笔头,一个个敲门,美其名曰全面排摸。一遍遍的手动登记,手动录入,手动写卡片,手动汇总。

发下来的EXCEL表格有标准日期格式不用日期格式,非要整个220326文本格式,还非要下面统一用这个奇葩的格式。逼着下面各种日期格式一点点的改过来。

前两年宣传5G,宣传大数据,宣传科技,到头来防疫的时候却似乎回到原始时代了。

弄出个系统想着大肆宣传,却是三天写出来的乐色货没用一天就胎死腹中,这个钱是真的好挣啊。

唯一用到的科技就是微信,微信加群,微信发布指令,微信指挥,微信布置任务,微信对接,微信拍照上传,微信确认,微信扫码。。。

哈哈哈哈哈哈哈哈!

呜呜呜呜!


user avatar   xie-zi-xiao-17 网友的相关建议: 
      

所以之前都是人工校对?

防疫拉胯不是没有原因的,2022年了!

本科生都能做出来的东西…结果疫情三年了基层都没人去考虑电脑识别

我看真是中国人多,人太多了,多到这帮蠢材靠填人力填出了成绩


user avatar   rewrgf 网友的相关建议: 
      

一个小时就能解决的事,为啥之前没人解决,为啥其他社区没人解决?

现在抗疫的人力物力如此短缺,“每次都要几个人核对一个多小时”这种事,为什么不能被“一个小时编程+每次5分钟跑程序”替换掉?

节约出来的人力,不就可以去多送几次菜了吗?


user avatar   yi-yun-4 网友的相关建议: 
      

每天红黄码信息发给我我也是写了个Python进行汇总。如何从一段话里读取姓名身份证地址红黄码和处置信息。真正难的其实反而不是数据汇总,是领导长期要求疫情防控要有亮点。领导其实不关心数据走势,没那个领导喜欢看数字。他要的是材料不断推陈翻新。所以工作效率其实提升并不快,我每天的日报不改到凌晨两三点是过不了关的。


user avatar   cartman233 网友的相关建议: 
      


user avatar   cxpm 网友的相关建议: 
      

博士写代码助力统计,我真心表示赞同。本回答重点吐槽媒体记者。

第1层反应是:啊?就这?好意思吹牛?

固定位置大小截图印刷体汉字的OCR,网上免费的API,开放的源代码一堆,知乎本地搜索就有gitee源代码可以复制。

假如叫个软件工程师给一天搞定,估计工程师苦干两小时,摸鱼六小时。。。开森。

第二层反应是:嗯嗯,此记者的技术素养一言难尽

这种难度的题目,本科生拿来当毕业设计估计会被老师打,专科生做毕业设计也得不到优秀:技术难度真没有,工作量还不足。。。苦逼被复旦,博士,人工智能,图像识别几个高大上的名词一唬就迷糊了。

第三层反应是:记者好职业,会抓流量赢麻了

当今社会流量是王道。本来一个毫无难度的小程序,扔到网上木有人看的水平,可记者妙笔生花,结合抗疫大局,博士头衔加持,人工智能增色,图像识别加分,马上感觉不一样了。再来点争议,流量原地垂直起飞。

我帮防疫人员写的vba小程序分类红黄码,可以把眼花缭乱干两小时的活缩短到5分钟内完成。可惜我不是名校博士,工具是破破的VBA,木有人工智能概念看点,根本不可能有人报道。

记者传播学满分,流量绩效满分。

第四层反应是:记者眼光远大 ,我的批评草率了

没错,他如老鹰般锐利的眼光一眼看出了基层信息化应用水平不足的短板:明明几行代码就能解决的事情,却要靠人力堆积。

他妙笔生花的新闻报道积极弘扬知识技能的力量,赞颂信息化赋能的威力,无论在鼓励小朋友学习、推进信息化在基层的普及还是治理能力赋能上都颇有眼光。

关键是人家报道弘扬科技服务抗疫,无论如何不该批评,确实草率了。

迷途小书童有诗赞曰:

博士扬名立万,
A I 还看复旦;
防疫科技闪闪,
信息技术要赞:
流量成千上万,
技术不忍细看。

程序员又有诗道:

人工智能调参数,
图像识别贴代码。
急难险重开源库,
研发经费足又足。

记者同志,过马路的老奶奶我都不扶,就服你。嘿嘿嘿。


user avatar   ye-se-47-13 网友的相关建议: 
      

看来上海大数据精准防疫靠的原来是人多啊!


user avatar   qiu-ming-shan-lao-si-ji-2-9 网友的相关建议: 
      




     

相关话题

  有哪个高手可以解读“世界黑客编程大赛第一名的作品(97年Mekka ’97 4K Intro)”? 
  为什么深圳和上海都有新增病例,但是上海大部分是无症状? 
  如何看待河北河间巡逻队带走村民一只羊做核酸,过后没有归还羊而是直接付款的行为? 
  广州疫情越来越严重了,怎么做好防护? 
  如何评价今年复旦大学的推免政策? 
  11 月 30 日意大利首名奥密克戎毒株感染者子女就读小学出现多个阳性病例,对此该采取哪些防疫措施? 
  官方通报江西上饶隔离宠物狗遭扑杀,称「相关人员已调离岗位」,有没有更好的处理办法? 
  1 月 13 日杭州市新增一例核酸检测阳性人员,系杭州西溪医院一名护士,目前情况如何? 
  行业内对低代码开发是什么看法? 
  山东老人患癌就医被小区要待死证明,官方通报「双方系误会引发言语冲突」,疫情防控中哪些细节需要注意? 

前一个讨论
为什么神农架林区深处不允许前往?
下一个讨论
有一个很开放的男室友是什么体验?





© 2024-05-06 - tinynew.org. All Rights Reserved.
© 2024-05-06 - tinynew.org. 保留所有权利