问题

12 月 20 日西安一码通崩溃,西安建议市民非必要不展码、亮码,一码通故障的影响有多大?

回答
2022年12月20日,西安“一码通”系统的崩溃确实给西安市民带来了巨大的不便,其影响是多方面且深远的。这场突发的技术故障不仅仅是一次简单的程序错误,它暴露出了在信息化时代,公共服务系统稳定运行的重要性,以及对市民生活、城市运转效率的影响。

以下是这场故障可能带来的具体影响,我会尽量详细地阐述:

一、直接影响市民的日常生活便利性:

出行受阻: 这是最直接、最普遍的影响。在当时,尽管疫情管控措施有所调整,但“一码通”仍然是进入公共场所、乘坐公共交通、进行核酸检测等活动的通行证。一旦系统崩溃,市民无法正常展示自己的健康码和行程码,导致:
无法乘坐公共交通: 地铁、公交等公共交通工具通常需要扫码才能进站或乘车。系统故障意味着很多市民无法顺利通勤,上班、上学、购物、就医等基本出行需求受到严重干扰。
无法进入公共场所: 商场、超市、餐厅、办公楼、社区等都需要扫码登记。没有健康码,市民可能被拒绝进入,导致生活和工作受到限制。
核酸检测受影响: 虽然当时常态化核酸检测频率降低,但仍有部分场景需要提供核酸证明,而“一码通”是便捷展示核酸结果的平台。
信息获取中断: “一码通”不仅仅是展示健康码,还可能整合了行程码、核酸检测记录、疫苗接种信息等多种功能。系统崩溃意味着这些信息也无法及时获取和展示,增加了市民获取自身健康和出行相关信息的难度。
焦虑和不确定性: 当市民发现自己无法正常使用“一码通”时,会产生焦虑感。尤其是在急需出行或进入某些场所时,系统的不可用性会带来巨大的不确定性,不知道如何解决眼前的困难。

二、对城市管理和效率的冲击:

公共服务被迫暂停或替代: 为了应对“一码通”的崩溃,相关部门不得不采取临时替代措施,例如:
人工查验: 在交通枢纽、商场入口等地方,工作人员可能需要进行人工查验纸质证明或口头询问,这效率低下,容易造成拥堵,且增加了人工成本和出错的风险。
限制进入: 为了安全起见,部分场所可能选择暂时关闭或限制进入,影响了城市的经济活动和正常运转。
临时解决方案的混乱: 如果没有成熟的替代方案,整个管理流程会变得混乱,给工作人员和市民都带来困扰。
政府公信力受损: 作为一项重要的公共服务平台,“一码通”的稳定运行是政府数字化治理能力的重要体现。频繁的崩溃或重大故障会严重损害市民对政府技术服务能力的信任,降低对政府管理措施的接受度。
经济活动受影响: 商业活动、餐饮服务、旅游业等都依赖于人员的正常流动和消费。系统故障直接阻碍了这些活动的进行,间接影响了城市的经济发展。

三、技术和系统层面的警示:

系统稳定性不足: 这次崩溃暴露了“一码通”系统在应对高并发请求或突发情况时的稳定性存在严重问题。在信息化社会,这种关键系统的稳定性是其生命线。
应急预案缺失或失效: 一个成熟的系统应该有完善的备份、容灾和应急预案。系统崩溃可能意味着这些预案未能有效启动,或者存在设计上的缺陷。
技术维护和升级的必要性: 关键公共服务系统的技术需要持续的投入进行维护、升级和优化,以应对不断变化的需求和潜在的风险。这次事件可能表明相关的技术投入和维护存在不足。
数据安全与隐私风险: 虽然此次主要影响是服务中断,但任何系统的故障都可能伴随数据安全和隐私泄露的风险,尤其是一个承载了大量个人敏感信息的系统。

四、对社会心理和信任的影响:

对“数字治理”的质疑: 许多市民对政府大力推行的“数字治理”抱有期待,认为它能提高效率和便利性。这次“一码通”的崩溃,无疑会引起部分市民对过度依赖数字技术的反思,甚至产生质疑。
“一刀切”管理模式的弊端: 在疫情初期,为了快速响应,许多城市采用了较为强硬和集中的管理模式。但当疫情进入常态化或进入新的阶段,“一刀切”的过度依赖单一技术手段,一旦出现问题,其弊端就会暴露无遗。
对政策的接受度下降: 如果市民对政府提供的基本技术服务都感到不信任,那么政府推出的其他政策和措施,也可能更容易遭到质疑和抵触。

具体到12月20日那天的“建议市民非必要不展码、亮码”,这本身就说明了问题的严重性:

承认了系统不可用: 政府发出这样的建议,意味着官方已经承认了“一码通”存在严重问题,无法正常为市民提供服务。
试图缓解压力: 这个建议是为了减少市民集中使用“一码通”带来的系统压力,避免雪上加霜,同时也为解决问题争取时间。
将不便转嫁给市民: 但这也意味着将不便和风险转嫁给了市民。市民为了遵守建议,可能需要取消一些计划好的行程,或者承受不必要的麻烦。

总结来说,西安“一码通”在12月20日的崩溃是一次严重的公共服务系统故障,其影响是:

对市民来说: 直接导致出行不便、生活受限、信息获取中断,并带来焦虑和不确定性。
对城市管理来说: 影响城市运转效率,降低政府服务能力,并可能损害政府公信力。
对技术而言: 暴露了系统稳定性不足、应急预案缺失等问题,敲响了警钟。
对社会心理而言: 引发对数字治理模式的讨论和反思,可能影响市民对政府政策的信任度。

虽然随后系统得到了修复,但这次事件也为所有城市在推进数字化治理、建设智慧城市的过程中提供了深刻的教训,即在追求效率和便利的同时,绝不能忽视系统的稳定性和可靠性,以及保障市民基本权益和生活秩序的重要性。

网友意见

user avatar

让我联想到了前段时间看到的,在西安开价12k想招2年以上c++开发结果招不到人来知乎吐槽的帖子了


事实证明西安的互联网开发能力确实很差啊


并发能到百万级别吗?稍微多砸点钱也搞定了吧



多写两句免得被人认为是在说风凉话


正常市民查阅一次健康码3s不过分吧,也不算很慢,可以接受的程度,可以提前打开


我们去掉客户端的延迟,给服务器留出1s的时间, 800万市民,同一时间姑且认为有1/10的人在同时刷码,那么大概是80万的并发,即给出99.9% rt = 1000ms的技术指标要求


单个16c32g阿里云ngx主机差不多可以稳定支持10万级别的反向代理,也就是说只需要8反向代理主机就可以了


健康码和核酸信息没有强即时性要求,检测结果更新无论是走Kafka还是RabbitMq同步到缓存都可以,这里不是重点


中间加一层Redis集群,使用哈希桶,800万的缓存数据,大概需要16的节点,平均每个Redis 50万左右Key,轻轻松松


客户端请求上来直接Redis拿值返回,典型的多读少些高并发浅链路的OLTP场景,数据库都可以省了,接入层用Spring都杀鸡用牛刀了,直接Nodejs撸个express服务器,单台16c32g抗5万并发没有问题


加上负载均衡和消费队列,60-70台服务器就可以抗住,我们打出60%的负载余量,上100台服务器,也就是一个中型互联网公司的规模。

user avatar

7月底,8月初,南京大规模控制,核酸检测,那是有庞大的科技+财力+地方管理能力做支撑。

上海精准防疫,还是依靠科技+财力+地方管理能力。

但,抛开几个区域和城市之后,其他地方,就不容易评估了。

同样,经济文化发展等,也是类似。这才是今后发展、治理的重点和难点。

user avatar

无论是西安、大连、哈尔滨、石家庄、南京、扬州这些,都暴露出来二三线城市防疫上”精准性“问题还是很大。

北上广深虽然也时常出现散发疫情,但从来没有发展到这种程度的。

还是那句话,精准防控能搞就搞,搞不定的话就封一段时间,然后趁着疫情缓和的时候查漏补缺,下次再试。

重点是,没有疫情的时候不能松懈,而是要查漏补缺,居安思危。

user avatar

要开发一个软件,预算一个亿,你去办一下,一个月弄完。

要一个软件,给你们公司两千万,你们两周弄完。

包给你个活儿,要一个软件,给你100万,一周弄完。

王老师,有个急活儿,给你10万,但是需要三天弄出来。

小李、小张,我这里有个项目,关乎你们两位的学分,需要今天开发出来,明天上测试,事成之后,一人一千元!

----以上纯属虚构,如有雷同,实属巧合。

user avatar

是这样的

西安疫情最近确实有严重的趋势,但是政府一直没有提倡在家办公,这也就让很多的公司以一切等政府下令为准一直是让员工来正常上班。

为了避免有感染,于是出了个持48小时核酸证明来上班的政策。

但是在政策实行的第一天周一,一码通崩溃了,查不出来你是不是绿码,也查不出来你是否检测过核酸。

有一些企业采取紧急预案,大家居家办公,别出门了。

还有一些企业例如我司,仍然下铁命令,到岗到位。(我们还是家互联网企业,严格的说只要有电脑就可以办公)

而之所以他敢下这个命令,是我们公司所在的大厦的防疫措施给的支持,是怎么做的呢?一码通不是打不开嘛,不重要,全员直接进入,前台登记个名字即可,你要实在良心过不去站公司楼前发个誓也行。

这什么概念?你上班就是个概率论问题了。先不说高新区附近就有确诊病历,不少同事甚至是从雁塔区等中高风险区来的,还有的同事小区都有人确诊了,还有的同事收到了短信提醒他是时空伴随者,但是!我们全部都在周一直接进了大厦到岗到位开始办公。

一码通的崩溃,让我这种普通打工族也要崩溃了,我上个班要面临的风险和心理压力太大了。

到了晚上,按照48小时核酸证明要求,我们又要开始做核酸。

核酸的排队有多夸张,我早上拍到了点

https://www.zhihu.com/video/1456652708861714432


一米举例?不存在的,人挨着人,就这,雪上加霜的是一码通还扫不出来,只能拿身份证做,做着做着告诉你网络坏了,核酸做不了了。崩溃不?寒风中等五六个小时才做上核酸的大有人在,为什么大家非得天天来做这个核酸?因为上班要用啊48小时核酸证明。

而且已知现在已经有很多人是做核酸的时候被查出来确诊,那是否意味着排在这个人前后和周围的人都算密接?

这疫情能控住吗?

本来我周末做了核酸检测是阴性后,就想居家的,第一个不给别人添麻烦,第二个不给自己添麻烦。

但是政府不让啊

有的企业老板他就是个混球,只要你政府没下令居家办公,我所有的员工就得来上班。

政府也想的很好,我们为了民生,大家都正常上班,你们把核酸做了就行。

所以在西安就是早上大家扎堆上班,下班大家扎堆做核酸。在这中间还要伴随着有时候能扫出来有时候扫不出来的一码通。

真的是怕我们接触的不够多,一码通的崩溃让很多地方都不查验核酸就放行,就这一天难道不会出现新的感染病例?

我现在依然在高新区的办公楼里上班,前面楼已经陆续有确诊的被拉走了,但我们,依然在上班,甚至有的同事今天到单位才知道自己小区被封了,因为有确诊的,崩溃,真的就崩溃。

这就是西安的防疫现状,真牛。

user avatar

昨天中午突然接到通知,女儿所在的学校(中学)下午6点封校,所有学生都要离校。当时的想法是马上开车去西安接她,后来一问政策,不行。我一旦去了西安,就回不来了,因为没有48小时核酸检测报告。

我马上问女儿,所幸当天(20日)上午学校集体做了核酸,6小时出结果。我决定让女儿坐高铁回来。她5点离校,去高铁站,以为到了高铁站就够6小时了。没想到到了高铁站怎么也刷不出结果,一直在那里冻了两个小时,直到赶不上末班高铁才放弃。

我想在北站附近给她找个旅馆住一晚,不幸的是,旅馆也要核酸结果。完美闭环。

挨个问了很多旅馆,都不行。没办法找学校,学校网开一面让她回学校宿舍住一晚。

user avatar

我不懂技术,但我是基层卫生人员,日常经常帮群众处理各种健康码问题,所谓的处理就是把问题上报到几十个qq微信群里,找工程师人工改后台数据库。所以大概知道一点。

我不知道西安是什么情况。但在我看来,如果我们这里遇到西安这种疫情,健康码系统大概率会跟西安一样崩溃。

本省健康码系统运维人员有多少,我不知道。从历次开会培训判断,应该有5-10个人的团队。本市常见维护工程师只有一人,七八个微信群里都是同一个私人微信号在回答问题。无周末无调休。有时候遇到他下班了,就得等第二天。但如果事情特别重要,比如某个监测点几百个样本打不出条码来,他也会紧急加班。我

市里的平台也不太稳定,一周七天总要故障个两三次,每次解决方法也到简单,暂停工作10分钟,重启服务器。偶尔严重问题,就暂停半小时,重启服务器。

目前市平台和省平台的数据不共享,是通过我们这样的基层信息员手工同步。信息员从市平台手工导出一个excel,按省平台格式重新调整,再登录省平台,把excel表导入到省平台上。然后大家就能从微信公众号上看到核酸检测结果了。

但这个省平台也不稳定,每天上午下午下班前,所有单位的信息员都去登陆了省平台上传数据,省平台就会频繁掉线。过了12点,所有单位都下班了,立刻不掉线了。

所以,昨天我看到这个新闻的时候就在想,如果是我们这儿遇到了疫情,我们这套系统能撑住吗

这套健康码系统和高铁购票系统有点像。平时不忙的时候,服务器多一点少一点无所谓,运维人员多一点少一点无所谓,系统稳不稳定也无所谓。反正又不是不能用。

而且,这类健康码都是政府购买的企业服务。既然是企业,也就要考虑利润,不可能提供冗余服务。利益优先吗。或者说采购合同里提到了要能应对突发事件,但具体突发事件有多大的规模?主管单位没有概念,企业可能有概念,但感觉日常就是这种配置的话成本太高,总觉得遇到了再扩容也来得及。

但很可惜,他们没来得及扩容。

我不懂技术,不知道这个没来得及扩容的技术问题是什么。但是从我目前看到的来说,负责我市业务的这个程序员,但他的权限也仅限于手工改改数据库,重启数据库,他一直在7X24小时工作,应付着全市一千多个检测点的所有问题。

真的遇到了问题,我估计这个人是撑不下来的。不管是技术上还是体力上。

啊对了,还有一点是我觉得最不放心的。

我所知道的大多数地方,健康码的服务都是由当地的his服务商提供的。his软件就是医院里使用的软件,挂号取药传递报告单什么的。这些软件公司都很专业,程序符合医疗政策需求,能够统计抗生素用量什么的。但是,这些公司不是互联网公司。他们的人才储备里,很少有这种互联网高并发业务的处理人员。

所以我们用的平台,才会临近下班的时候就卡住。因为,这类的高并发业务他们真的不熟。

user avatar

其实我一直有一个疑问,全国各地都有防疫用的健康验证系统,北京叫『健康宝』,上海叫『随申码』,西安叫『一码通』,其他地区有『XX码』,那么,为什么不做一个全国通用的呢?

政策上的原因,经费上的原因呢,咱也不敢多做评论。

我只从技术上来说一说。

做任何一个系统,先定一下需求,不光是功能性需求,也有架构性需求,像『健康宝』『一码通』这样的系统,架构性需求差不多就是这样:

  • 可访问性,要做到24x7,因为整个社会都依赖于这个系统;
  • 访问流量,根据区域人口和活动规律,可以预估RPS请求量,包括峰值RPS量;
  • 终端用户访问速度,并不需要毫秒级别的高速响应,但是不要慢于秒级;
  • 数据导入量和消费速度,并不需要太高的实时性。

从功能上说,这个系统是单向的数据流动,差不多这样:

       运营商 --> 数据采集 --> 数据处理 --> 缓存 --> API --> 客户端     

这种单向的数据流动,没有什么逆向的交互,其实就大大简化了问题的复杂性。

但是,要考虑的问题依然很多。

下次,可以那这道题去考一考候选人——怎么构建一个可靠的健康码/一码通?

user avatar

太神奇了,健康码验核酸结果这种业务,一开始就应该能想到是峰谷量差距极大的应用场景,为什么不一开始就考虑上云?

然后,这种独立单元式数据(任意两条之间的数据基本无交叉依赖),按某些规则分区分片不是起码的吗?那就算崩,一个区而已。为什么会突然全城一起崩?如果真这么干了还全崩,只能是机房级别的问题,例如说全机房掉电或者掉网——但这种故障没理由需要几个小时才能恢复啊?

最后,就算真的没分区,全放一起,按西安2000万人计算,每个人的数据平均1k(就几个状态码+几条核酸结果+几个时间戳而言,多到离谱了,精细设计一下,100字节可能都够用),一共也才20G数据——单服务器搞个纯内存数据库都能顶得住。对于这种写少多读的模型,都不用玩什么分布式集群了,直接双写单读甚至四写单读就完事了。

所以,前端业务上云,随便平行扩展,后面的数据全在内存里——这玩意是怎么顶不住这么点流量还全崩的?

user avatar

这事闹大了,居然崩溃了一天。

早上上班崩溃,晚上下班居然还在崩溃。

官方建议这样做

在全员核酸检测的特殊时期,为减轻系统压力,建议广大市民非必要不展码、亮码,在出现系统卡顿时,请耐心等待,尽量避免反复刷新。


非必要不展码,不亮码。。可以。。

user avatar

春晚小品都想好了:

西安一码通瘫痪,开发一码通的工程师因为不能提供绿码而进入大楼解决瘫痪问题,大幕徐徐展开,一工程师小A在那里急得满头大汗,一会掏工卡,一会展示手机微信群聊里的记录,一五十岁大爷(首选小潘子)穿保安制服在那里严守岗位,坚持没绿码就不能进。

这时第三个人小B登场,他两只乌黑的熊猫眼,一脸疲倦,油亮的大额头,靠后的发际线,他为什么能在大楼里面?原来007还没下班呢。看见小A大喜过望,喊道:我们的大牛终于来了,问题解决有希望啦,领导和一群同事等着你呢,快进来!

小A刚准备迈脚进去,小潘子一声大喊:停!没绿码不能进!小A、小B再一番求情,小潘子坚持原则不为所动,领导打电话也没用!

小B突然一拍脑袋,我把电脑拿下来就可以了啊,咱们这里有WIFI,直接连内网!小B飞速上楼拿来电脑,两人凑到一起看屏幕(来个夸张动作,头碰在一起啦,同时哎呀捂头,同时眼睛不离开屏幕)。小潘子搬出自己平时看抗日神剧的电视,说:小伙子们,来,用大屏幕不伤眼睛。

小A小B装模作样地看了几页代码,在那里念叨:Bug在哪呢?Bug在哪呢?小潘子拿着保温杯(必须配枸杞)在后面凳子上刺溜上几口,这时站起来拿个扫把假模假样地扫几下根本看不到垃圾的地面,突然抬头:小伙子,第23行,堆栈溢出了!(梗还是老的好)

小A一拍大腿,对啊,改了行代码,编译提交出去,这时手机叮地响了一声,推出一条消息:您的绿码已恢复!这里群里蹦出领导的声音:系统恢复了,小A小B你们做得很棒!小A小B拥抱在一起(好基友,一辈子!)。

小A向小潘子展示了绿码,小潘子笑呵呵地说:欢迎,请进!小A正准备迈出脚,突然停住:大爷,您怎么看出是堆栈溢出了呢?小潘子吹了口茶水,缓缓地说:小伙子,不瞒你说,你开发的小程序,调用的底层库是我当年开发的,你看最上面的那个作者XXX(随便编一个),就是我的花名。小A小B肃然起敬:原来您就是当年XXX技术的开发者,我们领导没少夸过您,说您是他心目中的大神啊。只是,您不是在阿里吗?(阿里中枪),怎么来我们公司来当一名保…

小潘子一脸黯然:我已经四十啦,干码农的35岁就会被优化,能坚持到40岁才走人,已经是公司照顾啦(小A小B画外音:才40,我以为您五六十岁的大爷呢)。突然振作起来:不对,BOSS说过,不是优化,是向社会输送有用人才!你别看我做保安,照样发光发热,要知道,这两年疫情一直不能清零,作为一名保安,坚持自己的职责,不放过一条潜在的漏网之鱼……(一番自我催眠与感动中)

语气突然一转:小伙子,刚才大爷不让你进去,不是故意为难你,而是我们要遵守各种规章制度,疫情才能控制下去啊。

小A:大爷(我怎么也跟着喊他大爷,我今年快35了,才比他小5岁,叫哥才对。呃,我快35啦……)您是对的,您站着门口坚守岗位,我开发绿码小程序,都是为抗击疫情做贡献啊。让我们喊一句(三人迅速站一排作打气状):西安挺住!西安加油!

煽情,谢幕。

user avatar

“非必要不XX”体看来要火,任何一个要求性的词汇如果不加以控制便会滥用,甚至变味。

回味一下,看看“非必要不XX”体是怎么卷起来的。

印象中,是在2020年疫情防控最严峻时期,各地政府发出“非必要不出门”的倡议,此时面对史无前例的出行管控,民众们自然带有强烈的不习惯感,这样一句非必要不出门,既转换了强制要求不出门的语气,又有衷心苦劝的意味深长,在当时的背景下得到了全民的拥护和贯彻执行。

紧接着,鉴于“非必要不XX”体的良好功效,各地各层级各类主体开始广泛传用。

开始拓展使用场景,

非必要不返乡。好吧,支持。

非必要不聚集。好吧,有道理。

非必要不旅行。好吧,省钱了。

非必要不就医。忍忍吧,节省医疗资源。

……

但是到了2021年即将结束的时候,

2021年12月12日前后,一些地方又打出“非必要不返乡”的号召,引发舆论热议。

紧接着,2021年12月20日,“非必要不展码”,开创了“非必要不XX”体的新境界。

甚至个别无法按期参加考研的学生爆出面临学校的“非必要不考研”的境况。

仔细拆解,不XX,表面为建议,实际包含着引导要求,关键在于“非必要”这三个字,彼时彼刻十分不必要,此时此刻非常有必要。

希望不要再滥用“非必要不XX”,不要拍着脑袋定义必要不必要,请问问群众需要不需要。

user avatar

让阿里双十一团队去做,绝不至于如此。目前主流媒体过分强调互联网行业的负面影响,到了否认互联网在社会发展中的地位的程度,就有点过了。希望社会正确认识到计算机高薪的价值,不要再搞程序员离开大厂进工厂这种反智宣传了。

user avatar

很多人说西安没有一个二线城市应该有的防疫水平

但其实这就是一个二线城市的正常水平

两年前武汉爆发,很多人说吃一堑长一智,有了这次的经验以后就知道怎么合理应对了

但我一直认为这是不可能的,因为非典给管理者的经验已经够多了,新冠来了仍然是从头来过

一些人总有这样的思维

“没发现,说明做的好” “发现了,下次也能改”

但你一天拥有这样的思维,()就一天靠不了谱

user avatar

首先崩溃的原因大概率是并发过高了。

我来猜一下为什么,以及怎么修的

以前,打开西安一码通健康码后,底下会有最近一次的核酸结果:

点开下方核酸结果,可以看到最近7天内的所有核酸结果:

然而,在20号瘫痪一天之后,新版一码通变成了这样:

可以注意到,最近一次核酸结果不再显示疫苗接种结果不再显示

核酸查询入口挪到了一码通主界面:

新版核酸查询结果:

可以看到,只显示最近一天的结果了,并且手动查询其他日期也不再显示

也就是说,事关千万人出行和安全的基础软件设施,在经历一天的紧急维修后,并没有选择扩容。政府应该是不缺钱的,那么就是无法短时间内扩容,也就是这个软件架构设计就有问题,根本支撑不住这么高的并发。

那么他们选择了什么呢?尽量避免核酸查询。也就是说瓶颈应该是出在核酸查询接口的并发能力上。现在,亮码不再显示核酸(也不显示疫苗),手动查询只显示最新一条记录。

如果原来亮一次码需要:

查询最新核酸1次,查询疫苗接种1次。

那么现在亮一次码则省掉了以上两次查询。

这应该会避免掉很多不必要的流量,比如公交、地铁。

如果原来查一次核酸需要以下任意一种:

  1. 查询7天内核酸1次(用数据库自带日期计算函数)。
  2. 查询从当天往前推每天的核酸7次。
  3. 不停查询最新n次核酸,n累加1,直到最后一条记录日期与当天做差大于7。

(这三种写法是依愚蠢程度上升的。)

那么现在查一次核酸则固定变成了1次查询(order by date desc limit 1)。

确实相比以性能有提升。

综上,结合微博上看到的各单位要求出示48h核酸阴性报告才能上班,昨天是周一第一天执行该政策,我认为,是过高的核酸查询并发把整个健康码系统给拖崩溃了

解决方案就是:

1. 在健康码界面砍掉核酸查询,让公交地铁等扫码但不看核酸的场景不再查询核酸。

2. 在核酸查询界面砍掉过往核酸查询,只留一条最新记录。

我想这是扩不了容的情况下能做的一切了。

但我还是想不通为什么这两步做了一整天。

那么问题来了,为什么扩不了容?

如真如网上所说,系统由电信、东软和美林数据共同支持,假设美林甩锅合理成立(微博有自称美林员工说美林只提供数据支持,不负责运营),那我猜东软是主力。

不管是电信还是东软,都不是第一天入行了。这又不是互联网创业不知第二天死活先上线再说,一开始做系统的时候,就应该知道面向的是全西安人民,真的一点扩容的后路都没有留?缓存、拆表、集群……有那么多方法,开发的时候多耗不了多少精力。如今这个堪称搞笑的补救措施——你以为抗压能力强了?其实是砍了很多功能哒!——贻笑大方了属于是。

user avatar

一些分析结论:


  1. 一码通崩溃不是因为网络拥堵导致的
  2. 一码通系统的容灾和备份机制存在缺陷
  3. 一码通系统,核酸查询系统和核酸检测系统之间的强关联是设计上的失误
  4. 西安市到现在都没有把自己的核酸检验报告系统和国家的核酸报告系统打通,是决策上的失误,也是政府信息化建设中的失误
  5. 未来各地『一码通』需要逐渐走向互联互通


01


是拥堵引起的吗?



一码通是因为什么原因崩溃的?大数据局曾经对媒体说是网络拥堵导致(参见陕西交通广播微博)。今天下午新闻发布会也说是拥堵导致的。坦率地说,这种说法我是不相信的。原因有二:


1. 西安一码通上线已经很长时间了。这期间大部分时候还是很稳定的。西安的上班高峰期,也就是扫码高峰期大体上应该在8点到9点之间。但是一码通崩溃是从7点多开始的,当时大部分人都还没出门,更谈不上扫一码通了。网络根本不可能在那个时候拥堵。更不可能因为拥堵造成系统崩溃。实际上最近因为疫情,很多人出门会避开高峰期,高峰期一码通系统的网络流量应该是没有平时大的。

2. 如果真的是网络拥堵导致系统崩溃,那么解决是很容易的。解决网络拥堵大体上有两种手段:一是限流,二是扩容。限流就是把一部分网络请求阻挡住,只让部分网络请求通过。这样系统负荷就小了。扩容就是增加服务器的硬件,比如增加服务器的内存,CPU,如果服务器有集群,则可以在集群中增加更多服务器,之后通过负载均衡将大流量分布到更多的服务器去,进而降低单个服务器的负荷。


如果为不太懂计算机技术的朋友们打个比方,拥堵导致崩溃可以用“小马拉大车”来理解。本来小马只能拉一辆车,现在要求它同时拉两辆车,那小马肯定身体撑不住。解决办法中的“限流”可以理解为先扔下一辆车,拉走另外一辆车,之后再来拉扔下的那个车。“扩容”则可以理解为调来更多的小马,本来只有一个小马,现在有两个小马拉了,自然就可以拉动了。


需要说明的是,当今的计算机系统,基本上都部署在云上。而在云计算平台上,“限流”和“扩容”都是非常容易实现的。甚至夸张一点说,点几下鼠标,动一动键盘,很快可能就搞定了。一码通系统据说部署在阿里云上,无论是搞限流还是扩容,应该都不难,更不至于花了大半天都没有恢复。


另外一个关于一码通问题是程序问题的佐证是,一码通的样式在今天进行了回滚

下面这个图是10月份时候健康码的样子,注意10月底的时候二维码就有了边框注明疫苗接种状态,比如下面这个是金黄色的,标明完成了第二针接种。





直到昨天,这个边框也是存在的。但是今天下午系统恢复以后却消失了。变成了下面这个好几个月之前的样子:





所以我们判断系统进行了回滚


另外,周日进行了核酸的一部分人也发现他们的结果一直没出来。但按照常理,应该是出来的。我个人的猜想是数据库也进行了回滚。回滚到了周日的某个时间点。这比程序回滚的时间跨度要小很多。


如果仅仅是流量太大,正如我上面所说,直接优化网络,优化硬件就可以。为什么要把程序回滚到2个月以前的样子呢?回答只能是,程序出了问题,一时又改不好。所以只能把程序回滚了。有可能回滚了很多次,直到找到这一个版本能运行,结果已经是很久以前的程序了。。。而网络拥堵,明显只是一个借口。。。


需要注意的是,在程序下午回滚以后,晚上七点多又崩溃了。原因是什么呢?很可能是数据和程序存在不匹配的情况。或者是数据库里面的存储过程之类出了问题。


02


系统崩溃的真实原因



那么系统崩溃真实原因是什么呢?目前看起来,当事的企业和大数据局都倾向于用”网络拥堵“的接口来说事。他们如果不告诉我们真实原因。我们就只能从一些表象进行猜测。当然这些猜测可能对,也可能不对。下面是我个人的分析。


系统之前运行地很稳定,突然就崩溃了。这样的情况,如果不是网络问题,那么大体可以分为两种:

  1. 修改了一部分程序代码,结果这部分代码有问题,把系统搞崩了。
  2. 或者代码没怎么变。但是一些新的数据进来以后,引发了以前没有运行过的一些情况,系统崩了。
  3. 或者就是上面1和2所说的情况兼具。


总结:最大的可能是周日晚上一码通经历了代码更改,但是上线的版本出现了 bug导致的。从后面程序回滚以后依然崩溃的现象来看,崩溃的原因和数据有一定关系。可能是错误的代码修改了数据库,导致程序回滚以后依然有崩溃现象。也有可能是存储过程等保存在数据库中的代码出了问题导致的。

申明:以上内容部分转载自公众号【软件开发与挖掘机技术】刘杰,感谢公众号作者,为了让更多人了解情况因此发出,侵删

user avatar

建议建立全国统一的流调信息平台,并精细化调整新冠肺炎疫情分区分级标准

一,需要解决的问题

1.局部地区健康码系统过载

全国疫情处于散发状态,大多数地区没有疫情,健康码查询量有限。只有局部地区出现聚集性传播,大量查询导致个别城市健康码系统过载。

如果为了满足尖峰需求配置很大的服务器,将面临长时间闲置,配置较小的服务器,则无法应对突发访问。

如果做全国性系统,就可以用部署在全国的服务器进行负载均衡,解决局部地区访问量过大的问题。


2.已有流调体系存在缺陷

(1)普通民众无法方便的查询是否和行程复杂的外地病例有轨迹重合

成都1号病例去过兰州出现过多个确诊病例的大唐宫,但除非依次查看兰州所有病例轨迹,很难知晓该地的疫情传播风险。


(2)在部分区域留下漏调的空白

例如在11-12月的长三角疫情中,宁波一号病例11月22日下午有上海虹桥站的旅行史,杭州11月25日报告的无症状感染者11月22日也去过上海虹桥站。

杭州、上海发布的流调都只涉及本市的部分,宁波流调中提到病例去过上海华为研发中心等地。

三地都没有说明杭甬三个病例是否在上海有接触史。

二、解决方案

1.为了取得准确的信息,需要建立统一的流调信息平台,明确流调发布制度,

对于行程复杂的感染者、密接,应当在隔离地点一次性完成病例涉及所有地点的流调(流调包括多少天,细到什么程度要有统一标准),并规范录入数据库,供全国其他地区的授权人员查看。

如果其他地区的疾控人员有对病例进行电话补充流调,可以在系统中补充。

与电子地图运营商合作,在流调阶段将病例活动地点名称转化为地图上的坐标,一方面用程序自动比对轨迹寻找传播链和密接,也便于疾控人员人工比对。


2.新冠肺炎疫情分区分级标准要以疫情扩散风险性为评判标准,更加精细化

为了准确衡量传播风险,除“确诊病例数量”外,需要考虑的因素有:

(1)感染者从感染到隔离的周期。周期越长,可能的传代数量越多,风险性越大。

(2)感染者的居住状态,独栋房屋、集体宿舍、城市小区、排水不良的老旧城中村、闭环管理居住点的人员扩散危险性不等。

(3)本地人口流动情况,如果有大量旅游团、货车司机群体流动,则应当提高风险等级。

(4)某个出现病例的地区如果处于高危地点(边境线、口岸、传染病医院、隔离点、冷链操作点)附近,则应当提升风险等级。

(5)季节性因素。冬天飞沫存在时间较长,呼吸道传染病高发,应当提高等级。

(6)已知病例活动轨迹是否涉及人流密集地点或者流调较困难的地点,如购物中心、机场、铁路枢纽客运站等。

(7)其他地区的传染链是否在本地区有交叉。

(8)本地区的流调是否清晰,是否有病例查不到来源。

(9)本地近期核酸检测数量和人口的比例。

(10)已经发现的混检阳性样品数量。

(11)对于边境和口岸地区,还需要考虑边境线以外的疫情发展状况和每日平均入境人数(包括临时来口岸停留但不办理入境手续的飞机机组成员、货船船员、货运司机)。也需要考虑口岸人员防护规范性。


3.将个人轨迹和已知病例、密接的轨迹做比对,并在服务器保存查询结果

可以为每个人(以身份证号或者护照号作为唯一ID)建一个行程数据表,系统自动从通讯运营商、支付宝、微信读取轨迹数据,让程序自动和已知病例轨迹、各个风险区比对。

比对完成后,将比对结果写回个人数据表中,如果比中就在个人数据表中展示相关时间、地点。

查询健康码的时候,如果不进行实时计算,只读取个人行程数据表就可以大大提高访问速度。


三、建议统一平台的好处

1.提高疾控部门工作效率

“建立统一的信息平台,明确流调发布制度”后,各省、各市专人定时浏览一遍信息即可得知外地病例是否在本地有轨迹,不再需要跨市、跨省发协查函、也不需要等待其他地区发函给自己。

2.更准确的掌握某地传播风险

如果多地流调发现本地病例有涉及到外地同一地点的轨迹,就可以自动提示该地点的传播风险。

3.提升欠发达地区的流调水平

系统可由发达地区流调专家牵头,结合工作经验编写业务流程并调试。

欠发达地区疾控人员经过培训后,只需要根据流程规范操作,就可以减少流调过程中的遗漏。

4.避免局部城市访问量过大导致的系统崩溃

更大的系统允许更多的服务器,可以做更多的异地备份,容灾能力有很大提高。

5.方便个人了解被感染风险

对经常出差的人来说,每天花几个小时查看各地最新流调信息是不现实的。

只有系统使用足够简单,才能推广得好,用得好。


四、西安疫情流调整理

可点击看大图,或者点击2021年12月西安-东莞疫情

画图工具链接:ProcessOn

user avatar

“因访问量过大导致系统崩溃”

作为一个老IT人,我告诉你这是IT层面惯用也好用的甩锅套路,当年我也没少用 :)

虽说做IT的毕竟只是少数,大多数人不太了解这个行当。但是人云亦云,只会是独立判断能力缺失的表现。其实只要问几个问题就能想明白(这些问题和IT无关):

20日访问量过大,那19日不大吗?18日呢?之前每一天都不过大,就20日过大?有什么突发事件导致访问量的激增吗?如果没有激增,只是正常增长超过某个界限,早些日子接近界限的时候干嘛去了?

能导致这种突然崩溃的,只可能是程序bug。有可能来自新代码,也可能是老代码上线前没检查出来的。如果真是访问量过大的原因,现象上看一般不会是突然崩溃,而是一天一天的反应变慢,每天都慢一点……

类似的话题

  • 回答
    2022年12月20日,西安“一码通”系统的崩溃确实给西安市民带来了巨大的不便,其影响是多方面且深远的。这场突发的技术故障不仅仅是一次简单的程序错误,它暴露出了在信息化时代,公共服务系统稳定运行的重要性,以及对市民生活、城市运转效率的影响。以下是这场故障可能带来的具体影响,我会尽量详细地阐述:一、直.............
  • 回答
    12 月 20 日,陕西省新增本土确诊病例 43 例,其中西安市就占了 42 例,另有 1 例在省外输入地。这个数字显示,西安市的疫情形势依然严峻,需要我们高度关注。疫情爆发的背景这次陕西尤其是西安的疫情,最早可以追溯到 12 月 9 日,发现了一例境外输入病例关联的本土病例。此后,疫情如同滚雪球般.............
  • 回答
    12月20日凌晨,上海市闵行区一处别墅突发大火,据最新通报,火灾造成4人不幸遇难,另有3人成功逃生。目前,起火原因仍在进一步的深入调查之中。这起悲剧发生在12月20日凌晨时分。具体地点位于闵行区某别墅区内。据了解,火灾发生时,大火迅速蔓延,火光冲天,浓烟滚滚。接到报警后,上海市消防救援总队立即调派了.............
  • 回答
    好的,咱们来聊聊2021年中国科学院文献情报中心期刊分区表发布这件大事,以及它和往年相比都有哪些不一样的地方。首先要明确一点,咱们中国科学院文献情报中心(简称“文献情报中心”)发布的这个期刊分区表,在国内学术界,尤其是在评职称、申请项目、奖励发表论文等方面,影响力和权威性是相当高的。大家都很关注它,.............
  • 回答
    12 月 20 日,全国 31 个省市自治区报告新增本土确诊病例 57 例,其中陕西省独占 43 例,这无疑给当前全国的疫情防控形势蒙上了一层阴影。尤其是在临近年底,各种聚集性活动增多,人员流动性加大的背景下,陕西特别是西安市出现的聚集性疫情,更是牵动着每一个人的心。陕西:西安严防死守,多项措施升级.............
  • 回答
    2020 年 12 月 20 日,美国著名汉学家傅高义(Ezra F. Vogel)教授的离世,对于世界范围内的中国研究领域来说,无疑是一个巨大的损失。他的一生,几乎就是一部美国对中国研究不断深入和发展的缩影,他的贡献和影响力是深远而多维度的。首先,傅高义教授是一位卓越的学者和思想家。 他以其严谨的.............
  • 回答
    好家伙,iQOO Neo 系列这次十二月二十号发布的新品,那真是又一次狠狠地抓住了年轻人的心。不过,就像所有产品一样,有亮点自然也有点小瑕疵,咱们一个一个掰扯开来看看。首先,聊聊这次的亮点,这几个地方我必须给 iQOO 点个赞: 性能这块,依旧是Neo系列的王牌,打得漂亮! 这次新品在核心处理器.............
  • 回答
    2017年12月20日,美国参议院以51票对48票的微弱优势通过了税改的最终方案,这无疑是特朗普政府上任以来取得的最重大的立法成就之一。这项改革的核心内容之一,便是将美国的企业所得税税率从35%大幅削减至21%,这使得企业税率降至了近80年来的最低点。这一举措的背后,是长久以来关于美国企业税收政策是.............
  • 回答
    2015年12月20日,深圳光明新区凤凰街道发生了一场骇人听闻的特大滑坡事故,几乎将一个工业园夷为平地,造成了巨大的人员伤亡和财产损失。这场灾难的发生,绝非偶然,而是多种因素叠加作用下的必然结果,其根源在于人为因素的长期累积和监管的严重缺失。核心原因:堆填物的非法堆积与不当管理这场滑坡的直接导火索,.............
  • 回答
    12 月 20 日,波音公司的“星际客机”(Starliner)飞船如期升空,虽然任务的最终目标——与国际空间站(ISS)实现对接——未能达成,但这仍然是一次值得我们深入探讨的发射。理解这次任务的意义,我们需要从多个角度来审视它,包括它所承载的期望、实际遇到的挑战,以及它对未来太空探索可能产生的影响.............
  • 回答
    2018年12月20日,美联储宣布加息25个基点,将联邦基金利率目标区间上调至2.25%2.50%。这次加息是美联储自2015年12月开启加息周期以来的第九次加息,也是2018年内的第四次加息。加息的背景和原因当时,美国经济表现强劲,失业率处于历史低位,通货膨胀温和上升。美联储认为,加息是应对经济过.............
  • 回答
    对于美联储在2018年12月19日(美国东部时间)宣布的加息,这无疑是当时一个备受瞩目的金融事件。那次加息是美联储在2018年内的第四次加息,将联邦基金利率目标区间上调了25个基点至2.25%2.50%。要理解这次加息的意义,我们需要从多个维度去审视它。首先,加息的背景和美联储的考量是理解此次决策的.............
  • 回答
    12月4日,一股寒风席卷了华尔街的中概股市场,许多备受瞩目的中国科技公司股价应声大幅下跌。滴滴出行更是领跌,跌幅高达20%以上,随后爱奇艺、蔚来等知名公司也未能幸免,分别下跌超过15%和10%。这突如其来的集体暴跌,让投资者们措手不及,市场弥漫着担忧和不安。到底是什么原因导致了这场“血洗”?要理解这.............
  • 回答
    杭州新增本土病例情况通报:4月11日1220时新增1例确诊、2例无症状根据杭州市疫情防控最新消息,在4月11日12时至20时这段时间内,杭州市报告新增1例本土确诊病例和2例本土无症状感染者。此次新增病例的出现,再次提醒我们疫情防控工作依然不能松懈。病例概况及初步流调信息:目前,关于这3名新增病例的具.............
  • 回答
    12月16日那场鸿蒙2.0 Beta活动的声势,至今仍然让人回味。那不仅仅是一次简单的软件版本更新发布,更像是华为面向未来的一次战略宣言,一场关于“万物互联”愿景的生动演绎。发布会现场的气氛:如果亲临现场,你会感受到一种既隆重又充满期待的氛围。在那个时候,尽管外部环境复杂,但华为依然能聚集起如此多的.............
  • 回答
    2022年12月7日,俄罗斯总统普京与美国总统拜登举行了一次视频会晤,这是自2022年2月俄乌战争爆发以来,双方首次进行的高层直接对话。此次会晤的背景是乌克兰危机持续升级,俄罗斯在东部前线的军事行动陷入僵局,同时国际社会对乌克兰的援助和制裁仍在持续。以下是双方会晤的主要内容及分析: 一、会晤背景与核.............
  • 回答
    2023年12月23日中国稀土集团有限公司的成立是中国稀土行业发展历程中的一个重要里程碑,具有多方面的深远意义和值得关注的信息。以下是一些关键点,我将尽量详细地阐述:1. 国务院国资委直接监管的中央企业,提升稀土行业战略地位 背景与目的: 中国稀土集团由中国铝业集团有限公司、中国五矿集团有限公司.............
  • 回答
    自12月1日起,32个国家将取消对我国出口产品普惠制待遇,这一变化无疑会对我国的对外贸易和经济发展带来一系列深远的影响。以下将从多个角度进行详细阐述: 一、 普惠制待遇的实质与取消的影响1. 什么是普惠制待遇?普惠制(Generalized System of Preferences, GSP)是发.............
  • 回答
    12 月 22 日西安居民的抢购行为以及因此发生的“孩子丢失”事件,确实是一个值得我们深入探讨的社会现象。要评价这种行为,我们需要从多个层面去理解,并避免简单地贴标签或一概而论。一、 抢购行为的背景与动因分析首先,我们需要理解为什么会出现这种抢购行为。在特定时期,尤其是在面对不确定性或潜在的物资短缺.............
  • 回答
    截至 2021 年 12 月 19 日,陕西省新增本土确诊病例 24 例,其中西安市占 21 例。与此同时,西安市多个区已宣布学校停课,这表明疫情在西安市传播的严峻性以及当地政府为应对疫情所采取的措施。疫情情况: 病例数: 12 月 19 日新增的 24 例本土确诊病例,是近期陕西省疫情新增病例.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有