2021年7月30日,旅客在湖南長沙高鐵南站掃健康碼。圖/中新
“數據宇宙”中的健康碼
本刊記者/苑蘇文
發于2022.1.24總第1030期《中國新聞周刊》
一張巨大的由算法引擎織成的細密的網,是口罩、核酸檢測與隔離之外,中國阻止新冠病毒複制傳播的另一大利器。到了新冠肆虐的第三個年頭,這個數字防禦長城已趨近完善。
在有14億人口的中國,每個人都能通過智能手機調取一張健康碼。這是在紅黃綠間變化的二維碼或條形碼,三種顔色在後台由大數據算出,提示持碼人不同的感染風險狀态。不同地方的健康碼還展示不同的其他信息,有的展示照片,有的提示行程,還有的标識着打了幾針疫苗,為防止截屏僞造,大多數都嵌入動畫和定時刷新。
除了對外展示感染風險,健康碼還負責采集更精準的位置信息。中國遵循“動态清零”政策,每個人要為自己的出行和潛在的病毒傳播負責。在大多數城市,當你出入公共場所,會被要求在門口掃碼登記,而手動的掃碼登記,比被動的手機基站定位誤差更小。
健康碼由各地政府主導開發,企業提供技術支持。毫無疑問,用以檢測每個人健康風險的“底層數據”,涉及大量個人隐私。但接受《中國新聞周刊》采訪的政府相關部門及企業人士都保證,對于這些隐私信息,企業僅提供技術支持,并簽署了嚴格的保密協議。而自2021年9月1日起施行的《中華人民共和國數據安全法》,也為數據的安全上了一道“緊箍咒”。
快速上線背後的大數據戰略
健康碼的第一行代碼已經寫進了曆史,更準确地說,它已經成為中國國家博物館的館藏。玻璃櫃裡的那行代碼,創建于2020年2月13日晚8點34分,是浙江省健康碼引擎的開端,并在40個小時後上線測試,這是全國第一個省級健康碼,脫胎于幾天前的杭州餘杭區健康碼和杭州健康碼。
杭州市餘杭區,是阿裡巴巴公司西溪園區所在地。2020年2月4日,餘杭區就提出探索複工複産時疫情防控的數字化方案,“全人群覆蓋 全流程掌辦 全領域聯防”。公開報道顯示,依托于支付寶、釘釘、阿裡雲的技術力量保障,2020年2月5日淩晨5點,誕生了餘杭健康碼的第一個版本,在以小時計算的叠代升級中,健康碼在24小時内推廣至杭州,又在幾天内推廣至浙江省。防疫新理念“病毒式”傳播,一周之内已經落地超過100城。到了2月15日,國務院辦公廳電子政務辦指導支付寶、阿裡雲加速研發全國一體化政務服務平台疫情防控健康碼系統,加速了健康碼走向全國。
各地在健康碼探索中,并不全都依賴“互聯網大廠”。在杭州往西南1650公裡的貴州省貴陽市,雲上貴州大數據(集團)有限公司(下稱“雲上貴州”)承擔了貴州健康碼的開發。雲上貴州是貴州省國資委控股的國企,其業務指導單位是貴州省大數據發展管理局。
從2020年2月13日到2月18日,雲上貴州團隊隻用了6天完成貴州健康碼的全省上線。“貴州很低調。”雲上貴州黨委副書記、董事、總經理魏巍曾在公開場合表示,六天開發上線的貴州健康碼,第一批接入了國家系統,“我們當時是最簡化,也是最全”。
萬永波是雲上貴州技術開發部副總經理,帶領團隊完成貴州健康碼的開發。他告訴《中國新聞周刊》,在開發健康碼的前兩天,他與團隊成員通宵達旦地向貴州省大數據發展管理局、省政府辦公廳、衛健委和以公安廳為主的貴州省疫情防控領導小組社會防控組(簡稱“社防組”)部門溝通,收集需求。“白天去各個部門,晚上回來彙總需求,由領導統籌方案,第二天白天再去彙報”。
調研工作結束後,就是緊密鑼鼓的部署開發,既包括應用系統的部署,也包括數據收集的部署,其中,數據收集采用了最原始的方式,派人去各政府單位“駐點”。
“信息流轉非常難,我們純用人力去跑,派了很多人到大數據局、辦公廳、衛健委和公安局去駐點,拿到他們的數據之後傳回公司。”萬永波的數據處理團隊有六個人,三人分為一組,12小時工作制,兩班倒,“隻要那邊數據來了,這邊就馬上處理入庫”。
在貴州健康碼最初的後台數據庫,會根據數據的不同,将居民判定為五種狀态,在健康碼展示中分為紫、紅、橙、黃、綠五種顔色,其中紫色需要集中治療,紅色需要集中隔離觀察,橙色需要居家隔離,黃色需要定期做核酸檢測自我觀察,綠色則為無風險。萬永波介紹,數據進行初步處理後,由研發團隊将其合并入“大數據集群”,再向健康碼提供服務,而小程序的開發也在同時進行,在第五天時,這些工作基本結束,第六天小程序進行了壓力測試,第七天正式上線。
能在幾天之内将政府數據全部聚攏,得益于貴州省的數據發展戰略。2014年,“雲上貴州”注冊成立,2016年,貴州省成為首個國家大數據綜合實驗區,并成立了省大數據管理發展局,其緻力于打造“一雲一網一平台”,等到了2020年,已經擁有了打通政府各部門“數據孤島”的基礎。
大數據已成為國家戰略。在2021年12月29日,國家發展改革委等部門下發通知,加速推進國家“東數西算”工程,啟動建設全國一體化算力網絡國家樞紐節點,節點共有八個,分别是貴州、甘肅、内蒙古、甯夏,以及京津冀、長三角、成渝、粵港澳地區。西部發展大數據,有成本低的好處。記者獲悉,貴州健康碼的開發和運營,至今僅投入不及東部某省該項目投入的1/10。
一些社區對進出車輛、人員要求掃描健康碼登記行程。圖/人民視覺
數據收集邏輯
疫情陰霾下,健康碼的後台服務器是永不停歇的大腦,不斷計算着每個人的健康狀态。貴州數據寶網絡科技有限公司産品研究院院長、華東江蘇大數據交易中心副主任李可順告訴《中國新聞周刊》,每個人的健康狀态以字節的方式存儲于健康碼的服務器中,并随着防疫政策和疫情形式的改變不斷刷新,當居民出示健康碼時,隻是從後台調取這個狀态,并顯示為不同顔色的二維碼。
二維碼于20多年前由日本人發明,随着移動支付的興起,成為近幾年移動設備上最流行的編碼方式,它比傳統條形碼能存更多的信息。李可順指出,大多數城市選擇不同顔色的二維碼展示居民健康狀态,目的是為了保護隐私數據安全。“健康碼的小程序一般依靠微信或支付寶等第三方平台,隻顯示二維碼可以保證隐私數據掌握在政府手上,不易洩露”。
健康狀态經由哪些數據判定?李可順介紹,健康碼背後包括四大數據,第一是公安部門的戶籍信息;第二是自己申報的健康數據,比如體溫及當前症狀;第三是行程數據,既包括通信管理部門協調運營商提供的手機信令位置,也包括鐵路和航空交通出行數據,以判斷是否到達過風險地帶;第四是由衛健疾控部門提供的就診信息,及判斷是否與确診者有交集。
貴州省大數據管理局應用推廣處處長洪浩告訴《中國新聞周刊》,在貴州健康碼的運營過程中,主要關注重點人群,其中包括通信管理局推送來的與确診者或密切接觸着的“時空伴随”人員、社防辦排查推送的高風險地區入境人員,以及衛健系統推送的确診人員或密接和次密接。重點人群被分成高風險人員和中風險人員,獲得這些人員信息後,健康碼會響應,并與省社防辦聯動,開啟進一步的排查和處置。
防疫變得越來越精細化。過去,中高風險區域往往以城市為單位,通信管理局将有過這些風險區軌迹的人員悉數推送來,人數衆多。但現在提出了“時空伴随”概念,風險範圍進一步縮小。
“時空伴随”主要靠手機信令來定位。它的規則是,在方圓800米的範圍内,與風險人員的手機信令共同停留大約10分鐘時間,就會判定可能會有接觸,會被标記為風險人員的時空伴随人員。時空伴随人員的計算不屬于地方,由國家工信部信管局牽頭,幾大運營商根據基站和信号進行綜合定位,這需要更多的算力。最終的目的是減少了防疫擴大化,将方圓幾十甚至幾百公裡的封鎖範圍縮小至幾百米。
洪浩解釋說,時空伴随數據由運營商完成計算後,統一交給工信部,再由後者向各地統一分發。“運營商的管控精度要高一些。”他說,原則上沒有大需求的時候,工信部每天會推送時空伴随人員數據,而對于一些重點區域的時空伴随人員,“實際上是實時更新的”,比如對最近暴發疫情的陝西、天津等地,對于離開那些區域的人員,如果要進入貴州,他們的時空伴随情況就會被快速推送過來。
李可順指出,盡管目前各地數據已共享至全國統一平台,但仍是以省為單位在服務器後台分析數據。在重點區域,則不斷通過刷新,更新每個人的最新動向與健康狀态。刷新頻率和當地是否存在疫情傳播風險有關。“就像我們刷網頁,刷新是耗流量的,就得花錢,所以如果沒有疫情刷新就慢,如果在重點區域就會不斷刷新,監控人員流動可能帶來的風險。”他指出,像是上海浦東機場這類出入境人員較多的地方,每人信息的刷新應該“特别快”。
在大多數地方,除了要亮健康碼,還需要亮出行程卡。行程卡是由工信部推出,基于運營商的基站數據,判斷人14天内的行程,如果有城市存在中高風險區,城市名稱上會用星号來标識。李可順指出,實際上行程卡基于手機信号基站定位的位置數據,在健康碼的數據中是包含的,但之所以開發行程卡作為輔助工具,主要是因為健康碼沒辦法展示近十四天的行程信息。
“目的就是為了更精準地定位。”李可順說,疫情之下,健康碼給人員流動提供了保障,讓人們能安心複工和通行于公共場所。“健康狀态掌握在政府手裡,假如有感染風險,馬上就能定位到此時此刻的位置,然後再進行網格化的處理,有一整套響應機制和流程。”
各顯神通
在健康碼推行初期,各地單獨立項制作健康碼,信息采集标準也有所不同,因此難以達成互認。李可順指出,主要是各省單獨立項制作健康碼,标準和數據使用維度都不同,甚至在後台留存的居民健康狀态,也使用不同的字節去記載,這令各地相互轉碼也很困難。在同一個省,也出現了省會和其他城市用兩套健康碼,比如在陝西就并存“西安一碼通”和“陝西一碼通”。
各地用健康碼定位的方式也不一樣。不同于許多地方在進入公共場所時需掃描場所碼進行登記,貴州省的貴州健康碼隻需要打開,就會自動上傳定位。洪浩介紹,貴州健康碼設計之初,就确定以“最快通行”作為原則。盡管掃描場所碼登記,可以對人員所進入的公共場合精準确認,但亮出貴州健康碼時所發送的定位,誤差也不會超過10米範圍,盡管無法确定在哪家店,但如果出現感染者,同樣可以将周圍的密切接觸者排查出來。省去場所碼登記這一環,可增加通行速度。“如果流程太複雜的話,防控上反而容易有疏漏了,刻意追求定位的精準,反而可能帶來新的風險”。
在2020年上半年,各省健康碼數據沒有共享平台。洪浩回憶,2020年3月前後,貴州省聯系了人員來往密切的廣東和浙江,進行了數據定向交換。到了2020年下半年,國家設立了“全國一體化政務服務平台”,各省就将數據上傳至國家的平台上,推送更新内容也是每日一次。
為實現各地的健康碼信息互通互認,國家還制定了統一的數據采集标準,其中既包括數據采集的類型和維度,也包括數據字段的标識,以便數據互通。根據國家統一标準,貴州健康碼從五色變為三色。将紫色和紅色歸集為紅色,橙色保留,将黃色納入綠色進行管控。萬永波介紹,貴州健康碼上線之初到現在,已經經曆了150多次叠代升級。其中包括增加了核酸檢測預約登記功能、疫苗接種查詢功能,以及健康碼和行程卡共同顯示。
近些天來,一些地方進行全城核酸檢測時,健康碼崩潰,引發熱議,萬永波指出,與許多其他地區的健康碼不同,貴州健康碼在核酸檢測、疫苗查詢和健康碼亮碼三個方面,采用獨立的技術架構。
“據我了解,某地健康碼之所以崩潰,是因為核酸檢測系統的查詢量并不能承載健康碼查詢的并發量,導緻核酸檢測系統查不出數據了。為了避免這種情況,我們貴州健康碼使用了中間庫。”萬永波說,将核酸檢測分離為獨立的系統,檢測數據收集出來後,将會被傳遞到中間數據庫,當健康碼用戶需要查詢核酸結果,再連接到中間庫去讀取,“在這種情況下,假如核酸檢測系統宕機了,也不會影響健康碼系統的正常運行”。
萬永波還介紹,為了減少服務器宕機時的影響,他們在服務器集群采用了“高可用”形式,即将幾十台服務器建立成為集群,這其中若出現一台或多台服務器宕機,并不影響整體集群的使用。另外,他們還在聯通和移動兩個節點分别部署了健康碼後台,當一個節點出現故障,能夠迅速切換到另一個節點。根據最新的壓力測試,貴州健康碼的核酸檢測系統,每秒能完成1萬人的核酸檢測,“一分鐘就是60萬,完全能承受貴陽市的800萬人口”。
不過,盡管如今各地數據已經打通,但在核酸檢測方面,仍不能做到異地同時查詢。其中一個原因,與國家信息平台數據更新速率有關。這意味着,當你到達新的地方,此前的核酸檢測報告有可能無法同步在當地健康碼上,仍要按照當地政策重新檢測。
随着健康碼系統的愈發完善,疫情防控也将愈發精準。根據相關政策,國家要求不能以區縣以上為單位賦碼,要精準賦碼,避免“一刀切”。如今,風險區的劃分也越來越小,多以小區為主。不久前在上海,甚至将一家占地面積20多平方米的奶茶店劃為中風險地區,被成為“史上最小”,與之一牆之隔的理發店都可以正常營業。
但健康碼仍有漏洞。對于不使用智能手機的兒童和老年人,目前采用登記為同行人的方式,如果老人單獨出門,則使用打印的紙質二維碼。李可順說,目前業内正在研究公路交通中以車為主的通行碼,加強來自風險地區的道路管控。另外,廣西等地,已經推出不需要聯網即可查詢的健康碼,“類似于緩存機制。”他說,健康碼小程序會有個定期輪詢個人健康碼狀态,存在手機,聯網時查後台實時健康碼,斷網時直接提取緩存的健康碼。
李可順說,未來健康碼還将可能富集更多功能,比如綁定銀行卡進行支付,以及在醫院就診。等到疫情過去,健康碼的使命并不會結束。“我們做了這麼多底層數據的工作,肯定是有用的,有價值的。”他說,隻要維持核心的數據狀态,持續将各方面數據打通,就能實時監控每個人的疫情狀态,如果沒有疫情,這些新的機制和經驗,也可用在其他應急事件上,“比如搶險救災,再比如追蹤資産和逃犯”。
,