復旦大學鄭磊教授:我們需要開放有“溫度”的數(shù)據(jù)
編者按:本文來自微信公眾號“騰云”(ID:tenyun700),作者:鄭磊(復旦大學數(shù)字與移動治理實驗室主任,國際關(guān)系與公共事務(wù)學院教授),36氪經(jīng)授權(quán)發(fā)布。
“如何在保證足夠開放的同時,又不傷害到個體,這是一門藝術(shù),這個火候要把握得準?!?/p>
自2009年,隨著《透明和開放的政府》、《開放政府令》、《電子化政府執(zhí)行策略》等一系列政策法規(guī)的出臺,美國成為全球首個推廣開放政府數(shù)據(jù)的國家,并在全球范圍內(nèi)掀起了一波開放政府數(shù)據(jù)的浪潮。
我國緊隨其后。2012年,上海市政府數(shù)據(jù)服務(wù)網(wǎng)上線,成為全國首個公共數(shù)據(jù)開放平臺,北京、湛江、無錫等地也逐步開始建設(shè)自己的開放網(wǎng)站。
如果你對政府數(shù)據(jù)開放還感到陌生,那不妨先向你舉一個例子。
新冠疫情期間,你一定瀏覽過各大互聯(lián)網(wǎng)平臺發(fā)布的疫情地圖,這些制作精美、數(shù)據(jù)及時更新的地圖,其底層數(shù)據(jù)來源,其實正是各省市衛(wèi)計委發(fā)布或開放的疫情數(shù)據(jù)。這些來自政府的數(shù)據(jù),在經(jīng)過企業(yè)、社會機構(gòu)的加工后,借助平臺的力量,以可視化的方式傳遞到廣大用戶手中,讓人們能夠在第一時間讀懂疫情發(fā)展的最新狀況。
因此,雖然我們將這一概念稱作“政府數(shù)據(jù)開放”,但與之相關(guān)的絕不只有政府。
在數(shù)據(jù)已經(jīng)成為新的生產(chǎn)要素的時代里,政府數(shù)據(jù)開放是整個社會數(shù)據(jù)流通必不可少的一環(huán),與企業(yè)、公眾密切相關(guān),也直接決定了“新基建”等地基的穩(wěn)固與否。而另一方面,與商業(yè)數(shù)據(jù)的流通、交易相似,政府數(shù)據(jù)開放同樣面臨著個人隱私保護與數(shù)據(jù)開放之間的矛盾與平衡問題,如何“把握火候”至關(guān)重要。
復旦大學數(shù)字與移動治理實驗室主任、國際關(guān)系與公共事務(wù)學院教授鄭磊教授從10年前就開始關(guān)注相關(guān)領(lǐng)域研究,見證了中國政府數(shù)據(jù)開放從萌芽、快速發(fā)展到在某些方面已處于國際先進水平的不同階段。他的團隊每年定期發(fā)布“中國開放數(shù)林指數(shù)”,反映我國政府數(shù)據(jù)開放生態(tài)體系,為未來提供指引。
今年7月22日發(fā)布的“2020中國開放數(shù)林指數(shù)”和《2020中國地方政府數(shù)據(jù)開放報告》指出,截至2020年4月底,我國已有130個省級、副省級和地級政府上線了數(shù)據(jù)開放平臺,其中省級平臺17個,副省級和地級平臺113個。與2019年下半年相比,新增1個省級平臺和27個地級(含副省級)平臺。
我國地方政府數(shù)據(jù)開放平臺上線情況。圖表來源:中國地方政府數(shù)據(jù)開放報告(2020年上半年)
《報告》也指出,我國54.83%的省級行政區(qū)(不包括港澳臺)、73.33%的副省級和32.08%的地級行政區(qū)已推出了政府數(shù)據(jù)開放平臺。
從2017年的20個,到2018年的56個,到2019年的102個,再到2020上半年的130個,這意味著政府數(shù)據(jù)開放平臺日漸成為地方數(shù)字政府建設(shè)和公共數(shù)據(jù)治理的標配。
各地平臺上線時間的地理空間分布(省級)。圖表來源:中國地方政府數(shù)據(jù)開放報告(2020年上半年)
隨著政府數(shù)據(jù)開放水平的快速提升,以及社會整體數(shù)字化水平的進步,“開放數(shù)林”指數(shù)的評判標準也一直在“進化”。用鄭磊教授的話說,這份報告要比實際發(fā)展水平“快半步”,如此才能起到指引作用。
關(guān)于政府數(shù)據(jù)開放,以及如何開放“有溫度的數(shù)據(jù)”,騰云獨家采訪了鄭磊教授,請他分享了他的思考。
騰云:您是從什么時候開始關(guān)注數(shù)據(jù)開放領(lǐng)域研究的?
▌鄭磊:我在讀博期間就看到過相關(guān)的國外論文和理論文獻,開始關(guān)注各國動態(tài),但真正開始在國內(nèi)開展這方面的實證研究大概是在2012年。2012年,我國在上海推出了第一個地方政府數(shù)據(jù)開放平臺,我也有機會把上海作為第一個案例進行研究。隨后,全國上線的平臺越來越多,到現(xiàn)在全國已經(jīng)有130多個平臺了。
騰云:政府數(shù)據(jù)開放對我們普通人的生活有什么影響?
▌鄭磊:首先要明確的一點是,政府開放數(shù)據(jù)和我們傳統(tǒng)認知中的政府信息公開是有區(qū)別的。
第一個差別是開放數(shù)據(jù)要把數(shù)據(jù)開放到底層的、原始的數(shù)據(jù),而傳統(tǒng)的政府信息公開可以只公開經(jīng)過加工和分析的信息,甚至是一些文件。第二個區(qū)別是政府信息公開主要的目的是保障公眾的知情權(quán),而開放數(shù)據(jù)的主要目的是推動政府數(shù)據(jù)的再利用。由于政府在履行行政職責的過程中采集了大量的數(shù)據(jù),這些數(shù)據(jù)原來都放在政府的后臺只能自己用,而現(xiàn)在這些數(shù)據(jù)不僅政府自己可以用,也要開放給社會來進行開發(fā)利用,推動大數(shù)據(jù)時代的到來。
所以開放政府數(shù)據(jù)就是要促進公眾對政府數(shù)據(jù)的利用,讓社會機構(gòu)、企業(yè)來用,把數(shù)據(jù)開發(fā)成應(yīng)用,或進行可視化呈現(xiàn),最終服務(wù)于普通的公眾。
數(shù)據(jù)開放涉及到三方,第一是開放數(shù)據(jù)的提供者,第二是數(shù)據(jù)的利用者,第三是受益者或被服務(wù)者,也就是普通的老百姓。例如,新冠疫情期間,老百姓可以從各大平臺包括騰訊看點獲取關(guān)于疫情的最新數(shù)據(jù),了解自己所在區(qū)域的疫情狀況,這都是政府開放數(shù)據(jù)后被企業(yè)加以利用的結(jié)果,而公眾是數(shù)據(jù)開放的最終獲益者。
騰訊新聞推出的“新型冠狀病毒肺炎疫情實時追蹤”,這是截至2020年11月6日的新冠肺炎“現(xiàn)有確診”地圖。
騰云:政府數(shù)據(jù)開放和企業(yè)數(shù)據(jù)的使用流通有哪些不一樣?
▌鄭磊:政府采集數(shù)據(jù)的主要目的是為管理社會服務(wù)、為公共利益服務(wù),因此政府數(shù)據(jù)不僅政府自己可以拿來用,在保障國家秘密、商業(yè)秘密和個人隱私的前提下,也應(yīng)該開放給社會,讓企業(yè)和社會對這些數(shù)據(jù)進行分析利用,釋放這些數(shù)據(jù)的價值。
從公共價值的視角來說,政府開放數(shù)據(jù)是為了發(fā)揮政府數(shù)據(jù)更大的社會和經(jīng)濟價值。比如智慧城市建設(shè),政府開放的數(shù)據(jù)提供了一種新的要素,可以推動數(shù)字經(jīng)濟、數(shù)字社會的發(fā)展,帶動城市發(fā)展。政府數(shù)據(jù)更像是一種城市的數(shù)字基礎(chǔ)設(shè)施,類似政府建的馬路、高速、水電煤這種物理的基礎(chǔ)設(shè)施一樣,能夠讓整個城市和社會在數(shù)字的基礎(chǔ)設(shè)施上發(fā)展。
另外需要強調(diào)的是,商業(yè)數(shù)據(jù)是可以通過數(shù)據(jù)交易所進行交易的,A公司賣給B公司,B公司再賣給C公司,但政府數(shù)據(jù)開放原則上是不能交易的,因為它是公益性質(zhì)的,它是政府通過公共財政的錢采集的,老百姓已經(jīng)通過納稅付過錢了。理論上說,這些數(shù)據(jù)已經(jīng)是公共資產(chǎn),也就是全社會資源了,不可以再向公眾收費。
騰云:那么在政府開放數(shù)據(jù)的過程中,企業(yè)能扮演什么樣的角色?
▌鄭磊:企業(yè)現(xiàn)在能做的主要是兩件事情,一個是在數(shù)據(jù)開放前,主動提出數(shù)據(jù)需求,與政府數(shù)據(jù)的提供部門對接溝通;第二就是在數(shù)據(jù)開放后,把數(shù)據(jù)利用好,發(fā)揮出數(shù)據(jù)的社會和經(jīng)濟價值。
政府在開放數(shù)據(jù)的過程中,很多時候并不知道社會到底需要什么數(shù)據(jù),所以供需雙方的溝通就變得非常重要。數(shù)據(jù)開放其實是一個供需雙方的問題,供應(yīng)方是政府,需求方是企業(yè)與社會,也包括個人、研究機構(gòu)等。政府首先需要知道大家的數(shù)據(jù)需求,然后才能根據(jù)需求來判斷這些數(shù)據(jù)是否可以開放,以及在開放過程中有哪些需要注意的問題和需要防范的風險。
在數(shù)據(jù)開放出來以后,企業(yè)就要把數(shù)據(jù)用好,真正創(chuàng)造價值、服務(wù)于公眾,這樣政府就會對開放數(shù)據(jù)更有信心,也就愿意開放更多更好的數(shù)據(jù),最終形成一個良性的閉環(huán)、正向的循環(huán)。
另一方面,當濫用數(shù)據(jù)的技術(shù)越來越強大,我們“防”的技術(shù)也要跟上。政府對于那些在不危及個人隱私和數(shù)據(jù)安全的前提下,能很好地利用數(shù)據(jù)的新技術(shù)新方法有很強的需求。所以,我們的防御能力要跟上,當然也要把握好度,防過頭了便也無法釋放數(shù)據(jù)的價值。
總的來說,為了促成供需之間有價值、可持續(xù)的合作,一是我們要通過立法來保障數(shù)據(jù)安全,二是要建立有效的管理機制,三是要通過技術(shù)的不斷進步來保證數(shù)據(jù)流通的安全高效。政策、管理和技術(shù)三者都不可或缺。
騰云:疫情之下,整個社會的數(shù)字化水平得到了長遠提升,政府數(shù)據(jù)開放水平有較大進步嗎?具體體現(xiàn)在哪里?
▌鄭磊:疫情下的數(shù)據(jù)開放有很大的進步。比如有很多地方把疫情數(shù)據(jù)以可機讀數(shù)據(jù)集的形式在平臺上直接開放,數(shù)據(jù)利用者下載后就可以直接利用,非常方便。以往,社會機構(gòu)在把政府數(shù)據(jù)制作成更容易讓受眾使用的形式時,往往要在采集和整理數(shù)據(jù)上花費大量時間。這些問題在這次疫情數(shù)據(jù)的開放上都有了明顯進步。
另一方面,我們也發(fā)現(xiàn),開放數(shù)據(jù)的質(zhì)量、種類、格式標準等仍有很大的提升空間。我經(jīng)常做的比喻就是“巧婦難為無米或者壞米之炊”。社會上的數(shù)據(jù)利用者更多的是“巧婦”的角色,現(xiàn)在“米”已經(jīng)有了,但這個“米”還可以更多更好。
整體來說,和其他許多行業(yè)一樣,疫情“倒逼”了數(shù)字化發(fā)展,也對開放數(shù)據(jù)的水平提出了更高的要求。
這也是我們?yōu)槭裁催B續(xù)三年發(fā)布《中國地方政府開放數(shù)據(jù)指數(shù)》的原因,就是希望以此給地方政府一個參照系,同時提供一些建議和方向,今年的報告中,我們也已經(jīng)將各地疫情期間的數(shù)據(jù)開放情況包含進去了。
畢竟數(shù)據(jù)開放還是一件比較新的事,大家對于具體應(yīng)該怎么做還不是特別清楚,所以我們可以通過評估和一些具體的指標要求來助力引導。
騰云:那我們來聊聊這份報告吧,為什么報告中用了“數(shù)林”進行命名?
▌鄭磊:樹林是一種生態(tài)的比喻,我們用它來形容中國的政府數(shù)據(jù)開放生態(tài)體系。整個國家的開放數(shù)據(jù)就像一個數(shù)據(jù)森林,每一個地方就是一棵樹木,當每一棵地方的樹木都成長了,這些樹木再枝杈相連、根系相通,就會形成一個全國的數(shù)據(jù)開放的森林。所以我們這個指數(shù)就叫“開放數(shù)林指數(shù)”,通過觀察哪里的數(shù)木長得更高、更粗、哪里的數(shù)葉更茂密,來判斷這個地方的開放數(shù)林的發(fā)展水平。
對于一個生態(tài)體系來說,絕不是只靠某一方就能做成的,還要靠整個生態(tài)系統(tǒng)中的各方的共同努力。用樹林來做比喻就會很形象,法律規(guī)范、組織機制等就像這棵樹的“數(shù)根”;基礎(chǔ)之上就是“數(shù)干”,那就是平臺;而數(shù)干之上又有數(shù)葉,數(shù)葉就是數(shù)據(jù);最后,數(shù)據(jù)開放還要有結(jié)果。
騰云:隨著各地數(shù)據(jù)開放水平的提升,這個報告的評判標準發(fā)生了哪些變化?
▌鄭磊:從前兩年開始,我們的指標就不再強調(diào)數(shù)據(jù)開放的數(shù)量,而更加重視數(shù)據(jù)的質(zhì)量,而且要求也在一步步提升。我們每年都會專門邀請該領(lǐng)域的專家討論,根據(jù)當年的情況再對評估指標進行調(diào)整。
總體來說,我們的指數(shù)肯定還會不斷提高要求和標準,這樣才能起到不斷的引導作用。我們的指標要做到比現(xiàn)在各地的實際發(fā)展水平“領(lǐng)先半步”,既不能太高也不能太低,使各地能夠“跳一跳夠得著”,否則就不能真正發(fā)揮指引發(fā)展的作用了。
當然,評估指標的制定不是“拍腦袋”就能決定的,這個指標體系的設(shè)計是以數(shù)據(jù)利用者和普通公眾的視角為基本出發(fā)點的,從需求出發(fā)、從問題出發(fā),把人作為出發(fā)點和落腳點。
2020中國開放數(shù)林指數(shù)評估指標體系
騰云:這個變化放在今年,具體體現(xiàn)在哪里?
今年評估指標體系的重點,是從基礎(chǔ)準備進一步向?qū)嶋H成效傾斜。因為我國地方政府數(shù)據(jù)開放已經(jīng)發(fā)展到了一個更成熟的階段,不能再只看一個地方的“準備”情況了,而要更多看到底帶來了哪些成果。
另外,今年的評估指標體系中還新增了“平臺互聯(lián)互通”和“包容性功能”指標。之所以要強調(diào)互聯(lián)互通,是因為平臺之間不是孤立的,才能進一步促成各個地方平臺的互聯(lián)互通,才能構(gòu)建出一個森林。
而包容性指的更多是考慮到一些弱勢群體,比如老年人、殘障人士等,讓他們也能享受到數(shù)據(jù)開放的紅利。我們不能僅針對強者,還要對一些數(shù)據(jù)利用能力比較弱的人提供幫助,讓數(shù)據(jù)開放的受惠面更廣。
騰云:無論是企業(yè)數(shù)據(jù)還是政府數(shù)據(jù),當我們談到與數(shù)據(jù)流通有關(guān)的話題時,一個無法回避的話題就是個人隱私的問題。您如何看待這個問題?
▌鄭磊:數(shù)據(jù)的開放利用和保護之間要找到平衡點,這個平衡點就是我們所提倡的“溫度”,我們需要數(shù)據(jù),更需要有溫度的數(shù)據(jù)。對于數(shù)據(jù)的流動,我們不能一味圖快,而忘記它的風險,我們還是要走得穩(wěn)、走得安全。
比如當健康碼要“進化”成文明碼的時候,馬上就引起了公眾爭議;再比如最近大家熱議的外賣騎手和算法的問題,也引發(fā)了全民對算法公平的討論。因此,數(shù)字化時代要充分考慮到技術(shù)利弊兩面,不僅是隱私保護問題,還有算法公平和透明等問題。這是這個時代非常重要的問題。
騰云:說到底還是技術(shù)和人的關(guān)系問題。
▌鄭磊:對。我們前些年考慮的更多是我們的數(shù)字化程度還不夠高,要快速趕上數(shù)字時代、實現(xiàn)數(shù)字化轉(zhuǎn)型。但從去年以來,我們已經(jīng)開始更多地強調(diào)“溫度”的概念,我們不只要追求速度,更要追求有溫度的發(fā)展。
人工智能時代,我認為,人與技術(shù)的關(guān)系、人的尊嚴、人的勞動權(quán)利等問題,在接下來的幾年里會受到越來越多的關(guān)注。
所以只有在評價維度中加入帶有“溫度”的指標,我們才能夠賦予技術(shù)以人性化,讓人有感受度、有獲得感。當我們用溫度這一標準來評測數(shù)據(jù)的時候,我們便會追問,如此開放和使用數(shù)據(jù),會“燙手”嗎?它的“溫度”是合適的嗎?這能讓我們更好的理解,技術(shù)的落腳點還是要以人為本。
還是以這次疫情為例。疫情期間,很多地方都會公布病例的信息,但這些公開的患者信息是要經(jīng)過脫敏的,它既要讓公眾對于疫情的發(fā)展有充分的知情,又不能讓公眾識別出具體的某個人,進而侵犯個人隱私、引發(fā)針對個人的歧視,這就要體現(xiàn)出對“度”的把握。
如何在保證足夠開放的同時,又不傷害到個體,這是一門藝術(shù),這個火候要把握得準。如果數(shù)據(jù)的“溫度”太低,那么冰冷的數(shù)據(jù)便無法用來產(chǎn)生能量。如果“數(shù)據(jù)”的溫度太高,它又會“燙傷”人了。所以我們需要一個讓人感到最舒服的溫度。
騰云:與國外相比,我國數(shù)據(jù)開放有什么特點?
▌鄭磊:這兩年我們的進步很大,不斷接近國際水平。我們現(xiàn)在有些地方的平臺做得很好,比如說像上海、浙江、深圳、貴陽這些地方跟國際上的差距已經(jīng)越來越小了,甚至在某些單項指標上,我們可以說是達到了國際一流水平。目前國家級平臺還沒有上線,一旦上線后,便能進一步彌合我國和國際上的差距。
在發(fā)展過程中,各地也在不斷進行一些因地制宜的、符合中國國情的探索。比如,在“受限開放”或者說“有條件開放”的探索上,我們在國際上是比較獨特的。也就是說,我們在完全開放跟絕對不能開放之間找到了一個中間地帶,通過簽訂協(xié)議對數(shù)據(jù)的使用過程進行一些約束。