毋庸置疑,產業生態環境正在加速構成,新的管理模式和新的商業模式與此共生,社會的管理水平和管理效率正在得到很大提升。
目前,我國已經出台了一系列促進大數據產業發展的政策,其中包括“十二五”國家戰略性新興產業發展規劃、物聯網“十二五”發展產業規劃和國家發改委關於加強和完善國家電子政務工程的意見等。這些政策和規劃的陸續推出,表明了我國政府對大數據產業高度重視,發展戰略目標清晰明確。這一狀況使我國自主創新的領袖企業迎來了大好發展機遇。由此,如何讓大數據在政府信息化工程中發揮更大的價值成為當前的熱點話題。
“大數據應該是一種重要的戰略資源,要通過建立數據資源體系讓這種戰略資源在政府信息化中發揮更重要的作用,讓政府信息化工程成為各級領導的第二工作。”在清華同方大數據產業研發與工程中心數據資源應用事業部總經理孫哲看來,如何把大數據從過去的數據形態變成一個政府有效管理應用的戰略資源成為目前重要的任務。
社會治理工程是一個系統性工程,牽扯到方方面面的工作。繁雜之下如何建立數據資源體系呢?在孫哲看來,圍繞一項又一項的政府工作目標,應該有一個全局的工作指標體系。要通過業務目標的逐級分解實現整體的管理目標,而這些業務目標和戰略目標都應該有相應的數據的支撐。
以往,經過十多年的政府信息化建設,各個部門的信息化平台都是獨成體系,各部門的數據既沒有統一的收集標准,也沒有互通互用。比如交通局的和氣象局的、統計局的和社保局的等等互不通用,更談不上數據資源整合。很顯然,“數據出多門”導致了一個個“數據孤島”。這種狀況嚴重違背了政府信息化的初衷。
究其原因,一是以往的各部門信息中心基本上都是一個服務性的機構,主要職責是把業務部門的網絡管好,病毒殺干淨。二是不同的業務部門都有自己獨立的業務體系,報送的只是自己部門的數據,不再向更高一級的領導部門報送。三是由於這些數據產生於獨立的業務系統,數據和數據之間、不同業務體系之間沒有相互的關聯性。
而這種沒有相關性的數據對管理決策者來說,是扔了可惜,不用是垃圾。用又不知道從哪裡入手,想要的數據也說不清楚,報上來的數據散亂看不懂。這就是過去的業務體系產生的數據和領導決策需要的數據不銜接,中間有一個層級差,不能夠很好地支撐管理和決策的一個非常明確的現狀。
孫哲認為,如果用數據資源體系的理念輔助信息中心,在領導和業務部門之間構造一個數據資源體系,那麼由信息中心採集所有業務體系所報送的數據,通過同方的數據資源體系進行加工梳理,把今天的數據和歷史數據對接,把現在的數據和領導關心的指標關聯起來,這樣就形成了非常適合管理和決策使用的數據資源體系。
很顯然,大數據體系應該從各個部門的信息中心或者數據中心入手,通過數據資源體系支撐過去在不同行業中對管理和決策支持的空白。並且,用同方的大數據技術把面向業務的數據轉換成了面向管理的數據的同時,信息中心的職能也進行了很大的提升,大數據成為一種有靈性的智能戰略資源。
在業界看來,同方的大數據技術具有很大的優勢。孫哲認為,這些技術優勢體現在很多方面。首先是應用頂層設計的方法進行信息化建設的方法論。這個方法論和以往IT公司做政務系統有很大的不同。“我們第一步不是以往的從業務處理的需求入手,我們是抓管理部門的核心目標,梳理創建機構的核心目標。比如,發改委的核心目標是什麼,這個目標的實現需要有幾個目標來支撐,子目標需要哪些子子目標支撐。每一個目標的結點都有信息系統支撐,從頂層到業務一塊一塊部署。”
數據質量是企業和政府普遍關心的問題,數據質量的高低決定數據的可信度。為此,同方非常重視“元數據”的收集。乍一聽起來,“元數據”好像就是“最早的根源數據”,實際上這是清華同方的一項獨門技術。
以統計局的統計數據為例,以往公布的統計數據經常遭到人們的質疑,“被就業”、“被住房”等等現象就是數據質量為人所詬病。其主要原因就是由於統計口徑和統計平台的不同造成的。如何解決數據質量的問題?清華同方用元數據這種技術架構把數據從源頭質量上進行控制。同方的數據統計平台可以讓數據一進到系統之后就不被人為干擾。比如在數據填報的時候有相應的審核工具,用技術手段確保數據的填報過程,同時在描述數據的時候,盡可能的把一組數據脫離系統。
一本《大數據》讓很多人懷揣了“數據治國”的夢想,我們的各個行業和領域已經逐步開始意識到數據的價值和應用意義。在這樣的背景和需求驅動下,將會有越來越多的人關注數據資源,這也是同方很多年前就開始研究的領域,希望若干年后會有更多志同道合的業內伙伴一起實現數據治國的夢想而共同努力推進。