海量數據,博雜紛亂。人類對未來的把握和勝算,就在于數據被有效存儲的同時又在一旦的需要中迅速激活。小數據時代,數據越大越有價值;大數據時代,數據越大,價值越小。人類未來對塊數據遠端的方向感認知就是其對大數據**方向把握的核心要義。在拯救與逍遙的哲思中,我們探索用生命科學的方法解決數據擁堵問題,以數據社會學的思維打開沉淀的數據寶藏。激活數據學就是一個在塊數據的神經元調度系統下的一種減量化的數據存儲和利用的數據觀和方法論。無人駕駛、城市大腦和模塊政府等是激活數據學*重要的應用場景,它讓龐大數據資源通過計算和交互真正轉化為智慧和財富。而數據驅動、計算驅動和場景驅動下云腦時代的到來,激蕩著我們對于未來美好生活的所有憧憬和渴望。
本書提出的激活數據學是以充分發揮人機群體智能為核心,綜合運用數據科學、生命科學和社會學提出的海量數據存儲、處理的解決方案。激活數據學將顛覆傳統的思維方式,為大數據領域的探索研究提供一個嶄新的視角。
激活數據學對類腦計算領域的研究,將推動高效率、低功耗的高性能計算技術的發展,高性能計算技術將為人工智能的推廣與應用帶來新一輪的春天。激活數據學基于“塊數據”的思維觀,為數據跨領域的共享開放提供了新的數據觀和現實可行的路徑,將**人工智能突破“條數據”領域,向更廣泛的領域釋放價值。
大數據戰略重點實驗室成立于2015年4月,是貴陽市人民政府和北京市科學技術委員會共建的跨學科、專業性、國際化、開放型研究平臺,是中國大數據發展新型高端智庫。
大數據戰略重點實驗室依托北京國際城市發展研究院和貴州大學貴陽創新驅動發展戰略研究院建立了大數據戰略重點實驗室北京研發中心和貴陽研發中心,建設了貴州省塊數據理論與應用創新研究基地、貴州省城市空間決策大數據應用創新研究基地和貴州省文化大數據創新研究基地,并建立了中央黨校研究基地、全國科學技術名詞審定委員會研究基地、浙江大學研究基地、中國政法大學研究基地和中國(綿陽)科技城研究基地,構建了“兩中心、三平臺、五基地”的研究新體系和區域協同創新新格局。
大數據戰略重點實驗室主編的《塊數據:大數據時代真正到來的標志》《塊數據2.0:大數據時代的范式革命》《塊數據3.0:秩序互聯網與主權區塊鏈》是大數據發展理論和實踐的重大創新成果,在國內外具有較大影響。
大數據時代的解決方案
本書探討的主題是大數據時代激活數據學的提出、運行機理及場景應用。激活數據學是以充分發揮人機群體智能為核心,綜合運用數據科學、生命科學和社會科學提出的海量數據存儲、處理的解決方案。激活數據學將確立一個新的觀察人類智能和機器智能的視角,引導人們重新審視數據無限膨脹可能造成的人類認知障礙,重新思考維持一個健康、安全和有效的數字社會的根本辦法,建立與人類智能復雜性同步的人工智能系統,開啟用復雜性系統思維認識未來世界和改造未來世界之旅。
大數據時代面臨的問題與挑戰
在人類文明的伊始,人與人的第一聲交流即意味著“連接”的開始。語言使人與人連接,并促使用于記載事物的文字、數字符號產生,這樣的“連接”便產生了“數據”,并演化為人類文明最初的信息與知識。在漫長的農耕文明時代,“連接”主要以語言溝通和書面文字溝通的形式存在。進入工業文明時代,“連接”開始通過無線電臺、電報、電視的形式存在,但這樣的“連接”產生的信息往往是單向性且缺乏互動的。互聯網時代,人和人開始通過網絡進行復雜交錯的互動連接。社交網站、電子郵件、搜索引擎、聊天工具……人類建立連接的方式趨于多樣化、多維化,人類社會產生的數據也因而大量積累。與此同時,數據的價值
越來越受到人們的重視。數據深刻作用于政治、經濟、文化等領域,帶來更多的創新機會,從生產、生活到科研,一個大數據時代正在開啟。
在美麗的貴州省黔南州布依族苗族自治州平塘縣,被稱為“中國天眼”的世界上最大的單口徑射電望遠鏡——FAST(500 米口徑球面射電望遠鏡)已于2016 年9 月25 日落成啟用。FAST的計算速度需達到每秒200 萬億次以上,存儲容量需達到10PBa 以上。這一世界級的工程將幫助人們捕捉到更多來自宇宙的信息,它的背后是“天文級”的海量數據存儲和復雜的計算。隨著時間的推移、科學任務的深入,以及數據的大量采集,未來對計算速度和存儲容量的需求將爆炸式增長,數據量和計算量都將“大得驚人”。
數據是沒有邊際的,而計算力、存儲力始終存在物理極限。在過去很長一段時間里,科技日新月異的發展依賴摩爾定律。當摩爾定律逐漸失效時,數據的膨脹是否將引發世界性的數字爆炸?人們寄希望于量子計算,量子計算將有可能使計算機的計算能力遠遠超過今天的計算機,但仍然存在很多障礙。如何長時間地保持足夠多的量子比特的量子相干性,同時又能夠在這個時間段之內做出足夠多的具有超高精度的量子邏輯操作,提高所需量子裝置的準確性,還面臨許多困難。
人類作為自然界中最偉大的智能體已經進化了上百萬年,人類所具有的智能是大自然賦予人類最高級的禮物。今后,人類智能仍將是人造系統模仿和研究的對象。人類未來對數據的處理,要更多地模仿人腦對數據的處理方式,人腦就是世界上最好的“量子計算機”。
目前人工智能的發展水平可以用三個維度來描述,即強度、擴展性和能力。強度是指人工智能系統的智能化程度,擴展性是指人工智能系統可以解決的問題的范圍,能力是指人工智能系統所能提供的平均解決方案的質量。雖然我們已經在專用人工智能領域取得了突破性進展,但目前人工智能水平仍然停留在“有智能沒智慧,有智商沒情商,會計算不會算計,有專才無通才”的水平。其特點是能力單一,只能在某個特定領域內發揮作用。在人工智能2.0 時代,我們期待一個新的框架:首先,在人的邏輯層次可辯明;其次,可以處理大規模數據;最后,可以基于一小組標記數據進行學習。我們認為,將數據驅動的機器學習方法與知識引導方法相結合,將為人工智能的未來推開一扇新的大門。
探索解決之道—激活數據學
受人腦處理數據方式的啟發,本書提出了一種新的處理海量數據的一般性框架——激活數據學。激活數據學從復雜理論出發,將產生智能所依賴的數據、軟件硬件環境、交互規則等視作一個具有“簡單性、局部性、全局性、內聚力、動態性”的開放復雜系統,智能產生的過程即開放復雜系統中各個具有局部目標和行為的自主體通過自主行為及動態環境相互作用達到整體的全局目標所涌現的群體智能,這種涌現的群體智能能夠高效求解問題。
激活數據學中采用塊數據模型作為數據模型。塊數據把各種分散的點數據和分割的條數據匯聚在一個特定平臺上并使之發生持續的聚合效應。塊數據的聚合打破了傳統信息不對稱和物理區域、行業領域對數據流動的限制,高度關聯的各類數據可以在沒有任何障礙和限制的條件下自由流動、相互作用,為智能的產生創造了條件。
激活數據學的核心是將人類認知能力與計算機快速運算和海量存儲的能力結合起來。一方面,提高智能系統的置信度,避免人工智能技術的局限性所造成的風險甚至危害;另一方面,建立人類參與的混合增強智能,將海量數據通過人機混合增強智能實現最佳釋放。這種形態是人工智能可行的、重要的成長模式。