中國工程院院士李德毅:聚類成大數(shù)據(jù)認知突破口
發(fā)布時間:2015-04-14【賽迪網(wǎng)訊】4月9日,由工業(yè)和信息化部,、深圳市人民政府主辦,,中國電子信息產(chǎn)業(yè)發(fā)展研究院、中國電子報社協(xié)辦的新一代信息技術產(chǎn)業(yè)發(fā)展高峰論壇在深圳會展中心舉行,。中國工程院院士李德毅在發(fā)言中指出,,大數(shù)據(jù)作為網(wǎng)絡時代的一種客觀存在,是網(wǎng)絡時代人類社會的重要資產(chǎn),,盡管目前對于大數(shù)據(jù)的認知存在挑戰(zhàn),,但聚類將會成為大數(shù)據(jù)認知的突破口。
大數(shù)據(jù)用傳統(tǒng)工具
難以認知
李德毅表示,,大數(shù)據(jù)標志著一個新時代的到來,,這個時代的特征不只是追求豐富的物質資源,也不只是無所不在的互聯(lián)網(wǎng)帶來的方便的多樣化信息服務,,同時還包含區(qū)別于物質的數(shù)據(jù)資源的價值發(fā)現(xiàn)和價值轉換,,以及由大數(shù)據(jù)帶來的精神和文化方面的嶄新現(xiàn)象。
李德毅進一步指出,,大數(shù)據(jù)來源于人類的測量,、記錄和分析世界的渴望和無盡的追求。隨著信息技術,,尤其是傳感器,、通信、計算機和互聯(lián)網(wǎng)技術的迅猛發(fā)展和廣泛應用,,人類獲取數(shù)據(jù)的手段越來越多,,速度大大加快、成本急劇降低,,層次和尺度更為精細,,揭示自然現(xiàn)象和社會現(xiàn)象更加深刻,人聯(lián)網(wǎng)和物聯(lián)網(wǎng)又使得人人物物都成為數(shù)據(jù)源,,這樣一來,,大數(shù)據(jù)將成為網(wǎng)絡時代人類社會的重要資產(chǎn)。
在李德毅看來,,大數(shù)據(jù)本身既不是科學,,也不是技術。它反映的是網(wǎng)絡時代的一種客觀存在,,各行各業(yè)的大數(shù)據(jù),,規(guī)模從TB到PB到EB到ZB,,都是以3個數(shù)量級的階梯迅速增長,是用傳統(tǒng)工具難以認知的,、具有更大挑戰(zhàn)的數(shù)據(jù),。
在數(shù)據(jù)密集型的網(wǎng)絡時代,任何傳統(tǒng)的“學科”或“行業(yè)”的公理,、原理和定理組合而成的語境,,遇到“互聯(lián)網(wǎng)+”的挑戰(zhàn),這樣一來,,“學科”和“行業(yè)”拓展成為交叉學科或者“四不像”行業(yè),,是“大數(shù)據(jù),小模型,、小定律,、交叉學科”的時代,模型和程序要圍繞數(shù)據(jù)轉,。
李德毅認為,,大數(shù)據(jù)時代數(shù)據(jù)量巨大、價值密度低,,實時在線,,多源異構、混雜敏捷,、呈現(xiàn)復雜多樣的數(shù)據(jù)集合,需要跨媒體關聯(lián),,難以在單機計算架構上聚類,,必須依托云計算,進行并行/分布式處理,。
聚類成為
發(fā)現(xiàn)大數(shù)據(jù)價值第一步
李德毅在演講中指出,,盡管大數(shù)據(jù)在認知上具有挑戰(zhàn)性,但是聚類將會成為大數(shù)據(jù)認知的突破口,?!拔镆灶惥郏艘匀悍帧?,是人類幾千年來認識世界和社會的基本能力,,是從大數(shù)據(jù)中發(fā)現(xiàn)價值必須面對的一個普遍性、基礎性問題,,是認知科學作為“學科的學科”要解決的首要問題,。認知科學要有所突破,首先要在大數(shù)據(jù)聚類上突破,。
無論是政治,、經(jīng)濟,、文學、歷史,、社會,、文化,還是數(shù)理,、化工,、醫(yī)農(nóng)、交通,、地理,,各行各業(yè)的大數(shù)據(jù),或宏觀或微觀的任何價值發(fā)現(xiàn),,無不借助于大數(shù)據(jù)聚類分析的結果,。因此,數(shù)據(jù)分析和挖掘的首要問題是聚類,,這種聚類是跨學科,、跨領域、跨媒體的,。大數(shù)據(jù)聚類是數(shù)據(jù)密集型科學的基礎性,、普遍性問題。
李德毅以汽車保險為例,,物聯(lián)網(wǎng)時代,,當汽車成為輪式機器人,成為大數(shù)據(jù)發(fā)生器以后,,就是一個大數(shù)據(jù)發(fā)生體,。每一次駕駛,每一次維修,,每一次行駛,,甚至每一次剎車,都會記錄在案,。利用大數(shù)據(jù)聚類,,保險公司可對一個車況好、駕駛習慣好,、常走線路事故率低,、不勤開車的特定客戶,給予更大的優(yōu)惠,,而對風險太高的客戶,,即使他報高價,也有可能拒絕,總之能夠給出包括保險費支付方式在內的個性化解決方案,,這就顛覆了保險公司的傳統(tǒng)商業(yè)模式,。這就是大數(shù)據(jù)聚類成為保險公司核心競爭力的原因,而大數(shù)據(jù)聚類也將成為很多行業(yè)的核心競爭力,。
李德毅同時提醒,,通過大數(shù)據(jù)聚類即時發(fā)現(xiàn)價值,要充分認識大數(shù)據(jù)中的不確定性和價值的隱蔽性,,要跨界創(chuàng)新,、跨界構建基于統(tǒng)計的可變視角和可變尺度的全新發(fā)現(xiàn)狀態(tài)空間,同時,,用大數(shù)據(jù)的規(guī)模來保證發(fā)現(xiàn)價值的精準性,,因為習慣性認知或傳統(tǒng)聚類工具難有創(chuàng)新。
機器人時代
真的來了
如何認識機器人,?李德毅指出,,智能機器人是集新材料、新工藝,、新能源,、機械、電子,、移動通信,、全球定位導航、移動互聯(lián)網(wǎng),、云計算,、大數(shù)據(jù)、自動化,、人工智能,、認知科學、乃至人文藝術等多個學科,、多種技術于一身的人造精靈,,是人聯(lián)網(wǎng),、物聯(lián)網(wǎng)不可或缺的端設備,,是人類社會走向智慧生活的重要伴侶,將引發(fā)人人聯(lián)網(wǎng),、物物聯(lián)網(wǎng)的嶄新形態(tài),,也將改變人類的生產(chǎn)活動、經(jīng)濟活動和社會生活,。
李德毅認為,,機器人既使用大數(shù)據(jù)也產(chǎn)生大數(shù)據(jù),既是大數(shù)據(jù)的產(chǎn)物,也是大數(shù)據(jù)的推動者,。機器人是大數(shù)據(jù)認知的典型代表,,而在目前,無論是搬運,、碼垛,、研磨、拋光,、挖掘等灰頭土臉的工業(yè)機器人,,還是微電子產(chǎn)品生產(chǎn)線上精細靈巧的機器人,機器人在我們的生產(chǎn)生活中已經(jīng)隨處可見,。
李德毅舉例,,以達芬奇機器人為代表的多手臂、可遙控的微創(chuàng)手術工具,,在從泌尿外科到心臟病的一系列手術中成功使用,,手術時間短,痛苦少,,費用低,,大大激發(fā)了人們去研發(fā)柔軟、小巧,、安全和智能的醫(yī)療機器人,。而在不遠的將來,還將有更多工業(yè)機器人,、農(nóng)業(yè)機器人,、醫(yī)療與健康機器人、服務機器人,、太空機器人,、國防機器人出現(xiàn),可以說機器人時代真的來了,。
李德毅說,,機器人革命是世界性的、時代性的,。機器人換人首先不是換掉理發(fā)師之類的勞動者,,而可能是產(chǎn)業(yè)工人、醫(yī)生,、服務員,,甚至士兵,他們將升級轉型成為機器人的創(chuàng)造者和使用者,,成為懂得集成,、維修、管理機器人的專業(yè)人才??缃鐫B透和跨界創(chuàng)新誕生的智能制造也是我國正在抓住的一次歷史機遇,。