8月28日,由中國中文信息學會和中國計算機學會聯合主辦的首屆語言與智能技術高峰論壇(Language Intelligence Summit)在北京召開,主題為 語言與智能的未來 。
清華大學計算機系教授、中國科學院院士張鈸,中國科學院院士、計算機軟件專家懷進鵬,微軟亞太研發集團主席、微軟亞洲研究院院長洪小文,香港科技大學教授、美國人工智能協會(AAAI)Fellow楊強,美國卡耐基梅隆大學邢波,百度副總裁王海峰,科大訊飛輪值總裁胡郁等人工智能領域專家及學者到場參會并發表主題報告。
會上,懷進鵬表示,人工智能在技術發展當中仍然出現計算的基本瓶頸問題,雖然計算能力很大,有千萬億,又要延續百億的計算機。但現在處理結構帶來了很多新的思考,包括學習效率等,這些都是所看到的新問題。
同時,他表示,面向2020年,信息經濟將會成為中國非常非常重要,信息消費規模將達到6萬億,而他對GDP的比重從現在的27%將達到40%以上,所以未來得人工智能、虛擬現實對整個信息經濟的影響是相當重要的。
另外,他認為人工智能需要大家準確把握發展的窗口期,準確的把握和發展的階段是非常重要的,特別是如何來尋找和產業、應用的痛點,找出把握好市場和政府推動的關系。在這段關系當中將會圍繞中國制造2025,特別是制造業的發展,來打造智能制造、智能工廠,或者中國的方式是兩化融合來推動,我們會重點做五大類的工作:一是在技術方面,二是產業基礎,三是公共平臺,四是培育重大的應用,最后搭建一個公共的服務平臺。
談到人工智能的應用,他表示:智能汽車是一個值得關注的企業,既有未來2020年5G的發展,也有高端服務業、汽車,這三個行業之間的疊加創造了新的維度,也是一個難得的機會。
以下為懷進鵬全部演講內容:
懷進鵬: 尊敬的李生理事長、高文理事長,尊敬的洪小文院長,王堅總裁,還有各位朋友。今天非常高興受邀來參加這個會,見到了很多的專家。
就像剛才兩位理事長所提的人工智能現在風生水起。前一段時間開會的時候,信息領域的投資者好象不談人工智能和虛擬現實就覺得已經OUT了,這反映了一個情況,這個產業在快速生長和發展,大家在談的幾個熱詞,云計算、大數據非常火,現在是AI、VR、區塊鏈,現在只要搞技術的人,搞產業的人都在關注這方面,這本身對產業的發展和技術有很多的期待,特別是語言智能引起了很多人的聯想,使物有人一樣的智能,是人一直的追求,就像登月一樣。今天在這里我想跟各位簡單交流一下對這方面技術理解和思考,期待我們共同努力,能夠對技術產業未來得發展出一點力。
李老師講過今年AIphaGo所引起的廣泛影響,人們預測再過30年,大概人類的文明將進入一個新的時代,有關這方面的表述也特別多,但是更多我們可以看到在社會當中,從AIphaGo之后,無人機、無人駕駛,人工智能新材料,特別是語言的理解、語音的理解方面,一下子全都集中起來,實際這些年在這些方面取得了非常重要的進步。如果人工智能最近這些年在應用當中發生了很大變化,我們思考其中有三個因素在推動技術的形成和進一步的應用發展。一是數據本身是智能產生的一個原材料,大數據的發展和數據資源的快速積累,給人工智能創造了很多發展的前提。二是深度學習在這十年左右,實際上給信息技術的處理和信息應用帶來更多的機會。三是關鍵技術和基礎設施,比如說手機,三年前的手機已經相當于40年前的一個計算機,現在手機以蘋果5S為基礎,已經相當于當時的計算機。如果按照計算能力的提升,71年有了第一款數據處理器,人們也在按照摩爾定律簡單地做計算。2018年的時候,大概我們的計算機晶體管的集成度將要超過以前,創造了數據處理的新變化。
第一個層面的思考,有了大量的數據和數據處理能力的時候,是不是就能夠產生智能?從語法到語義,人除了數據還有情感,數據到情感這條路線、這個橋梁是怎么過渡過來的,所以語法和語義的區別是基于數據和情感的,和人們的認知和決策是有區別的。
微軟前一段時間做人工智能的報告也在講,我們也都在問,他知道他在說什么嗎?他能知道他在說什么嗎?過來知道他曾經有過什么?有關這樣的一些問題,也就是從認知方面,是不是我們還有很多新的機遇?如果我們去簡單理解的話,一些無關的數據是否能被認為有關的知識或者信息,我們也希望按照數據處理的方式,從無序到信息、到知識,再到所謂我們的智慧,能夠真正構造出這樣一種方式,從數據而來,從計算產生我們的技術。也許人工智能第一個重要的路徑就是走向上數據計算的發展模式,數據計算、商業計算,以及我們現在說的云計算。
過去5年大家都很清楚,數據的突破帶來很多智能性的發展,包括計算技術、感知處理的技術和數據處置技術,也有很多重大輔助系統和問答系統的出現。同時數據處理有關人類智能方面的很多工作,特別是用機器的方式來發展。
從數據的智能到人類的智能過程當中究竟還有多遠?我們舉一個簡單的例子,數據的處理是不是能給我們創造智能?但數據處理和我們傳統的理解,經驗計算模式就會產生差別。第一個差距,工業革命以來所有的計算是采樣計算,都是精確的、均勻的。在發展過程中到信息數據進行關聯的時候,由于大規模數據的出現,也不可能處理到每一個節點上,如果做飯的時候,炒青菜不熟的時候我們會嘗一嘗,在大數據時代,嘗一嘗的方式已經失效了,已經很難反映出這樣的規律。在這個過程當中,我們現在依賴的仍然是基于統計學的基本假設。
第二是精確與非精確,精確性不再是絕對追求目標,需對宏觀趨勢給出快速預測,如果買一雙鞋不會跑遍北京所有商店,當然現在上網就可以買,不用到所有的都比較完之后再買,現在可以做定點銷售,做畫像,以更好的去傳播。
第三是所有推進的邏輯基礎都是基于因果與關聯,關聯之間的聯系是不是改變了我們的方式或者從科學價值的角度來說,我們一致認為科學有因果關系,我們是按照想象建立數據之間的關系,最后圖譜以后最后形成最后的因果關系,我們才能得到邏輯,因此從數據作為分析的基礎,能產生智能來看,我們還有一些需要思考和待繼續研究的問題。以我們已經假定的事情來解釋,從解釋當中進一步開展工作。所以除了過去的人工要求以外,可以通過多層、深度來解決自動化,這個自動化,人類對問題的理解的差異性,就像我們常講的三歲小孩兒來看圖識子的時候不是一樣,所以這里就會有很多新的方式。
在這里分享一下我們實驗室對這個問題主要從數據和智能方的思考,第一,如果人工智能走向產業或者成為一個獨立的門類,那它的科學性在什么地方?無論計算能力多么好,無論數據多大,總有一個基本的問題,就是數據科學的科學是什么?所以計算機科學當中算法是重要的,復雜性是來提供重要的基礎。有關這方面的內容,不展開講,過去每一個時點在計算復雜性都有重大的突破,但是二十世紀大數據時代,我們經常說從IT到DT,從IT到新IT,傳統的信息技術到智能技術,在這個過程當中就會有一些新的變化。二是有沒有數據基礎。如果數據關聯就能成為科學,計算的復雜性也是重要的。第二,我們是否能夠有它的工業系統能給出的技術,因為我們畢竟對它的邏輯和因果關系不太了解,所以我們知道哥德爾定律,對的就是一定能證明的,能證明的東西必須是對的。在這樣一個開放系統下,通過這樣數據的關聯是否能建立因果關系?
數據庫的成長,從早期外設問世,催生數據管理需求,將數據庫從文件系統中分離出來。面對新的問題,數據庫的發展本身也面對很多挑戰。這是第一個問題,數據是否能成為科學,表現在計算的領域和對話系統是不是有機會。二是計算模型是否存在重要的突破,問題表現在是不是走到了一個轉折點,這個轉折點表表現在器件和系統。因為最近關于非意識存儲所呈現的計算聯動的新的架構的重新思考,這為技術的工程化實際上業提供了一種思考。
左邊這張圖表達的是從過去摩爾定律之后特別是沿著傳統的路線發展過程當中,我們看到從硬盤再到Flash過程當中的新的機構,以便創造出新的應用的方式。自然的一個想法是計算和存儲的融合是不是一個重要的支撐點。
分布式系統層面中,有很多新的機會,包括內存計算為基礎的,所謂數據流的計算、圖計算的系統,這樣一個計算系統為我們處理計算的方式是不是完整的,這樣模式的延伸就是現在處理最重要的。
三是我們經常在一起討論的智能一致性的問題,群體智能的可行性問題。通過整合其他學科的知識對億我們認知的能力進行不斷的完善,在這個領域像李生理事長所講的是智能的最高階段,也是我們期待的過去想超越的,在原來圖靈測試基本方式又走向了新的應用。這個領域的發展空間現在非常多的,而且也出現了很多積極的效果,這方面的效果也推動了社會在學術界、產學界的新期待。
總體來說,我覺得人工智能在技術發展當中仍然出現計算的基本瓶頸問題,就是雖然計算能力很大,有千萬億,又要延續百億的計算機。現在處理結構也給我們帶來了很多新的思考,最后是學習效率,這些是所看到的新問題。人們期待的通過一種通用的模型,再加上對人腦計算的發展來進行思考,所以如果順著第二第三條方式交叉的話,設務腦可能也是一個數據處理系統,由此引入第二條研究的途徑,對腦科學的認識和模擬是否能夠對智能產生重要的影響,這些領域我也把前面第三個問題和它相關的聯系在一起,表現的對話系統和一些記憶芯片,這個領域也有很多工作開展。
對應前面計算產生智能,數據作為源頭來開始,在認知和模擬腦方面一直在開展這項工作,特別是最近幾年,美國和歐盟分別啟動了重要的腦科學的計劃,也在不斷的探索這個領域的發展模式,所以說到這里,計算產生智能,人腦和腦科學的研究也在于智能,以前開玩笑,張老師跟別人調侃,我們作為人來說,對腦的認識是有局限的,有局限的人的腦力去研究人的腦,是不是我們進入了一種新的悖論,所以應該從數據和計算產生智能,來看待這個特征,因為我們理解上的局限性會影響我們研究問題的有效性。但是這兩種方式,如果最后是一種計算系統,我們就可以把計算機在外部模擬計算和重要的方法和計算模式有效的和腦科學結合,也許會產生不一樣的事情。怎么去融合這兩條路徑?我覺得從事信息領域的人和從事神經科學的人也正在探討這個方向。
北航在北京市的支持下成立了一個大數據科學和腦機智能的工作,期望通過在計算方面、系統技術設計與仿真方面、認知機理方面來開展一些有選擇性的工作,所以今天看到這么多年輕的新的面孔,也歡迎各位多交、溝通,推進這項工作,我們也希望能夠透過數據智能或數據的分析,來為數據的科學基礎和技術的準備做些貢獻。
簡要在這里跟各位報告一下對產業的發展。對人工智能,上個月底和楊強教授討論,他說應該分析一下我們產業中的痛點,現在產業中的大概具備的基本條件,以便我們說應用過程當中,講產業的時候是不是有改變我們現代現實的一部分的需求。MIT也專門講,人工智能走向三個階段,從邏輯推理、專家系統到現在的深度學習發展,也認為這是人工智能的第三次浪潮。扎赫特(音)在上個月做了一個新興技術的預測,其中把人工智能作為重要的內容,我們看到相當多的發展空間,最好的預測未來25年將會對產業的形成和發展起到很重要的作用。
這個內容大家都知道,在世界經濟論壇預測未來10-15年產業出現新的拐點當中提出了六大趨勢,其中第四點就把大數據和人工智能作為重要的產業發展方向,需要引起重視。它不是專門的咨詢機構,而是眾多的州和全球在多個領域和產業界的關注的焦點,并把它凝練出來,做了相當長時間的研究和分析。它對大數據和人工智能未來對產業化的影響更多的是理解對決策的思考方式,而從這里我們看到,人機物的互聯,計算、通信和存儲新的影響,以及物聯網,IOT,還有分享型經濟和數字化。說白了,這些都對我們現在看的人工智能有新的突破和新的支撐。
據BBC的報告,大概到2020年,全球人工智能的市場規模達到183億,總規模并不是很大,但是增長率是非常高的。投資領域的規模,從2013年2015年他們做了一個基本的對比,整個的投資金額、筆數也處于快速發展的過程當中。亞洲發展的速度也挺快,中國現在號稱人工智能公司非常多的,就像每一個內容興起一樣。
真正的人工智能是否進入到產業爆發的拐點,有幾個基本的標志,有沒有規模化的痛點或者能改變產業的內容。這里人們講深度學習是否是為人工智能提供了大規模的商業化水平,云計算和大數據是不是人工智能成長的數據基礎,而資本的持續投入是不是對它的成長更有好處,但是人們更加關注規模應用和它發展的痛點。所以我想在這里有一個基本的情況跟各位報告一下,人工智能和制造業的發展。
因為機器人和無人機或者未來發展的自動駕駛,確實有可能對這個行業產生變革,就跟第一次蒸汽機、紡織機出現以后,大量的農民和工人失業了。改變行業的狀態,麥肯錫預測,10年之后制造業和服務業領域的機器人可能會取代4千萬到7千萬全職工人。Gartner預測,2025年1/3被機器人或智能軟件代替無人駕駛,使300萬卡車司機失業;牛津大學,47%的就業面臨 危險 。所以人們在講,凡是人類在進行重復性或者可進行流程化管理工作,機器代替人是一種比較流行的方式。這種方式也可能是人工智能產業發展最最主要要推動的在這些領域當中,投資的幅度相對高,也會相對快。
另外在醫療培訓和教育行業,這里也有相當的方式,包括我們以前看到的MOOC的模式,包括對醫生醫療。
數據計算和模式將會改變我們對問題的理解,除了我們過去在網絡計算下考慮的互聯網,我們添加了設備計算的、智能計算,而且帶來了很多新空間。而正在開始的物理世界的互聯所形成的IOT或者叫做工業互聯網、產業互聯網。去年9月份,美國曾經在討論,叫 重啟IT革命 ,他們認為在過去的技術發展中IT已經太沉寂了,缺乏新的亮點,而發展過程當中,數據的快速增長和傳感器的大量部署,特別是移動設備智能終端的興起,對整個產業出現了新的拐點,這個拐點將會是 重啟IT革命 。從這樣發展中我們看到它列入了八個領域,在這八個領域中包括感知計算,特別談到智能存儲,也談到下一類的制造范式,而且提出所謂Insight Computing(洞察計算)。現在很搞人工智能的公司和咨詢公司也在談Insight。這樣一個領域發展也有另外一個領域在支撐它,影響制造業的顛覆性技術以及未來制造業的革命性技術都把數據處理的方式、云計算作為未來很重要的一點。
經濟應用,世界經濟論壇也提出未來分享經濟是重要的一種。分享經濟,2010年《時代周刊》作為改變世界的10大想法之一。最近出現了一個按需經濟,在這樣一個巨大的新興技術和市場發展過程中,對過去工業時代的規律和經濟模式會有一個必然的變化。所以需要我們去思考生產力之外的一些模式的問題。與此更重要的,我們也需要在人工智能、虛擬現實技術上不斷發展,不斷應用,不斷推動產業化,這樣一些不確定性還沒有完全把握的過程當中,如何有效的去理解并且推動和培育新應用模式就會非常重要。在我們預測趨勢的時候,也對產業發展的轉折點,轉折的方式給予思考,也許我們會更加有效的對它做出判斷。
在這個領域中國又有很多的機會,習總書記在4月19號還專門講到關于大力發展信息、拓展信息經濟空間,其中重要的就是把信息化和工業化,互聯網和實體經濟結合作為一個重要的領域。在這里,中國對人工智能產業有極大的發展空間,也有巨大的市場。因為我們的產業規模是互聯網基礎設施和信息基礎設施規模世界最大,信息經濟已經成為整個國家經濟發展的新動能,我們看到它占GDP的比值從2014年超過了25%,去年達到了27%。而信息產業也成了我們支柱型行業,有很多這方面的工作。
面向2020年,信息經濟將會成為中國非常非常重要,信息消費規模將達到6萬億,而他對GDP的比重從現在的27%將達到40%以上,所以未來得人工智能、虛擬現實對整個信息經濟的影響是相當重要的。所以產業雖然在發展階段,但是人工智能對經濟社會的貢獻和可能產生的重大影響也包括社會現代化和治理,都將會有重要和積極的作用。這是跟各位分享的一些產業現代的理解特別是和制造業和未來發展中,機器人、無人機、智能駕駛所創造了空間,這是一大部分,另外一達到是關于教育和培訓。
最后對人工智能簡單講幾句話,人工智能需要我們準確把握發展的窗口期,準確的把握和發展的階段也是非常重要的,特別是如何來尋找和產業、應用的痛點,找出把握好市場和政府推動的關系。我們在這段關系當中將會圍繞中國制造2025,特別是制造業的發展,來打造智能制造、智能工廠,或者中國的方式是兩化融合來推動,我們會重點做五大類的工作:一是在技術方面,二是產業基礎,三是公共平臺,四是培育重大的應用,最后搭建一個公共的服務平臺。
整個的層次結構分為四層,從基礎研究到技術基數以及重要行業應用,這個部分已經開始在產業部門已經在布局,關于在產業的應用,主要是在智能制造機器人、智能汽車、無人系統包括智能駕駛主要的內容,同時打造一些公共的服務平臺,但是在研究方面,在技術、產業,特別是智能制造與機器方面的工作也是特別重要的,所以我們討論語言和智能的關系,語言和智能應用的結果,也將會對機器人,特別是在服務機器人當中創造很多的空間。智能汽車是一個值得關注的企業,既有未來2020年5G的發展,也有高端服務業、汽車,這三個行業之間的疊加創造了新的維度,也是一個難得的機會。
我們現在圍繞中國制造2025去年5月份發的國務院的文件,作為制造業轉型升級,也在今年5月13號同樣發布了一個兩化融合,推動互聯網與制造業融合發展,在這份意見當中,我們把制造業和互聯網的融合,搭建雙創平臺,支撐中小企業發展和社會技術應用的平臺,同時為了在制造業發展當中更有效的走向智能制造,但是先要完成數字化的改造。在這一領域當中,有一個新點就是感知計算、工業軟件、工業互聯網和工業云平臺支撐好智能制造的發展。
最后,信息技術的跨界融合處在新的發展和變化期,人工智能以他特有的魅力吸引學術界和產業界的支持和發展,我也覺得在新一輪發展中特別重要的是如何把它和產業結合,如何抓好它的商業擴散的方式。
另外一個問題是創造性的問題,我在這里特別加了兩頁PPT,過去我們的科技技術都是在上世紀五十、七十年前的重大發明,我們現在的重大發明越來越少,新的一些技術還會帶來問題。我想大家都有印象,當時在20世紀30年代的時候,一批年輕的科學家和一些重要的領軍人士不斷的開始在學術的創新和交叉性的討論,也在那個年代創造出很多現代的科學和產業的基礎,比如1948年控制論的形成,而在同時參加方法論聚餐的活躍人士都在一起,那時候有控制論的鼻祖,也有神經生理學家,信息論的鼻祖,還有博弈論的,電子計算機創始人,還有神經控制論的奠基人,都為現在很多人工智能的方式創造了基礎。那個時候在自己獨立分割的領域當中,大家的交叉和結合創造的。所以中國中文信息學會和計算機學會,坐在一起開這個會,李生先生特別講到曾經在一起交流,我覺得不斷的交流和討論,創造新的智慧是人工智能發展的幸事,也是必要的事情。
人工智能正在走向成熟,也正在開辟產業化的發展,我覺得這個領域對社會的意義、對經濟的意義都是非常重大的,值得我們去探索,同時也不要過度的浮躁,來把一切都進行簡單的關聯。理性和積極的推動它的發展,應該是我們科學的精神和理性的態度,再一次感謝李生理事長和高文理事長給我這個機會跟各位分享觀點,謝謝各位!
責任編輯:hang
文章編輯:CobiNet(寧波)
本公司專注于電訊配件,銅纜綜合布線系列領域產品研發生產超五類,六類,七類屏蔽網線/屏蔽模塊及相關模塊配件, 我們是萬兆屏蔽模塊,10G屏蔽模塊,屏蔽線生產廠家。
歡迎來電咨詢0574 88168918,郵箱sales@cobinet.cn,網址www.54hr.com.cn
?2016-2019寧波科博通信技術有限公司版權所有浙ICP備16026074號