CCAI 2019|周志華:人工智能是個高度凸顯“個人英雄主義”的行業(yè)11
2019年中國人工智能大會(Chinese Congress on Artificial Intelligence 2019,簡稱“CCAI 2019”)將于在9月21日-22日在青島膠州召開。 周志華教授是大會程序委員會主席之一。他從事人工智能研究20多年,研究領域包括人工智能、機器學習與數(shù)據(jù)挖掘等,是國內人工智能研究的代表人物。周志華教授目前擔任南京大學人工智能學院院長,是人工智能相關五大主流國際學會的首位華人“大滿貫”Fellow,還是歐洲科學院外籍院士。 近年來以深度學習為代表的人工智能取得了令人矚目的發(fā)展,周志華作為該領域的***專家,有著怎樣的觀察和思考,又提出過什么樣的學科洞見?讓我們一起看看。 深度學習成功的三個秘訣近年來人工智能的火熱,離不開深度學習的幾次突破,其中尤以圍棋智能AlphaGo的橫空出世為甚。它以壓倒性優(yōu)勢先后橫掃人類兩大頂尖棋手李世石與柯潔,在收獲一片驚呼與贊嘆的同時,引發(fā)了人們對人工智能的能力邊界,以及未來生活種種可能性的無限想象。 作為機器學習領域的***專家,周志華對技術的發(fā)展始終保持高度理性和清醒認知。他將當前機器學習的成功歸于這三個因素:有效的深度模型、強監(jiān)督信息以及穩(wěn)定的學習環(huán)境。 有效的深度模型,在現(xiàn)階段基本上就是深度神經(jīng)網(wǎng)絡。曾有人提出,神經(jīng)網(wǎng)絡不是新事物,早在半個世紀之前就有了,今天我們之所以能夠做更深的神經(jīng)網(wǎng)絡,只不過是因為計算能力強,現(xiàn)在能夠訓練了。 周志華認為,這是一個認識誤區(qū)。他指出,2006年之前學界并不知道如何訓練出五層以上的神經(jīng)網(wǎng)絡,這不是由于計算能力約束,而是不知道如何設計有效的算法。圖靈獎得主杰夫辛頓在這方面做出了重要貢獻,使得訓練更深的神經(jīng)網(wǎng)絡成為可能,這才有了后來深度學習的發(fā)展和繁榮。 第二個因素是存在強監(jiān)督的信息。深度學習需要大量的樣本,那么在今天這個大數(shù)據(jù)時代,樣本是不是不成問題? 周志華解釋說,不是的。僅有樣本并不夠,重要的是這些樣本需要有標記,這將耗費大量的人力物力,機器學習技術對強監(jiān)督信息是高度依賴的。 以AlphaGo為例,它使用人類職業(yè)六段以上的超過16萬棋局進行訓練,后來發(fā)明的AlphaZero不使用人類棋局,通過兩個程序直接對弈來實現(xiàn)性能的提升,但這種模式同樣依賴于強監(jiān)督信息,因為它依賴于人類提供的勝負判斷規(guī)則,而這個勝負規(guī)則本身就是一般應用任務里很難具備的非常強的監(jiān)督信息。 穩(wěn)定的學習環(huán)境對當前機器學習技術的成功同樣不可或缺。在這樣的環(huán)境中,學習過程涉及的數(shù)據(jù)分布、樣本空間、學習目標都是固定的。 深度學習如何實現(xiàn)突破?在周志華看來,任何一個模型都必然存在缺陷,深度神經(jīng)網(wǎng)絡也是。**,它要求人們花費大量的精力調整參數(shù);第二,現(xiàn)在使用的神經(jīng)網(wǎng)絡學習模型需要在訓練前預先確定,但事實上,在解決一個現(xiàn)實問題之前人們并不知道什么樣復雜度的模型是最恰當?shù)?。此外,對大訓練?shù)據(jù)的依賴、理論分析的困難、模型的黑箱性等等都不容忽視。 周志華指出,機器學習領域“沒有免費的午餐定理”說明,不存在“包打天下”的模型,任何一個模型可能只有一部分任務是適用的??梢钥吹缴疃壬窠?jīng)網(wǎng)絡主要是在圖像、聲音等數(shù)值建模任務上性能**,但在涉及符號建模、離散建模、混合建模等的其他任務上并不突出,因此,有必要針對這樣的任務特點來考慮設計神經(jīng)網(wǎng)絡模型之外的新型深度學習模型。 其次,當前的深度學習高度依賴于強監(jiān)督信息,可是把現(xiàn)實生活中強監(jiān)督樣本需要付出巨大的代價,如何利用弱監(jiān)督信息進行學習是重要研究方向。 最后,現(xiàn)在越來越多碰見的是開放動態(tài)環(huán)境,學習過程涉及的因素都可能發(fā)生變化。這對機器學習提出了更大的挑戰(zhàn)。 因此周志華總結道,未來機器學習研究需要多關注:
人工智能的人才培養(yǎng)周志華坦言,從對人工智能學科的歷史貢獻來看,中國不僅比不上美國,也不及歐洲、日本。國際上五六十年代就開始了人工智能研究,而我國在1978年以后才恢復科學研究,起步太晚,人工智能研究在新世紀以來才開始與國際接軌。 他同時表示,近十年來中國人工智能取得了高速發(fā)展,如果僅從最近幾年的發(fā)展情況來看,確實可以說目前中國在人工智能領域僅次于美國。 2018年,國內C9高校的首個人工智能學院在南京大學成立,周志華為首任院長。到2019年3月,已有35所高校獲得首批建設人工智能本科專業(yè)的資格。 周志華認為,人工智能學院的涌現(xiàn),是政策推動、產(chǎn)業(yè)發(fā)展、學科內涵多方共同作用的結果:首先,人工智能是時代關注的焦點,國家政府高度重視;第二,人工智能技術已經(jīng)進入互聯(lián)網(wǎng)、金融、智能制造等諸多行業(yè),人才缺口非常大;第三,人工智能并不是一個短期熱點,而是一個經(jīng)過60多年發(fā)展的嚴肅學科,已經(jīng)形成了龐大自洽的專業(yè)知識體系,全面掌握人工智能專業(yè)知識需要付出大量的學習時間和精力。 在人才發(fā)展方面,周志華提出,人工智能是個高度凸顯“個人英雄主義”的行業(yè)。因為以往對人才培養(yǎng)來說,從“學”到“用”之間的間隔是天然存在的。以軟件開發(fā)為例,現(xiàn)在幾乎沒有什么軟件能夠僅靠1、2個人完成,必須通過大團隊合作,而學校主要是培養(yǎng)學生的個人素質能力,例如一門課考試不可能讓幾十個學生做同一張試卷然后同享得分, 學生在大團隊中開展工作的能力必然要到企業(yè)才能培養(yǎng)發(fā)展。而人工智能行業(yè)則有所不同,它的“學以致用”性非常強,從高校培養(yǎng)出來的高水平人才可以很快在產(chǎn)業(yè)界發(fā)揮作用,周志華領導的LAMDA(南京大學機器學習與數(shù)據(jù)挖掘研究所)培養(yǎng)畢業(yè)的學生加入阿里、騰訊、華為很快就為公司取得重要突破性業(yè)績,多名博士生甚至在讀期間就被聘為知名企業(yè)研究院院長,就是明顯的例子。周志華指出,人工智能領域從實驗室成果到產(chǎn)業(yè)界應用的“路徑”相當短,實驗室里由于個別“聰明人”取得的算法突破往往很快就可以在產(chǎn)業(yè)應用中實施,甚至推進引領整個領域的技術發(fā)展。為了在人工智能時代加快我國科技和產(chǎn)業(yè)發(fā)展,高校在培養(yǎng)高水平人工智能人才方面可以多下功夫爭取做更大貢獻。 |