“清華人工智能論壇”—芮勇博士《人工智能趨勢之四化》
發(fā)布于:2016-06-15 14:47 瀏覽:
導讀:2016年6月6日,清華人工智能論壇在清華園成功舉辦,清華大學副校長薛其坤院士與張鈸院士、馬少平、張長水教授等來自清華大學人工智能領(lǐng)域的多位權(quán)威專家、芮勇、王小川、張連毅等杰出清華校友企業(yè)代表,和學術(shù)界、產(chǎn)業(yè)界、資本界等社會各界近500多人相聚清華園,縱論人工智能。本屆論壇充分展現(xiàn)出了清華大學在人工智能領(lǐng)域強大、領(lǐng)先的學術(shù)、產(chǎn)業(yè)實力,與客觀務(wù)實、創(chuàng)新進取的風貌,引發(fā)了人工智能界的廣泛關(guān)注與轟動。

我為什么取這個題目呢?什么叫人工智能趨勢之四化。因為到這個時候大家都很困惑,起一個稍微應(yīng)景的題目。今年是“人工智能”這個詞被造出來的第61年,61年前沒有,這個詞最開始出現(xiàn)是在1956年。
2012年的時候,深度學習剛引入計算機視覺是八層,有人說是九層,其實有一層是隱含層,其實是八層。到2014年的時候,到了19。具體算法不聊太多,但是有一些思路上的東西,不是說從上一層直接連到下一層,而是跳過去。隔幾層以后再往下走,有一點像人的神經(jīng)元的連接一樣,規(guī)定是每一層單個連下去,有的時候會往前跳一下。因為這個新的結(jié)構(gòu)就使得去年我們在2015年ImageNet三個主要項目都拿到冠軍,而且要比第二名高出很多,這是新算法帶來的好處。除了我們讓計算機能夠看到一個圖片是屬于某一類的,比這個更難一點的是說,比如說他知道這個圖片里面有一只貓,更難的是說你知不知道那個貓在什么地方?不僅僅告訴你這里面有一只貓,我告訴你這只貓在圖片的左上角。所以物體檢測是比物體分類更難的事情。我想給大家看一下下面這個,比物體檢測再難一點的就是像素級別的物體分割,因為我們知道一個圖片有很多像素級別,每個像素是屬于這只貓,還是屬于這只貓邊上的草,每一個都要分類,這是更難的事情,從圖片分類到物體檢測,到像素級的物體分割,今天已經(jīng)可以做到這樣的程度。
剛才說了那么多,為什么計算機視覺能夠做分類、做物體檢測、做像素級的物體分割?是因為我們?nèi)祟惿闪撕芏嗟臄?shù)據(jù),這些數(shù)據(jù)被拿來訓練計算機,它才能夠有一定的智能,所以這是第一類叫做大數(shù)據(jù)化。第二類,其實我們很想讓人工智能有一定的自適應(yīng)性,比如說我給大家舉兩個例子,在座的可能有一半的人會經(jīng)常自拍,一些年輕的女士們經(jīng)常會自拍,拍的時候你下意識地要想一想,現(xiàn)在的光線是不是足夠亮?后面是不是有很亮的玻璃,比如在那兒拍,如果有很亮的玻璃,玻璃是看到了,但我的臉是黑的,每次自拍要操心一些事情。我們可不可以用人工智能的方法,寫出來一個有智能的API,讓人工智能的APP,讓這個APP去操心這些事情,不要讓用戶去操心這些事情。我們就做了一個微軟自拍,我們沒有投入任何的錢,一分錢都沒有投入,一個月下載量到了一百萬,完全是口口相傳,大家要感興趣的話,待會兒也可以去搜一下。它能做很多的東西,不僅僅是智能降噪、自然美顏等等。其實他知道你的年齡和性別,比如你是一位年輕的女士的話,它會給你美顏美得很好,甚至把你的嘴唇再修紅一點。但是如果是我拍的話,它知道我已經(jīng)很老了,沒有必要把我弄得那么漂亮,弄得漂亮我反而會不高興,所以我拍下來的是我本身的樣子。所有這些很智能的東西都已經(jīng)在這個APP里面,因為他知道外面的光線是什么樣、外面的噪聲是什么樣、這個用戶是男是女、是什么樣的年齡。
大家可以去AppStore下載試試看,我自我感覺好像比市面上的要好一些,讓你操心的東西少一些。
第二個,我想給大家舉一個例子是自適應(yīng)的人工智能。有一個很有意思的APP,我們叫做實時翻譯器。這是怎么來的呢?1966年的時候,在美國有一個連續(xù)的電影,叫《星際迷航》,我相信在座的可能也有不少朋友都看過這部電影。有很多《星際迷航》的影迷,每次電影出來,就把電影票買到了,在電影院前等著看!缎请H迷航》是講不同的星迷去不同的星球探索。不用去另外一個星球,我們就在地球上去另外一個國家,其實你遇到的問題就是你語言可能不通,你怎么跟那個國家的人進行交流?當時在電影里面有一個,這邊這兩個人手里抓著一個東西,任何語言它都可以進行實時翻譯,不管你和來自另外一個星球的人講什么語言,它都可以進行翻譯。當然,這是一個科幻,但是我們這些做研發(fā)的人總是想把科幻變成現(xiàn)實。所以七八年以前我們就有一個項目,說有沒有辦法我們能夠做出一個系統(tǒng),使得兩個說不同語言的人可以實時交互?這個是七八年以前開始做,大概在四五年以前(2010年)的時候就有了這么一個系統(tǒng),在我們內(nèi)部進行了展示,2012年的時候,在二十一世紀的時候,我記得是在天津大禮堂,Rick Rashid這位老先生不會說中文,只會說英文,他當時是在天津大禮堂講,講著講著突然聽眾們發(fā)現(xiàn)他怎么會說中文了?因為就是實時的翻譯出現(xiàn)了,以他的方式用中文跟觀眾進行交互。2015年的時候我們把這項技術(shù)加到Skype里,今天這個技術(shù)已經(jīng)在skype上。如果想做到這件事情,我下邊會講具體的技術(shù)怎么做,在我講具體的技術(shù)之前,網(wǎng)上有一段小視頻,這是一個美國的攝影師在中國待了十來年,是一個背包客,走了三萬五千英里的路,經(jīng)常拍圖片、視頻。所以去每個地方都沒法跟當?shù)厝私涣,有了這個以后,他的生活變得更加簡單一點。
第三個是人工智能的可穿戴化,我也想給大家舉兩個例子。剛才長水展示幾張圖片,其實你現(xiàn)在給計算機看幾張圖片,它會生成一些自然語言的文字,剛才我和小川在下面討論,他們也做了類似的系統(tǒng)。但是我們想一想,如果真的有一天我們的自然語言技術(shù),我們的計算機視覺技術(shù)可以做到這么好,讓計算機看到這幅圖片以后,它會說一名男子正騰空而起,表演滑板。
第四個,我叫它人和人工智能的關(guān)系。我特別同意張老師下午的演講,其實今天這個人工智能和人不是誰PK誰的問題。很形象、很發(fā)散的、很神來一筆的、很抽象的、很藝術(shù)的在這邊,計算機比我們強的是它的存儲功能很強、記憶能力很強。所以它是一個很好的左邊半個大腦的補充,我們?nèi)祟惛鼜姷臇|西,我們有意識、我們有想象力,我們有很多計算機不能理解的東西。其實今后的10年、20年不是人對抗機器的問題,而是人加上機器,使得我們?nèi)烁鼌柡Α?br /> 本次論壇由清華校友人工智能聯(lián)盟、清華靈云人工智能研究中心、北京捷通華聲科技股份有限公司等承辦。
謝謝大家!
靈云平臺更多信息:www.hcicloud.com">www.hcicloud.com
體驗靈云客服機器人:010-82826886-8898