大數(shù)據(jù)和人工智能發(fā)展的思考
10月12日,第七屆中國智能產(chǎn)業(yè)高峰論壇在佛山開幕,在第一天的主論壇上,北京拓爾思信息技術(shù)股份有限公司副董事長、總裁施水才發(fā)表了主題為《大數(shù)據(jù)和人工智能發(fā)展的思考》的精彩演講。
在演講中,施水才先生從自身多年大數(shù)據(jù)技術(shù)和服務(wù)領(lǐng)導(dǎo)者角色的角度,介紹了旗下利用大數(shù)據(jù)技術(shù)推出的數(shù)據(jù)增值服務(wù)平臺,并得出了數(shù)據(jù)信息知識智能智慧的價值提升路徑。從大數(shù)據(jù)、云服務(wù)到人工智能,施水才為嘉賓鋪設(shè)了一條如何利用大數(shù)據(jù)去實現(xiàn)人工智能增值的道路,有很大的參考價值。
以下是施水才先生的演講整理稿:
大家上午好。非常感謝中國人工智能學(xué)會邀請我在大會上做分享報告。今天我想給大家分享一下對于大數(shù)據(jù)和人工智能產(chǎn)業(yè)的發(fā)展思考。
我想講的第一點是我認(rèn)為把大數(shù)據(jù)和人工智能產(chǎn)業(yè)進(jìn)行一些比對,把這兩個事情放到一起比對是非常有意義的。第二點想講的,到底我們是人工智能+行業(yè),還是行業(yè)+人工智能,談一下我的理解和認(rèn)識,第三點我覺得我們需要突破人工智能現(xiàn)在非常強(qiáng)調(diào)3個要素,就是計算能力、數(shù)據(jù)和算法,我認(rèn)為對于未來人工智能的研究和應(yīng)用,僅有這三點是不夠的,應(yīng)該有其他重要的因素需要加進(jìn)來。第四點我想探討的是我們現(xiàn)在在人工智能的幾個方向里面,哪一些還有大的機(jī)會,來讓我們創(chuàng)新、創(chuàng)業(yè)、賺錢,最后講一講我們自己基于NLP平臺的一些人工智能應(yīng)用實踐。
大數(shù)據(jù)和人工智能產(chǎn)業(yè)的對比
對比大數(shù)據(jù)和人工智能產(chǎn)業(yè)的發(fā)展是有啟發(fā)的。因為人工智能的發(fā)展和數(shù)據(jù)密不可分,而且目前人工智能發(fā)展所取得的成就大部分和大數(shù)據(jù)密切相關(guān),因此觀察大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展對人工智能產(chǎn)業(yè)發(fā)展很有意義,同時我們認(rèn)為數(shù)據(jù)驅(qū)動的商業(yè)(DataDrivenBusiness)比智能驅(qū)動的商業(yè)更符合產(chǎn)業(yè)的本質(zhì),實際上大數(shù)據(jù)產(chǎn)業(yè)的落地能力是強(qiáng)于人工智能的,所以大數(shù)據(jù)產(chǎn)業(yè)發(fā)展中出現(xiàn)的問題對人工智能產(chǎn)業(yè)發(fā)展很有意義。
大數(shù)據(jù)的發(fā)展有幾個方面對人工智能的發(fā)展有啟發(fā)。包括數(shù)據(jù)的重要性,數(shù)據(jù)質(zhì)量的重要性,應(yīng)用場景的重要性,行業(yè)知識的重要性、政策法規(guī)的重要性,以及變現(xiàn)的模式的參考意義。大數(shù)據(jù)從2010年在美國白宮首先開始制定一些政策,到2012年我們國家開始熱起來,這幾年出臺了很多政策規(guī)范,甚至搞了很多園區(qū),但是我們現(xiàn)在發(fā)現(xiàn)整個大數(shù)據(jù)產(chǎn)業(yè)仍然處于非常早期的階段。為什么這么說?第一,它在哪些方面推動了產(chǎn)業(yè)的變革?第二,誰賺到錢了?現(xiàn)在基本上只有互聯(lián)網(wǎng)的大公司通過推薦精準(zhǔn)化營銷、電子商務(wù)等等賺到錢了,但是我們大量從事產(chǎn)業(yè)大數(shù)據(jù)的企業(yè)大部分還在燒錢,行業(yè)也沒有從大數(shù)據(jù)中收益和發(fā)生大的產(chǎn)業(yè)變革,仍然處于非常早期階段。人工智能也是一樣的,大部分的AI企業(yè)仍處于投資和燒錢的階段。
再細(xì)化一下,我們看看影響整個大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的4個要素:數(shù)據(jù)開放、技術(shù)研發(fā)、產(chǎn)業(yè)生態(tài)、法律法規(guī)。總體上講,目前大數(shù)據(jù)產(chǎn)業(yè)發(fā)展非常早期,仍然是大數(shù)據(jù)投資和創(chuàng)業(yè)的良機(jī),在產(chǎn)業(yè)生態(tài)上主要的特征是壟斷和新的數(shù)據(jù)孤島,大數(shù)據(jù)創(chuàng)業(yè)公司仍需3-5年才能實現(xiàn)規(guī)模盈利,大部分在持續(xù)的燒錢,2017-2018年產(chǎn)業(yè)整合趨勢明顯。在數(shù)據(jù)方面,互聯(lián)網(wǎng)大企業(yè)的數(shù)據(jù)霸權(quán)主義、政府?dāng)?shù)據(jù)公開的艱難(在國際上很落后,60名開外),行業(yè)和企業(yè)數(shù)據(jù)的難以獲得以及灰色數(shù)據(jù)灰色產(chǎn)業(yè)鏈,以及個人隱私問題都非常的突出,我們國家每年數(shù)據(jù)交易的市場是500個億以上,但是合法的只有10%左右,90%都是灰色數(shù)據(jù)鏈,所以導(dǎo)致最近公安查,說很多大公司被抓起來了,個人隱私問題非常突出,要破解數(shù)據(jù)的魔咒,需要在法律法規(guī)和產(chǎn)業(yè)生態(tài)兩個角度去破局。
除了數(shù)據(jù)及數(shù)據(jù)的質(zhì)量外,應(yīng)用場景是非常重要的,大數(shù)據(jù)的4個V不重要,Hadoop/Spark不重要,重要的是應(yīng)用場景,那么對AI來說也是一樣的,因為實際上我們看到大數(shù)據(jù)和AI的熱門應(yīng)用領(lǐng)域?qū)嶋H上重合度很高:金融、健康醫(yī)療、教育、在線廣告、情報分析應(yīng)用場景和行業(yè)密切相關(guān),主要是垂直化和行業(yè)化,一旦進(jìn)入行業(yè),你就會發(fā)現(xiàn),很多問題來了,所以我們說人工智能發(fā)展僅僅強(qiáng)調(diào)數(shù)據(jù)、算力、算法是不夠的。
政策法律也非常重要,在互聯(lián)網(wǎng)時代,我們國家互聯(lián)網(wǎng)發(fā)展為什么快?其中一條人多,人口紅利,還有一條非常重要規(guī)則沒那么嚴(yán),政府和行業(yè)對互聯(lián)網(wǎng)的支持比較多,企業(yè)層面有時甚至有點蔑視規(guī)則。但是大數(shù)據(jù)和人工智能時代,像互聯(lián)網(wǎng)早期那樣野蠻發(fā)展已經(jīng)行不通了。現(xiàn)在數(shù)據(jù)開放和隱私保護(hù),從個人隱私到人身安全,工業(yè)機(jī)器人維修,因為搞不好會死人的。
小節(jié)一下,通過對比大數(shù)據(jù)和人工智能產(chǎn)業(yè)的發(fā)展,我們可以得到如何幾個結(jié)論:人工智能產(chǎn)業(yè)仍處于非常早期的階段;數(shù)據(jù)的重要性不容置疑,但問題多多;應(yīng)用才是驅(qū)動力;垂直行業(yè)才是大部分參與者的機(jī)會所在。
人工智能+行業(yè)or行業(yè)+人工智能
今天想和大家分享的第二點是關(guān)于到底是人工智能+行業(yè)還是行業(yè)+人工智能。我的基本看法是行業(yè)+人工智能仍然是智能產(chǎn)業(yè)發(fā)展的主流。我們覺得行業(yè)+人工智能可能占到90%,人工智能+行業(yè)可能只占到10%。區(qū)別在哪里?人工智能+行業(yè)是創(chuàng)造新模式,更多表現(xiàn)在以前這個行業(yè)不成熟,或者沒有現(xiàn)有的很好的商業(yè)模式,比如像自動駕駛;而行業(yè)+人工智能是對用人工智能技術(shù)對行業(yè)進(jìn)行變革和改造,要么降低成本,要么提高決策和管理水平。比如法律啊、教育啊、金融啊。很對AI的新技術(shù)在消費領(lǐng)域和工業(yè)領(lǐng)域的應(yīng)用也不一樣,比如消費領(lǐng)域的人臉識別、美顏相機(jī)在工業(yè)領(lǐng)域可能是身份認(rèn)證、銀行開戶、安防監(jiān)控、商業(yè)分析;消費領(lǐng)域的語音識別和輸入法技術(shù)可能是智能客服應(yīng)用,深度學(xué)習(xí)和圖像識別在工業(yè)領(lǐng)域可能是智能分揀和安檢應(yīng)用。
如果90%的機(jī)會在于行業(yè)+人工智能,那么錢、數(shù)據(jù)和算法就是不是決定性的因素,如果錢是決定性的因素,那未來也就不會有什么創(chuàng)新了。行業(yè)知識和行業(yè)專家是壁壘,所以說大公司壓迫下的創(chuàng)業(yè)公司仍具有廣闊的空間,那么那些行業(yè)將實現(xiàn)AI爆發(fā)或者說受到?jīng)_擊最大呢?剛才李德毅院士說的很好,四個行業(yè),制造業(yè)、教育、金融、醫(yī)療,我非常認(rèn)同,我覺得最關(guān)鍵的是要看兩點,一個是行業(yè)本身的成長空間,就是說是否足夠大,是否未來有成長性,另一個是這個行業(yè)是否依賴于人的經(jīng)驗和知識,依賴越大的,被人工智能取代的需求就越大,比如醫(yī)生,主要是專家太少。我們投資過的一個項目,是病理切片癌癥診斷,據(jù)說全國能看病醫(yī)生也就不到1萬個,而合格的專家只有不到500個,你看需求多大,大數(shù)據(jù)和人工智能可以解決這個問題,IBMWatson的思路也是一樣的。另外就是律師和金融行業(yè)的人,主要是太貴,律師一小時多少錢,金融行業(yè)動不動幾百萬,其實你用了大數(shù)據(jù)和人工智能后發(fā)現(xiàn),其實他們不值這么多錢。剛才李院士說制造業(yè)我國使用機(jī)器人的數(shù)量遠(yuǎn)遠(yuǎn)落后韓國日本等,主要原因我覺得還是成本問題,所以我認(rèn)為最緊迫的可能不是家政機(jī)器人之類的,而是取代高成本的人力以及人力不夠的行業(yè)。
人工智能產(chǎn)業(yè)還有一個特點比較鮮明的。就是他是Embedded,嵌入式的,所以可以說AI技術(shù)是一種EnablingTechnology。未來所有的企業(yè)都應(yīng)該是AI企業(yè),所以你看現(xiàn)在包括Google百度都說自己是AIAllIn。
人工智能的三要素問題




