阿里巴巴近日再爆大事件,阿里巴巴ai模型在閱讀理解領(lǐng)域頂級(jí)賽事SQuAD破世界紀(jì)錄引起大家的高度關(guān)注,跟隨小編一起來(lái)了解一下是什么情況,看看阿里巴巴人工智能的未來(lái)發(fā)展趨勢(shì)以及全球人工智能的未來(lái)發(fā)展趨勢(shì)是什么。
阿里巴巴ai模型破世界紀(jì)錄
日前,由斯坦福大學(xué)發(fā)起的機(jī)器閱讀理解領(lǐng)域頂級(jí)賽事SQuAD刷新排名,阿里巴巴憑借82.440的精準(zhǔn)率打破了世界紀(jì)錄,并且超越了人類(lèi)82.304的成績(jī)。
SQuAD負(fù)責(zé)人Pranav Rajpurkar表示,第一個(gè)模型(阿里巴巴iDST團(tuán)隊(duì)提交的SLQA +)在精準(zhǔn)度匹配上超越人類(lèi)表現(xiàn),下一個(gè)挑戰(zhàn):模糊匹配,人類(lèi)仍然領(lǐng)先2.5分。
據(jù)了解,SQuAD比賽構(gòu)建了一個(gè)大規(guī)模的機(jī)器閱讀理解數(shù)據(jù)集(包含10萬(wàn)個(gè)問(wèn)題),文章來(lái)源于500多篇維基百科文章,旨在通過(guò)這套試題梳理出線索,看機(jī)器學(xué)習(xí)模型是否能夠在經(jīng)過(guò)大量信息處理后給出問(wèn)題的確切答案。
阿里巴巴研究院自然語(yǔ)言處理首席科學(xué)家司羅在一份公告中說(shuō),對(duì)于像“天為什么會(huì)下雨”這樣的客觀問(wèn)題,機(jī)器給出的答案準(zhǔn)確率會(huì)很高。公告稱,其中的技術(shù)可以逐步應(yīng)用于諸如客服、博物館指南、在線解答患者醫(yī)療問(wèn)題等廣泛的實(shí)際應(yīng)用領(lǐng)域,從而以一種前所未有的方式減少人力投入的需求。
此次技術(shù)的重大突破源于阿里巴巴研究團(tuán)隊(duì)提出的“基于分層融合注意力機(jī)制”的深度神經(jīng)網(wǎng)絡(luò)模型。該模型能夠模擬人類(lèi)在做閱讀理解問(wèn)題時(shí)的一些行為,包括結(jié)合篇章內(nèi)容審題,帶著問(wèn)題反復(fù)閱讀文章,避免閱讀中遺忘而進(jìn)行相關(guān)標(biāo)注等。
據(jù)了解,這項(xiàng)技術(shù)已經(jīng)在阿里巴巴內(nèi)部被廣泛使用。比如,每年雙11都會(huì)有大量的顧客對(duì)活動(dòng)規(guī)則進(jìn)行咨詢。阿里小蜜團(tuán)隊(duì)通過(guò)使用司羅團(tuán)隊(duì)的技術(shù),讓機(jī)器直接對(duì)規(guī)則進(jìn)行閱讀,為用戶提供規(guī)則解讀服務(wù),是最自然的交互方式。
再比如,顧客還會(huì)針對(duì)單個(gè)商品詢問(wèn)大量的基礎(chǔ)問(wèn)題,而這些問(wèn)題其實(shí)在商品詳情頁(yè)都是有答案的?,F(xiàn)在通過(guò)機(jī)器閱讀理解技術(shù),能夠讓機(jī)器對(duì)詳情頁(yè)中的商品描述文本進(jìn)行更為智能地閱讀和回答,降低服務(wù)成本的同時(shí)提高購(gòu)買(mǎi)轉(zhuǎn)化率。
據(jù)小編了解,由司羅領(lǐng)導(dǎo)的自然語(yǔ)言處理團(tuán)隊(duì)支撐了阿里巴巴整個(gè)生態(tài)的技術(shù)需求。由他們研發(fā)的AliNLP自然語(yǔ)言技術(shù)平臺(tái)每日調(diào)用1200億+次,Alitranx翻譯系統(tǒng)提供20個(gè)語(yǔ)種在線服務(wù)日調(diào)用量超過(guò)7億+次。此前曾在2016年ACM CIKM個(gè)性化電商搜索、2017年IJCNLP中文語(yǔ)法檢測(cè)CGED評(píng)測(cè)、2017年年美國(guó)標(biāo)準(zhǔn)計(jì)量局TAC評(píng)比英文實(shí)體分類(lèi)等大賽中取得全球第一的成績(jī)。
阿里巴巴的人工智能未來(lái)發(fā)展解析
阿里在人工智能的布局主要有兩個(gè)方向:一是在電商和商家融合,二是給廠商技術(shù)支持。
阿里巴巴人工智能實(shí)驗(yàn)室于2017年7月5日亮相,主要研究消費(fèi)級(jí) AI產(chǎn)品。第一款產(chǎn)品就是最近大家熟悉的智能語(yǔ)音終端設(shè)備“天貓精靈 X1”。
iDST(數(shù)據(jù)科學(xué)與技術(shù)研究院)被稱為是阿里巴巴最神秘的研究機(jī)構(gòu),分布在杭州、北京、西雅圖、硅谷等地,是阿里巴巴負(fù)責(zé)人工智能技術(shù)研發(fā)的核心團(tuán)隊(duì)、阿里巴巴NASA計(jì)劃的人工智能大腦。
小編了解到,阿里除了人工智能實(shí)驗(yàn)室、數(shù)據(jù)科學(xué)與技術(shù)研究院iDST,還擁有阿里研究院、VR實(shí)驗(yàn)室,螞蟻金服也具備自己的人工智能團(tuán)隊(duì)。此外,2017年3月阿里宣布推出“NASA”計(jì)劃,面向機(jī)器學(xué)習(xí)、芯片、IoT作系統(tǒng)、生物識(shí)別這些核心技術(shù)組建新團(tuán)隊(duì),建立新的機(jī)制和方法。
延伸閱讀:人工智能的發(fā)展趨勢(shì)
趨勢(shì)一:大公司都將從人工智能獲利
亞馬遜、谷歌、Facebook和IBM,它們將在人工智能領(lǐng)域引領(lǐng)潮流。作為大公司,他們有合適的資源來(lái)收集數(shù)據(jù),因此有更多的數(shù)據(jù)可以使用,且看這些巨頭是如何布局的。
亞馬遜:投資人工智能20年以上,抓取了5B以上的網(wǎng)頁(yè)數(shù)據(jù),超過(guò)50萬(wàn)張JPEG圖像和相應(yīng)的JSON元數(shù)據(jù),用以供給亞馬遜運(yùn)營(yíng)中心的產(chǎn)品。每天抓取世界廣播、雜志和網(wǎng)絡(luò)新聞的數(shù)據(jù)已超過(guò)2.5億,每天抓取近100M圖像和視頻具有音頻和視覺(jué)功能并帶有注釋。亞馬遜Echo系列音箱已經(jīng)占領(lǐng)了超過(guò)70%的語(yǔ)音助手市場(chǎng)。
Google:具有全世界最大的數(shù)據(jù)庫(kù),專注于應(yīng)用和產(chǎn)品開(kāi)發(fā),而不是長(zhǎng)期的AI研究。GoogleBrain擁有超過(guò)1300名研究人員的團(tuán)隊(duì),在語(yǔ)音助理市場(chǎng)占有23.8%的用戶份額。使用TensorFlow開(kāi)源平臺(tái)進(jìn)行機(jī)器學(xué)習(xí),允許任何人訪問(wèn)機(jī)器學(xué)習(xí)平臺(tái)。Google地球數(shù)據(jù)庫(kù)的大小估計(jì)為3017TB或大約3PB,GoogleStreetView有大約20PB的街景照片。
谷歌很可能在應(yīng)用程序和產(chǎn)品開(kāi)發(fā)及服務(wù)的部署方面都處于最前沿,它不僅是第一家開(kāi)始研究人工智能的公司,而且擁有7萬(wàn)名員工。此外,谷歌擁有一個(gè)深度學(xué)習(xí)人工智能研究項(xiàng)目GoogleBrain,它擁有一個(gè)團(tuán)隊(duì),有自己的研究議程,研究領(lǐng)域涵蓋了機(jī)器學(xué)習(xí)、自然語(yǔ)言理解、機(jī)器學(xué)習(xí)算法和技術(shù),以及機(jī)器人。
Facebook:每日處理2.5B的內(nèi)容和500多TB的數(shù)據(jù),F(xiàn)acebookArticialIntelligenceResearchers(FAIR)有大約80位研究人員和工程師,每天產(chǎn)生20億“贊”和3000萬(wàn)照片,每30分鐘掃描大約105TB的數(shù)據(jù)建有一個(gè)62000平方英尺的數(shù)據(jù)中心,可容納500個(gè)機(jī)架。每天翻譯超過(guò)40種語(yǔ)言的20億用戶帖子,每天有8000萬(wàn)用戶使用這些翻譯。
IBM:計(jì)劃進(jìn)行為期10年、價(jià)值2.4億美元的投資來(lái)創(chuàng)建MIT-IBM沃森人工智能實(shí)驗(yàn)室。在全球擁有2000多名AI員工,在IBM總部擁有超過(guò)600名AI員工,沃森用戶跨越六大洲和超過(guò)25個(gè)國(guó)家,IBM向沃森項(xiàng)目投資10億美元,其中包括1億美元的風(fēng)險(xiǎn)投資。通過(guò)沃森生態(tài)系統(tǒng)建立了7000多個(gè)應(yīng)用。
趨勢(shì)二:算法與技術(shù)的整合
所有在人工智能領(lǐng)域投資的二級(jí)資本公司,比如英特爾、Salesforce和Twitter,都將追隨擁有這些數(shù)據(jù)的大公司,并使用他們的數(shù)據(jù)算法和人工智能。行業(yè)參與者之間將會(huì)發(fā)生數(shù)據(jù)交易,而且很有可能會(huì)整合算法和技術(shù)。數(shù)據(jù)的交易以及算法和技術(shù)的整合將使人工智能變得更加重要。
隨著谷歌和Facebook等規(guī)模更大的公司收購(gòu)小公司,更多的算法將被整合到它們的核心平臺(tái)或解決方案中??偛课挥谟?guó)倫敦的人工智能公司DeepMind,構(gòu)建了通用學(xué)習(xí)算法,被谷歌收購(gòu),以獲得相對(duì)于其他科技公司的商業(yè)優(yōu)勢(shì)。另一方面,F(xiàn)acebook收購(gòu)Wit.ai來(lái)提升自己的語(yǔ)音識(shí)別和語(yǔ)音界面。該公司還收購(gòu)了人工智能創(chuàng)業(yè)公司Ozlo,以完善其M虛擬助理服務(wù)。
趨勢(shì)三:數(shù)據(jù)眾包
所有的人工智能公司都追求巨大的數(shù)據(jù)庫(kù),以實(shí)現(xiàn)他們對(duì)人工智能的雄心壯志。這些公司將開(kāi)始通過(guò)眾包方式獲取大量數(shù)據(jù)。企業(yè)已經(jīng)找到了一種方法來(lái)評(píng)估眾包數(shù)據(jù)的質(zhì)量和真實(shí)性,不僅給企業(yè)提供了便利,還能反饋信息給消費(fèi)者。
OpenDataNow.com的創(chuàng)始人兼編輯JoelGurin表示,“我們生活在一個(gè)眾包文化的環(huán)境中,越來(lái)越多的人愿意和有興趣通過(guò)社交媒體分享他們所知道的東西。”
谷歌通過(guò)眾包的方式,獲得了大量的圖片,并構(gòu)建了成像算法。該公司還利用眾包來(lái)幫助改善服務(wù),比如翻譯、轉(zhuǎn)錄、手寫(xiě)識(shí)別和地圖應(yīng)用。而亞馬遜還利用眾包的技術(shù)改善了Alexa的1.5萬(wàn)項(xiàng)現(xiàn)有技能。
趨勢(shì)四:更多的并購(gòu)將發(fā)生
CBInsights的統(tǒng)計(jì)數(shù)據(jù)顯示,AI公司的收購(gòu)競(jìng)爭(zhēng)已經(jīng)開(kāi)始。2018年將是我們能看到的最多的公司收購(gòu)和被收購(gòu)的一年,因?yàn)檫@些公司必須爭(zhēng)奪知識(shí)資本和人才才不會(huì)被淘汰。機(jī)器學(xué)習(xí)/人工智能的所有小公司都將被大公司收購(gòu)。有兩個(gè)原因:
AI在沒(méi)有數(shù)據(jù)庫(kù)的幫助下沒(méi)法工作。因?yàn)榇蠊緭碛写罅康臄?shù)據(jù)庫(kù),他們將對(duì)那些小公司造成巨大的壓力。沒(méi)有數(shù)據(jù)庫(kù)的支持,算法將毫無(wú)用處。同樣如果沒(méi)有算法,數(shù)據(jù)幾乎也毫無(wú)用處。數(shù)據(jù)是算法的核心,大量的數(shù)據(jù)是至關(guān)重要的。哥倫比亞大學(xué)創(chuàng)意機(jī)器人實(shí)驗(yàn)室的機(jī)器人工程師和總監(jiān)HodLipson說(shuō),“數(shù)據(jù)是燃料,算法是引擎”。
趨勢(shì)五:開(kāi)放民主化的工具將獲得市場(chǎng)份額
大公司將開(kāi)始開(kāi)放他們的算法和其他工具,以獲得市場(chǎng)份額。以市場(chǎng)為基礎(chǔ)的數(shù)據(jù)和算法進(jìn)入壁壘將會(huì)減少,人工智能的新應(yīng)用將會(huì)增加。通過(guò)開(kāi)放平臺(tái)和民主化,那些無(wú)法使用人工智能工具的小公司將可以獲得大量的數(shù)據(jù)來(lái)研究人工智能算法。
正如谷歌首席執(zhí)行官桑達(dá)爾·皮查伊(SundarPichai)在談到民主化的人工智能時(shí)所說(shuō)的那樣,“我們所能做的最激動(dòng)人心的事情之一就是讓機(jī)器學(xué)習(xí)和人工智能變得不再那么神秘。讓所有人都能接觸到這一點(diǎn)很重要?!贝送猓琭rameworks、SDKsandAPIs將成為所有主要廠商對(duì)消費(fèi)者開(kāi)放使用的標(biāo)準(zhǔn)。所有的公司都將采用SaaS&PaaS商業(yè)模式。
趨勢(shì)六:人機(jī)交互將得到改善
Siri和Alexa大概是目前最受歡迎的人機(jī)交互工具,與之類(lèi)似的更多基于機(jī)器人的解決方案將是人工智能公司進(jìn)入這個(gè)行業(yè)的門(mén)檻。例如,雖然機(jī)器已經(jīng)被編程用于語(yǔ)音分析和面部識(shí)別,但機(jī)器還得做到根據(jù)你的聲音來(lái)識(shí)別你的情緒,也就是進(jìn)行情緒分析。
制造自動(dòng)化和非消費(fèi)者焦點(diǎn)解決方案將是第一個(gè)要改進(jìn)的解決方案/應(yīng)用程序。制造自動(dòng)化將主要?dú)w功于人工成本節(jié)約,使用包括自動(dòng)化、機(jī)器人和先進(jìn)制造技術(shù)。非消費(fèi)者解決方案的改進(jìn),例如在農(nóng)業(yè)和醫(yī)藥領(lǐng)域執(zhí)行任務(wù)的人機(jī)交互,也將在2018年流行起來(lái)。
趨勢(shì)七:人工智能將漸漸地對(duì)所有垂直領(lǐng)域產(chǎn)生影響
制造、客戶服務(wù)、保健、醫(yī)療保健和交通運(yùn)輸?shù)念I(lǐng)域已經(jīng)受到AI的影響,自動(dòng)駕駛汽車(chē)預(yù)計(jì)將在2018年上市。明年,會(huì)有更多的領(lǐng)域受到人工智能的影響。以下是人工智能對(duì)不同行業(yè)影響的例子:
保險(xiǎn)——AI將通過(guò)自動(dòng)化改進(jìn)索賠流程。
法律——NLP可以在幾分鐘內(nèi)總結(jié)成千上萬(wàn)頁(yè)的法律文件,從而減少查閱時(shí)間和提高效率。
PR&media——AI將幫助快速處理數(shù)據(jù)。
教育——虛擬導(dǎo)師的發(fā)展;人工智能幫助打分?jǐn)?shù);制定適應(yīng)性學(xué)習(xí)計(jì)劃,游戲和軟件;以AI為導(dǎo)向的個(gè)性化教育計(jì)劃將改變學(xué)生和老師的互動(dòng)。
健康——機(jī)器學(xué)習(xí)可用于創(chuàng)建更復(fù)雜,更準(zhǔn)確的方法來(lái)在患者出現(xiàn)癥狀之前預(yù)測(cè)疾病
正如工業(yè)革命在100年前幾乎改變了一切一樣,人工智能將在未來(lái)幾年改變這個(gè)世界。
趨勢(shì)八:安全、隱私及倫理道德問(wèn)題
在人工智能的保護(hù)傘下,諸如機(jī)器學(xué)習(xí)和大數(shù)據(jù)等問(wèn)題,都很容易觸及到安全及隱私問(wèn)題。有時(shí)基礎(chǔ)設(shè)施扮演著很重要的角色。與隱私問(wèn)題有關(guān)的安全需求,如將銀行帳戶和健康信息保密,將會(huì)對(duì)研究的安全性有更大的要求。2018年,有關(guān)安全和隱私的問(wèn)題將得到解決,這一年,也是人工智能可能出現(xiàn)新的發(fā)展的一年。
人工智能的倫理問(wèn)題也將成為2018年的主要問(wèn)題,需要解決的倫理和道德問(wèn)題包括人工智能對(duì)人類(lèi)有哪些好處和壞處。人們也對(duì)機(jī)器人取代人類(lèi)的可能性感到擔(dān)憂,比如護(hù)士、治療師或警察,另一個(gè)需要處理的問(wèn)題是自主武器。
評(píng)論
查看更多