人工智能賦能的數(shù)據(jù)管理、分析與系統(tǒng)專刊前言
來源:《軟件學(xué)報(bào)》,作者李戰(zhàn)懷等
大數(shù)據(jù)時(shí)代,數(shù)據(jù)規(guī)模龐大,數(shù)據(jù)管理應(yīng)用場景復(fù)雜,傳統(tǒng)數(shù)據(jù)庫和數(shù)據(jù)管理技術(shù)面臨很大的挑戰(zhàn).人工智能技術(shù)因其強(qiáng)大的學(xué)習(xí)、推理、規(guī)劃能力,為數(shù)據(jù)庫系統(tǒng)提供了新的發(fā)展機(jī)遇.??瘡?qiáng)調(diào)數(shù)據(jù)管理與人工智能的深度融合,研究人工智能賦能的數(shù)據(jù)庫新技術(shù)和新型系統(tǒng),包括兩方面:(1)傳統(tǒng)數(shù)據(jù)管理、數(shù)據(jù)分析技術(shù)及系統(tǒng)與人工智能相結(jié)合,將會(huì)煥發(fā)新的生機(jī);(2)大數(shù)據(jù)管理與分析是新一代人工智能技術(shù)發(fā)展的基石.因此,圍繞傳統(tǒng)數(shù)據(jù)管理的不同技術(shù)層面,需要新的理論和系統(tǒng)經(jīng)驗(yàn).專刊重點(diǎn)圍繞數(shù)據(jù)庫核心技術(shù),探討數(shù)據(jù)管理與人工智能的深度融合,探討在人工智能大潮下,傳統(tǒng)數(shù)據(jù)管理技術(shù)、數(shù)據(jù)分析技術(shù)與數(shù)據(jù)庫系統(tǒng)受到的影響、契機(jī)與應(yīng)對策略,通過數(shù)據(jù)管理與人工智能融合,重點(diǎn)關(guān)注人工智能賦能新技術(shù)對傳統(tǒng)數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、索引、查詢、統(tǒng)計(jì)分析以及數(shù)據(jù)管理系統(tǒng)的促進(jìn)和提升.
本??撐木ㄟ^了形式審查,內(nèi)容涉及人工智能賦能的數(shù)據(jù)管理、分析與系統(tǒng).特約編輯先后邀請了 60 多位專家參與審稿工作,最終有18 篇論文入選本???根據(jù)主題,這些論文可以分為5 組.
(1)人工智能賦能的數(shù)據(jù)管理技術(shù)
《人工智能賦能的數(shù)據(jù)管理技術(shù)研究》綜述人工智能賦能的數(shù)據(jù)管理新技術(shù)的研究進(jìn)展,總結(jié)了現(xiàn)有方法的問題和解決思路,并對未來研究方向進(jìn)行展望.
《基于中間層的可擴(kuò)展學(xué)習(xí)索引技術(shù)》提出了基于中間層的可擴(kuò)展學(xué)習(xí)型索引模型Dabble,從而解決索引更新引發(fā)的模型重訓(xùn)練問題.
《面向關(guān)系數(shù)據(jù)庫的智能索引調(diào)優(yōu)方法》提出一種面向關(guān)系數(shù)據(jù)庫系統(tǒng)的智能索引調(diào)優(yōu)技術(shù),利用機(jī)器學(xué)習(xí)方法構(gòu)造索引的量化模型,可以準(zhǔn)確地對索引的查詢優(yōu)化效果進(jìn)行估計(jì),并設(shè)計(jì)了一種高效的最優(yōu)索引選擇算法,實(shí)現(xiàn)了快速的從候選索引空間中選擇滿足給定大小約束的最優(yōu)的索引組合.
《基于時(shí)空相關(guān)屬性模型的公交到站時(shí)間預(yù)測算法》提出一種基于深度神經(jīng)網(wǎng)絡(luò)的公交到站時(shí)間預(yù)測算法,采用時(shí)空組件、屬性組件和融合組件預(yù)測公交車輛從起點(diǎn)站到終點(diǎn)站的總時(shí)長.
(2)數(shù)據(jù)處理與優(yōu)化技術(shù)
《面向數(shù)據(jù)特征的內(nèi)存跳表優(yōu)化技術(shù)》給出條件社區(qū)搜索問題的形式化定義,使用布爾表達(dá)式表示搜索條件,提出解決條件社區(qū)搜索問題的通用框架及其優(yōu)化方法,將條件社區(qū)搜索分解為多個(gè)單項(xiàng)條件社區(qū)搜索.
《面向區(qū)塊鏈的高效物化視圖維護(hù)和可信查詢》提出一種面向區(qū)塊鏈的高效物化視圖機(jī)制,將視圖維護(hù)操作與共識(shí)過程同時(shí)執(zhí)行,降低該操作對系統(tǒng)性能的影響;使用字典樹加快以區(qū)塊為單位的多物化視圖維護(hù)進(jìn)程;以默克爾驗(yàn)證的方式確保物化結(jié)果不被惡意篡改,進(jìn)而確保查詢結(jié)果可信.
《時(shí)間約束的實(shí)體解析中記錄對排序研究》提出基于二分圖上相似性傳播的記錄匹配可能性計(jì)算方法,將記錄對、塊及其關(guān)聯(lián)關(guān)系構(gòu)建二分圖;相似性沿著二分圖不斷地在記錄對結(jié)點(diǎn)與塊結(jié)點(diǎn)之間傳播,直到收斂.收斂結(jié)果可以通過不動(dòng)點(diǎn)計(jì)算得到.提出了近似的收斂計(jì)算方法來降低計(jì)算代價(jià),從而保證實(shí)體解析的實(shí)時(shí)召回率
(3)人工智能賦能的數(shù)據(jù)分析與推薦
《面向多維稀疏數(shù)據(jù)倉庫的欺詐銷售行為挖掘》提出基于分割率的特征提取方法和基于張量重構(gòu)的掛單行為挖掘算法;設(shè)計(jì)了基于掛單模式偏序格的特征提取方法,對銷售數(shù)據(jù)集中存在的掛單行為進(jìn)行分類.
《基于相關(guān)性分析的工業(yè)時(shí)序數(shù)據(jù)異常檢測》提出一種基于序列相關(guān)性分析的多維時(shí)間序列異常檢測方法.對多維時(shí)間序列進(jìn)行分段、標(biāo)準(zhǔn)化計(jì)算,得到相關(guān)性矩陣,提取量化的相關(guān)關(guān)系.然后,建立了時(shí)序相關(guān)圖模型,通過在時(shí)序相關(guān)圖上的相關(guān)性強(qiáng)度,劃分時(shí)間序列團(tuán),進(jìn)行時(shí)間序列團(tuán)內(nèi)、團(tuán)間以及單維的異常檢測.
《基于圖神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)網(wǎng)絡(luò)異常檢測算法》提出了基于圖神經(jīng)網(wǎng)絡(luò)的異常檢測算法,將圖結(jié)構(gòu)、屬性,以及動(dòng)態(tài)變化的信息引入模型中,以學(xué)習(xí)進(jìn)行異常檢測的表示向量.
《融合選擇提取與子類聚類的快速Shapelet 發(fā)現(xiàn)算法》提出一種快速時(shí)間序列Shapelet 發(fā)現(xiàn)算法,通過對原始訓(xùn)練集采用時(shí)間序列聚類,可以得到原始時(shí)間序列中沒有的Shapelet,同時(shí)在選擇性提取算法中加入投票機(jī)制,以解決產(chǎn)生Shapelet 過多的問題.
《基于注意力機(jī)制的規(guī)范化矩陣分解推薦算法》提出一種基于注意力機(jī)制的規(guī)范化矩陣分解模型,依據(jù)用戶信任網(wǎng)絡(luò)和評(píng)分記錄構(gòu)建用戶-項(xiàng)目異構(gòu)網(wǎng)絡(luò),并構(gòu)建用戶間的相似關(guān)系;引入注意力機(jī)制分析用戶對項(xiàng)目各個(gè)屬性特征不同的關(guān)注度來獲取更準(zhǔn)確的用戶偏好.
《融合顯式反饋與隱式反饋的協(xié)同過濾推薦算法》提出一種融合顯式反饋與隱式反饋的協(xié)同過濾推薦算法.利用加權(quán)低秩近似處理隱式反饋數(shù)據(jù),訓(xùn)練出隱式用戶/物品向量;引入基線評(píng)估,將隱式用戶/物品向量作為補(bǔ)充,通過顯隱式用戶/物品向量結(jié)合,訓(xùn)練得出用戶對物品的預(yù)測偏好程度.
(4)人工智能賦能的數(shù)據(jù)庫系統(tǒng)
《學(xué)習(xí)式數(shù)據(jù)庫系統(tǒng):挑戰(zhàn)與機(jī)遇》提出一種細(xì)粒度的分類體系,從數(shù)據(jù)庫架構(gòu)出發(fā),將現(xiàn)有工作進(jìn)行了梳理,系統(tǒng)地介紹了學(xué)習(xí)式數(shù)據(jù)庫各組件的研究動(dòng)機(jī)、基本思路與關(guān)鍵技術(shù),并對學(xué)習(xí)式數(shù)據(jù)庫系統(tǒng)未來的研究方向進(jìn)行了展望.
《軒轅:AI 原生數(shù)據(jù)庫系統(tǒng)》提出了原生的支持人工智能的數(shù)據(jù)庫系統(tǒng),將各種人工智能技術(shù)集成到數(shù)據(jù)庫中,以提供自監(jiān)控、自配置、自優(yōu)化、自診斷、自愈、自安全和自組裝功能,并通過聲明性語言讓數(shù)據(jù)庫提供人工智能功能,以降低人工智能使用門檻.
(5)人工智能賦能的數(shù)據(jù)應(yīng)用
《基于PSP_HDP 主題模型的非結(jié)構(gòu)化經(jīng)濟(jì)指標(biāo)挖掘》根據(jù)人工構(gòu)建非結(jié)構(gòu)化經(jīng)濟(jì)指標(biāo)的局限性,以及主題模型在非結(jié)構(gòu)化經(jīng)濟(jì)指標(biāo)挖掘中存在的問題,結(jié)合已有經(jīng)濟(jì)領(lǐng)域分類標(biāo)準(zhǔn)、詞語之間的語義關(guān)系和詞語對主題的代表性,定義了文檔的領(lǐng)域隸屬度、詞語與主題的語義相關(guān)度和詞語對主題的貢獻(xiàn)度,提出相應(yīng)的主題模型,提高了經(jīng)濟(jì)主題的區(qū)分度和辨識(shí)度,可以更有效地挖掘與經(jīng)濟(jì)有關(guān)的經(jīng)濟(jì)主題和經(jīng)濟(jì)要素詞.
《機(jī)器學(xué)習(xí)中的隱私攻擊與防御》分析了機(jī)器學(xué)習(xí)模型的訓(xùn)練集在數(shù)據(jù)采集、模型訓(xùn)練等各個(gè)環(huán)節(jié)中存在的隱私泄露風(fēng)險(xiǎn)為人工智能環(huán)境下的數(shù)據(jù)管理所提出的挑戰(zhàn),指出傳統(tǒng)數(shù)據(jù)管理中的隱私保護(hù)方法無法滿足機(jī)器學(xué)習(xí)中多個(gè)環(huán)節(jié)、多種場景下的隱私保護(hù)要求,總結(jié)并展望了機(jī)器學(xué)習(xí)技術(shù)中隱私攻擊與防御的研究進(jìn)展和趨勢.
《數(shù)據(jù)集成方法發(fā)展與展望》綜述數(shù)據(jù)集成領(lǐng)域從2001 年開始到現(xiàn)在的相關(guān)工作的發(fā)展脈絡(luò),并展望了未來在數(shù)據(jù)集成領(lǐng)域的潛在研究方向.
本??饕嫦驍?shù)據(jù)庫、數(shù)據(jù)挖掘、大數(shù)據(jù)、機(jī)器學(xué)習(xí)、推薦系統(tǒng)等多領(lǐng)域的研究人員和工程人員,反映了我國學(xué)者在人工智能賦能的數(shù)據(jù)管理、分析與系統(tǒng)領(lǐng)域最新的研究進(jìn)展.感謝《軟件學(xué)報(bào)》編委會(huì)和數(shù)據(jù)庫專委會(huì)對??ぷ鞯闹笇?dǎo)和幫助,感謝??w評(píng)審專家及時(shí)、耐心、細(xì)致的評(píng)審工作,感謝踴躍投稿的所有作者.希望本??軌?qū)θ斯ぶ悄苜x能的數(shù)據(jù)管理、分析與系統(tǒng)相關(guān)領(lǐng)域的研究工作有所促進(jìn).
審核編輯:符乾江
-
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238247 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8882瀏覽量
137396 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5500瀏覽量
121111
發(fā)布評(píng)論請先 登錄
相關(guān)推薦
評(píng)論