RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于Elastic Search的推薦系統(tǒng)“召回”策略的介紹

電子設(shè)計 ? 來源:電子設(shè)計 ? 作者:電子設(shè)計 ? 2020-12-10 22:13 ? 次閱讀

當(dāng)我們打開一個資訊APP刷新聞時,有沒有想過,系統(tǒng)是如何迅速推送給我們想看的內(nèi)容?資訊APP背后有一個巨大的內(nèi)容池,系統(tǒng)是如何判斷要不要將某條資訊推送給我們的呢?這就是今天想跟大家探討的問題——推薦系統(tǒng)中的“召回”策略。

推薦系統(tǒng)中的召回

召回策略主要滿足的是能夠從海量的數(shù)據(jù)中召回一部分相關(guān)的候選集,在實現(xiàn)方法上也有很多種,主要可以分為離線召回和在線召回。離線召回的方法主要有協(xié)同過濾、聚類算法。協(xié)同過濾可以分為基于用戶的協(xié)同過濾和基于物品的協(xié)同過濾。在線召回主要是基于搜索的方式,從該用戶的歷史記錄中利用不同的算法抽取相關(guān)信息,這里的相關(guān)信息可以是物品的基本信息,也可以是離線標(biāo)注的標(biāo)簽,然后將這些抽取到的關(guān)鍵信息從索引中快速的查詢出相關(guān)的結(jié)果集。

Elastic Search與TF-IDF

Elastic Search是基于Apache Lucene(TM)的一個開源搜索引擎,是一個分布式且具有高擴展性的全文檢索的搜索引擎,而且還提供了近乎實時的索引、分析、搜索功能。 Lucene是現(xiàn)今搜索領(lǐng)域被認為速度最快、性能最穩(wěn)定、功能最全的搜索引擎庫,而Elastic Search是以Lucene為核心進行二次開發(fā)的搜索引擎,主要完成索引和搜索的功能,它可以通過簡單的接口隱藏Lucene的復(fù)雜性,從而讓整個搜索引擎變得更方便。

在基于內(nèi)容推薦的算法中,關(guān)鍵詞的提取是至關(guān)重要的一環(huán),關(guān)鍵詞提取直接影響了物品相似度計算的效果。假如沒有關(guān)鍵詞提取的話,物品全部信息作為特征維度會造成維度災(zāi)難,使得維度巨大,且構(gòu)造的矩陣會相當(dāng)稀疏,不利于計算。在關(guān)鍵詞提取的過程中,TF-IDF算法是很有效率的一種算法。關(guān)于TF-IDF算法我們不再這里展開詳述。

Elastic Search與推薦系統(tǒng)的結(jié)合

Elastic Search的搭建過程可以參考官網(wǎng)。安裝配置完成Elastic Search之后,當(dāng)數(shù)據(jù)進入Elastic Search并完成分詞和索引以后,現(xiàn)在只能夠根據(jù)指定輸入的詞語進行搜索,與推薦系統(tǒng)并沒有任何聯(lián)系。因此,我們可以根據(jù)用戶的歷史記錄進行TF-IDF構(gòu)造關(guān)鍵詞并且輸入Elastic Search,采用倒排索引的方式進行存儲,以便全文搜索。

簡單來說,用戶的瀏覽、收藏等行為會被記錄在數(shù)據(jù)庫中,推薦系統(tǒng)會收集用戶的各種行為記錄,利用TF-IDF關(guān)鍵詞提取算法,實現(xiàn)一個概率模型,這個概率模型可以計算出近期用戶記錄中用戶偏好的關(guān)鍵詞,由于這些關(guān)鍵詞由用戶的記錄產(chǎn)生,因此就具有了個性化的特性,再將關(guān)鍵詞輸入到Elastic Search,就可以召回與用戶強相關(guān)的內(nèi)容集合。

利用這種方法搭建的推薦系統(tǒng),其優(yōu)勢也很明顯:一是能夠?qū)?nèi)容池中的所有物料做可計算的精細整合,實現(xiàn)對所有物料的召回,特別是對長尾物料的召回,從而極大地提高物料利用率;二是自帶物品冷啟動,在沒有大量用戶數(shù)據(jù)的情況下也能實現(xiàn)個性化推薦,并且讓用戶對推薦結(jié)果滿意。

獲取更多詳細資料,或申請產(chǎn)品試用,歡迎訪問第四范式智能推薦產(chǎn)品先薦官網(wǎng)!本賬號為第四范式智能推薦產(chǎn)品先薦的官方賬號。本賬號立足于計算機領(lǐng)域,特別是人工智能相關(guān)的前沿研究,旨在把更多與人工智能相關(guān)的知識分享給公眾,從專業(yè)的角度促進公眾對人工智能的理解;同時也希望為人工智能相關(guān)人員提供一個討論、交流、學(xué)習(xí)的開放平臺,從而早日讓每個人都享受到人工智能創(chuàng)造的價值。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47183

    瀏覽量

    238246
  • 推薦系統(tǒng)
    +關(guān)注

    關(guān)注

    1

    文章

    43

    瀏覽量

    10075
收藏 人收藏

    評論

    相關(guān)推薦

    電動汽車充電策略與電力系統(tǒng)影響研究

    個性化快充導(dǎo)航及源荷協(xié)同有序充電策略,分析其對解決上述問題、提升用戶體驗和保障電力系統(tǒng)穩(wěn)定運行的意義,還闡述了電動汽車的負荷特性、接入影響及減少影響的措施,并介紹了相關(guān)系統(tǒng)構(gòu)成和應(yīng)用實
    的頭像 發(fā)表于 12-17 14:35 ?103次閱讀
    電動汽車充電<b class='flag-5'>策略</b>與電力<b class='flag-5'>系統(tǒng)</b>影響研究

    EM儲能網(wǎng)關(guān)&amp;amp;ZWS智慧儲能云應(yīng)用(5) — 削峰填谷策略接入介紹(二)

    導(dǎo)讀ZWS智慧儲能云平臺,作為儲能系統(tǒng)的專業(yè)運維管理平臺。對于電站的削峰填谷策略,是如何對接的了?上篇介紹了削峰填谷的主要功能,本篇,將介紹,儲能
    的頭像 發(fā)表于 11-22 01:06 ?139次閱讀
    EM儲能網(wǎng)關(guān)&amp;amp;ZWS智慧儲能云應(yīng)用(5) — 削峰填谷<b class='flag-5'>策略</b>接入<b class='flag-5'>介紹</b>(二)

    什么是回歸測試_回歸測試的測試策略

    是否在新軟件版本上再次出現(xiàn)。 2、測試策略 回歸測試的策略一般由測試經(jīng)理或測試組長制定,初級軟件測試人員只要按相應(yīng)的策略執(zhí)行測試即可?,F(xiàn)以XYC郵箱的測試為例,簡要介紹一下回歸測試的基
    的頭像 發(fā)表于 11-14 16:44 ?219次閱讀

    榮耀手機新增谷歌Circle to Search功能

    近日,全球知名科技品牌榮耀宣布,在其旗艦智能手機HONOR Magic V3及HONOR 200系列上,正式推出谷歌(Google)Circle to Search功能。這一創(chuàng)新功能將為用戶帶來更加便捷、直觀的搜索體驗。
    的頭像 發(fā)表于 10-17 18:16 ?680次閱讀

    存在短路風(fēng)險,10萬輛比亞迪召回!全球汽車召回事件為何頻發(fā)

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)在9月底,比亞迪宣布召回近10萬輛車輛,包括海豚、元Plus兩款車型,引起了很大的關(guān)注。確實,今年比亞迪的銷量一直高歌猛漲,出現(xiàn)召回事件,自然會吸引更多目光。今年9月
    的頭像 發(fā)表于 10-11 09:09 ?6710次閱讀

    TCS系統(tǒng)的核心控制策略與方法

    策略與方法 控制策略:TCS系統(tǒng)運用了一系列高級控制理論,包括邏輯閾值、比例積分微分(PID)控制、模糊邏輯和神經(jīng)網(wǎng)絡(luò)技術(shù)。這些控制策略使系統(tǒng)
    的頭像 發(fā)表于 08-29 11:25 ?601次閱讀

    微電網(wǎng)能量管理系統(tǒng)策略控制怎么實現(xiàn)

    , MEMS)作為微電網(wǎng)的大腦,其策略控制如何實現(xiàn),直接關(guān)系到微電網(wǎng)的穩(wěn)定運行和能源的高效利用。本文將從策略控制的角度出發(fā),深入探討微電網(wǎng)能量管理系統(tǒng)的實現(xiàn)原理與深度思考。 ? 1 微電網(wǎng)能量管理
    的頭像 發(fā)表于 07-03 18:29 ?527次閱讀

    電機控制系統(tǒng)的神經(jīng)網(wǎng)絡(luò)優(yōu)化策略

    電機控制系統(tǒng)作為現(xiàn)代工業(yè)自動化的核心組成部分,其性能直接影響到整個生產(chǎn)線的效率和穩(wěn)定性。隨著人工智能技術(shù)的快速發(fā)展,神經(jīng)網(wǎng)絡(luò)在電機控制系統(tǒng)中的應(yīng)用越來越廣泛。神經(jīng)網(wǎng)絡(luò)優(yōu)化策略通過模擬人腦神經(jīng)元的連接
    的頭像 發(fā)表于 06-25 11:46 ?645次閱讀

    探究電池儲能系統(tǒng)恒功率削峰填谷策略

    摘要: 以南方電網(wǎng)MW級電池儲能示范工程為背景,以求解采用恒功率充放電策略運行的電池儲能系統(tǒng)削峰填谷策略為目的,提出了電池儲能系統(tǒng)恒功率削峰填谷優(yōu)化模型及求解該模型的實用簡化算法。該算
    的頭像 發(fā)表于 05-23 15:14 ?1596次閱讀
    探究電池儲能<b class='flag-5'>系統(tǒng)</b>恒功率削峰填谷<b class='flag-5'>策略</b>

    法拉第未來完成安全更新并召回所有FF91汽車

    今年3月,法拉第未來針對去年生產(chǎn)的全部FF91車型展開首次召回(共計11輛)。美國國家公路交通安全管理局(NHTSA)記錄的召回信息表明
    的頭像 發(fā)表于 04-08 15:54 ?419次閱讀

    2023年中國汽車與消費品召回情況

    在汽車召回部分,2023年新能源汽車受到關(guān)注,有72次因缺陷被召回,涉及車輛數(shù)達到160.3萬輛,占全年召回總體量的23.8%。這一數(shù)字較去年同期增長了32.3%,達到了新的歷史高峰。
    的頭像 發(fā)表于 03-13 10:16 ?568次閱讀

    protues添加通過component search engine 下載的電子元件模型后閃退

    protues添加通過component search engine 下載的電子元件模型后就閃退,流程是通過“庫-Import Parts\",然后就按照提示一直選擇下去,添加從搜索引擎
    發(fā)表于 02-15 13:00

    Browser Company推出AI搜索工具Arc Search,助您快速便捷找到所需

    Arc Search 的獨特之處在于其提供的“瀏覽為我尋找”功能,此乃由 OpenAI 等多家技術(shù)巨頭聯(lián)合打造,通過對多達六個網(wǎng)頁的深度解析,收集有效信息并生成新的頁面,以滿足用戶需求。
    的頭像 發(fā)表于 01-31 10:15 ?771次閱讀

    韓國召回7.2萬輛特斯拉汽車,Autopilot系統(tǒng)存安全隱患

    問題車輛占據(jù)總召回車輛數(shù)的88%,且大部分問題主要來源于特斯拉的Autopilot系統(tǒng)。這一先進的駕駛員輔助系統(tǒng)可以自行識別周圍環(huán)境,并調(diào)整車速、維持安全間距及轉(zhuǎn)換車道,但經(jīng)檢測發(fā)現(xiàn)其存在潛在安全隱患,即可能不能有效地發(fā)出警示聲
    的頭像 發(fā)表于 01-08 10:12 ?474次閱讀

    逆變電路的控制策略與方法介紹

    逆變電路的控制策略與方法主要包括脈沖寬度調(diào)制(PWM)、空間矢量脈寬調(diào)制(SVPWM)、諧振軟開關(guān)(RRS)等。這些控制策略和方法可以實現(xiàn)對逆變電路輸出電壓的穩(wěn)定、高效和低諧波控制,提高整個系統(tǒng)
    的頭像 發(fā)表于 12-27 17:14 ?1711次閱讀
    逆變電路的控制<b class='flag-5'>策略</b>與方法<b class='flag-5'>介紹</b>
    RM新时代网站-首页