作者:京東科技 賈玉龍
1 背景
隨著智能手機的普及和移動互聯(lián)網(wǎng)的發(fā)展,短信作為一種傳統(tǒng)的通訊方式,仍然保持著其獨特的地位。然而,隨著垃圾短信的泛濫,手機自動識別垃圾短信的技術(shù)也在不斷進步。對于提供服務(wù)的企業(yè)來說,如何讓自己的服務(wù)短信不被識別為垃圾短信,而讓用戶能夠看到,成為了一個亟待解決的問題。本文將深入探討手機自動識別垃圾短信的邏輯。
2 手機自動識別垃圾短信的邏輯
2.1 垃圾短信的定義與特征
垃圾短信通常指未經(jīng)用戶同意或請求,向其發(fā)送的具有廣告、推銷、欺詐等性質(zhì)的短信。這些短信往往具有以下特征:
?內(nèi)容重復:垃圾短信的內(nèi)容往往具有高度的重復性,如頻繁出現(xiàn)的促銷信息、貸款廣告等。
?發(fā)送頻率高:垃圾短信的發(fā)送頻率通常較高,有時甚至在短時間內(nèi)連續(xù)發(fā)送多條。
?發(fā)送者不明確:垃圾短信的發(fā)送者往往不明確,或者使用的是偽造的號碼。
?含有敏感詞匯:垃圾短信中常含有一些敏感詞匯,如“中獎”、“貸款”、“促銷”等。
2.2 手機自動識別垃圾短信的技術(shù)
手機自動識別垃圾短信的技術(shù)主要基于文本分析、機器學習、用戶行為等多種方法。以下是一些常見的識別邏輯:
?關(guān)鍵詞匹配:手機會預先設(shè)定一些敏感詞匯庫,當短信內(nèi)容中包含這些詞匯時,會將其標記為垃圾短信。
?文本相似性檢測:手機會對接收到的短信進行文本相似性檢測,如果與已知的垃圾短信內(nèi)容相似度較高,則會被標記為垃圾短信。
?用戶行為分析:手機會根據(jù)用戶的行為習慣,如是否經(jīng)?;貜?、是否標記為垃圾短信等,來判斷短信是否為垃圾短信。
?機器學習算法:手機會利用機器學習算法對短信進行分類,通過訓練模型來識別垃圾短信。
3 手機自動識別垃圾短信的方法
手機自動識別垃圾短信的邏輯和依據(jù)主要包括以下方面:
3.1 內(nèi)容特征分析
? 關(guān)鍵詞匹配:系統(tǒng)內(nèi)置了大量與垃圾短信相關(guān)的關(guān)鍵詞,如“促銷”“免費”“中獎”“辦證”“貸款”“賭博”“博彩”等。當短信內(nèi)容中出現(xiàn)這些關(guān)鍵詞時,手機會提高對該短信的懷疑程度。不過,單純的關(guān)鍵詞匹配容易出現(xiàn)誤判,例如一些正常短信中可能偶爾提及類似詞語,所以通常還會結(jié)合其他因素綜合判斷。
? 語義理解:利用自然語言處理技術(shù)對短信的語義進行分析,理解句子的含義和上下文關(guān)系。例如,一些看似正常的句子,但結(jié)合上下文語境后發(fā)現(xiàn)其意圖是推銷或詐騙等不良行為,手機就會將其識別為垃圾短信。這需要強大的算法和模型支持,能夠準確理解文本的語義,避免因字面意思的誤判。
3.2 發(fā)送行為特征分析
? 發(fā)送頻率:如果一個號碼在短時間內(nèi)頻繁發(fā)送大量短信,超出了正常的通信范圍,那么該號碼發(fā)送的短信就很可能是垃圾短信。比如一些廣告推銷號碼會批量發(fā)送相同或相似內(nèi)容的短信。
? 發(fā)送來源:對于一些來源不明的號碼,特別是一些非正規(guī)的、陌生的號碼段發(fā)送的短信,手機會更加警惕。例如,一些境外號碼發(fā)送的短信,或者是一些不符合正常號碼規(guī)則的號碼發(fā)送的短信,都可能被識別為垃圾短信。
號碼特征分析
? 黑名單比對:手機系統(tǒng)會維護一個垃圾短信發(fā)送號碼的黑名單庫,當接收到的短信來自黑名單中的號碼時,會直接將其識別為垃圾短信。這個黑名單庫可以由手機廠商、運營商或用戶自己添加和更新。
? 號碼異常特征:一些號碼可能存在異常特征,比如號碼格式不規(guī)范、號碼位數(shù)不對等,這些號碼發(fā)送的短信也容易被識別為垃圾短信。
鏈接和圖片特征分析
? 惡意鏈接檢測:如果短信中包含鏈接,手機會對鏈接進行檢測,判斷其是否為惡意鏈接。惡意鏈接可能會引導用戶進入釣魚誘導網(wǎng)站、下載惡意軟件等,對用戶的手機安全造成威脅。檢測方法包括分析鏈接的域名、IP地址、頁面內(nèi)容等。
? 圖片特征識別:對于一些包含圖片的短信,手機會對圖片進行分析,識別圖片中的內(nèi)容是否與垃圾短信相關(guān)。例如,圖片中包含廣告信息、色情內(nèi)容等,就會被認定為垃圾短信。
用戶反饋和機器學習
? 用戶反饋:用戶可以手動將一些短信標記為垃圾短信,手機系統(tǒng)會根據(jù)用戶的反饋對這些短信的特征進行學習和記錄,以便在未來更好地識別類似的垃圾短信。
? 機器學習算法:一些手機廠商會利用機器學習算法,對大量的短信數(shù)據(jù)進行訓練和學習,不斷優(yōu)化垃圾短信的識別模型。通過分析大量的樣本短信,模型可以自動提取出垃圾短信的特征和模式,提高識別的準確率和效率。
4 主流手機廠商識別垃圾短信的邏輯
不同手機廠商過濾垃圾短信、識別垃圾短信的邏輯各有特點,以下是一些常見手機廠商的具體情況:
4.1 華為
? 智能神經(jīng)網(wǎng)絡(luò)算法:在最新的 EMUI 系統(tǒng)中,短信的攔截引擎采用智能的神經(jīng)網(wǎng)絡(luò)算法。該算法通過對大量短信數(shù)據(jù)的學習和分析,能夠自動識別短信的模式和特征,從而判斷短信是否為垃圾短信。這種方式提高了攔截識別的能力,同時大大降低了“誤攔”和“漏攔”發(fā)生的概率。
? 關(guān)鍵詞匹配與語義理解:系統(tǒng)內(nèi)置了一系列與垃圾短信相關(guān)的關(guān)鍵詞,當短信內(nèi)容中出現(xiàn)這些關(guān)鍵詞時,會觸發(fā)垃圾短信的初步判斷。并且,華為手機還具備一定的語義理解能力,能夠結(jié)合上下文對短信的含義進行分析,避免單純因關(guān)鍵詞而導致的誤判。例如,如果一條短信中出現(xiàn)了“免費”“中獎”等關(guān)鍵詞,但結(jié)合上下文發(fā)現(xiàn)是朋友之間的玩笑話,就不會被誤判為垃圾短信。
? 號碼特征分析:對發(fā)送短信的號碼進行分析,包括號碼的來源、格式等。對于一些來源不明、號碼格式異?;蛘呤潜粯擞洖椴涣嫉奶柎a發(fā)送的短信,會提高警惕。同時,華為手機還會不斷更新和維護一個號碼黑名單庫,將頻繁發(fā)送垃圾短信的號碼納入其中,后續(xù)來自這些號碼的短信會直接被攔截。
? 用戶反饋與學習:用戶可以手動將一些短信標記為垃圾短信,系統(tǒng)會根據(jù)用戶的反饋對這些短信的特征進行學習和記錄,不斷優(yōu)化垃圾短信的識別模型,提高識別的準確性。
4.2 小米
? 智能攔截功能:MIUI 系統(tǒng)中有“智能攔截”功能,可以把各類垃圾消息智能攔截后歸類到不重要通知。該功能基于多種因素進行判斷,例如短信的發(fā)送頻率、內(nèi)容特征等。如果一個號碼在短時間內(nèi)發(fā)送了大量相似內(nèi)容的短信,或者短信內(nèi)容中包含常見的垃圾短信關(guān)鍵詞,就會被系統(tǒng)攔截。
? 用戶自定義設(shè)置:用戶可以在系統(tǒng)中添加黑白名單,自行設(shè)置需要攔截或放行的號碼。同時,用戶還可以設(shè)置關(guān)鍵詞黑名單和白名單,根據(jù)自己的需求對短信進行過濾。例如,用戶可以將“促銷”“貸款”等關(guān)鍵詞添加到黑名單中,這樣包含這些關(guān)鍵詞的短信就會被攔截;而將一些常用的、正常的關(guān)鍵詞添加到白名單中,確保不會誤攔重要短信。
? 機器學習與更新:小米手機會不斷收集用戶的使用數(shù)據(jù),并通過機器學習算法對這些數(shù)據(jù)進行分析和學習,不斷優(yōu)化垃圾短信的識別模型。隨著使用時間的增加,系統(tǒng)對垃圾短信的識別能力會逐漸提高。
4.3 蘋果
系統(tǒng)自帶的過濾功能:
? 基于機器學習的分類識別:蘋果在iOS系統(tǒng)中內(nèi)置了短信過濾器,其利用機器學習技術(shù)來識別短信是否為垃圾短信以及所屬的類別。通過對大量短信數(shù)據(jù)的學習和分析,系統(tǒng)能夠識別出垃圾短信的特征模式,比如特定的關(guān)鍵詞組合、文本格式、發(fā)送頻率等,從而對新收到的短信進行判斷和分類。例如,如果一條短信中包含大量與推銷、詐騙相關(guān)的常見詞匯,系統(tǒng)就可能將其識別為垃圾短信。
? 信息類別過濾:在iOS 14中,蘋果就為垃圾短信引入了“交易”和“促銷”兩個新的不同類別;iOS 16為短信過濾API增加了12個新的子類別,包括金融、提醒信息、訂單、衛(wèi)生等。這樣可以更精細地對短信進行分類過濾,方便用戶查看和管理不同類型的短信。
? 過濾未知發(fā)件人:用戶開啟“過濾未知發(fā)件人”功能后,來自陌生號碼或不在聯(lián)系人列表中的發(fā)件人的短信會被單獨分類到“未知與過濾信息”中,與正常的短信分開顯示,減少對用戶的干擾。
iMessage的相關(guān)過濾設(shè)置:
? 賬號管理:iMessage是蘋果自帶的即時通訊服務(wù),用戶如果收到大量通過iMessage發(fā)送的垃圾短信,可以刪除用郵箱登陸的賬號,只保留手機號碼。因為很多垃圾短信是通過用戶的郵箱而進行推送的,減少郵箱賬號的使用可以降低收到此類垃圾短信的概率。
? 開啟過濾功能:開啟iMessage的過濾功能后,即使有垃圾短信進來,iPhone也會自動將其分組到【過濾信息】中,不會影響用戶接收其他正常短信。
用戶反饋與訓練:用戶可以手動將某些短信標記為垃圾短信,系統(tǒng)會根據(jù)用戶的反饋進一步學習和優(yōu)化垃圾短信的識別算法。當用戶將一條短信標記為垃圾短信后,系統(tǒng)會記錄該短信的特征,并在后續(xù)的識別過程中更加準確地判斷類似的短信。
第三方應(yīng)用輔助過濾:App Store中有一些第三方的短信過濾應(yīng)用,這些應(yīng)用可以利用先進的智能AI算法等技術(shù),自動識別過濾攔截垃圾短信。它們通常會提供更多的個性化設(shè)置和功能,如按號碼屏蔽、防短信轟炸等,用戶可以根據(jù)自己的需求選擇安裝使用。
4.4 Vivo
? 關(guān)鍵詞與規(guī)則匹配:系統(tǒng)內(nèi)置常見的垃圾短信關(guān)鍵詞庫,當短信內(nèi)容中出現(xiàn)如“促銷”“貸款”“中獎”等關(guān)鍵詞時,會觸發(fā)初步的垃圾短信判斷。同時,Vivo手機還會根據(jù)一些預設(shè)的規(guī)則,如短信發(fā)送頻率異常、號碼來源不明等情況,對短信進行進一步的篩查。
? 智能攔截模式:Vivo手機具備智能攔截功能,通過機器學習算法對大量的短信數(shù)據(jù)進行學習和分析,逐漸掌握垃圾短信的特征和模式,從而提高攔截的準確性。用戶可以在設(shè)置中開啟智能攔截模式,讓系統(tǒng)自動過濾垃圾短信。
? 用戶自定義設(shè)置:用戶可以根據(jù)自己的需求,在手機的設(shè)置中添加短信攔截規(guī)則,例如設(shè)置關(guān)鍵詞黑名單、號碼黑名單等,對特定的短信進行攔截。此外,用戶還可以選擇開啟或關(guān)閉某些類型的短信通知,如營銷短信通知等。
Oppo
? 智能識別與過濾:Oppo手機的系統(tǒng)會自動對收到的短信進行智能分析,識別其中的垃圾短信。通過對短信內(nèi)容的語義理解、關(guān)鍵詞匹配以及發(fā)送號碼的分析等多方面因素的綜合判斷,來確定短信是否為垃圾短信。例如,如果短信內(nèi)容中存在大量的廣告宣傳用語,或者發(fā)送號碼是頻繁發(fā)送垃圾短信的號碼,系統(tǒng)就會將其識別為垃圾短信并進行攔截。
? 偽基站短信攔截:Oppo手機具備偽基站短信攔截功能,能夠識別并攔截偽基站發(fā)送的短信。偽基站是一種非法的通信設(shè)備,可以偽裝成正規(guī)的基站向手機用戶發(fā)送短信,其中很多都是垃圾短信或詐騙短信。Oppo手機通過對信號特征的分析和識別,能夠判斷出短信是否來自偽基站,并及時進行攔截。
? 用戶反饋與學習:Oppo手機支持用戶手動標記垃圾短信,用戶將某條短信標記為垃圾短信后,系統(tǒng)會記錄該短信的特征,并根據(jù)用戶的反饋不斷學習和優(yōu)化垃圾短信的識別算法,提高攔截的準確性。
4.5 三星
? 模式識別技術(shù):三星手機利用模式識別技術(shù)對短信進行分析。通過對大量垃圾短信樣本的學習,建立起各種垃圾短信的模式模型。當接收到新的短信時,系統(tǒng)會將其與已建立的模式模型進行對比,如果匹配度較高,則判斷為垃圾短信。這種方式可以有效地識別出一些具有特定模式的垃圾短信,如詐騙短信、推銷短信等。
? 號碼信譽評估:三星手機會對發(fā)送短信的號碼進行信譽評估。系統(tǒng)會收集和分析號碼的歷史發(fā)送記錄,如果一個號碼經(jīng)常發(fā)送垃圾短信,那么它的信譽度就會降低。當接收到來自信譽度較低的號碼的短信時,系統(tǒng)會更加嚴格地進行審查,提高該短信被識別為垃圾短信的概率。
? 安全中心防護:三星手機的安全中心會對短信進行實時監(jiān)測和過濾。安全中心會不斷更新垃圾短信的特征庫和攔截規(guī)則,以應(yīng)對不斷變化的垃圾短信形式。同時,用戶還可以在安全中心中設(shè)置短信攔截的級別和方式,根據(jù)自己的需求進行個性化的設(shè)置。
4.6 榮耀
? 智能防護引擎:榮耀手機擁有專門的智能防護引擎,用于過濾垃圾短信。該引擎通過對短信的發(fā)送號碼、內(nèi)容、頻率等多方面因素進行綜合分析,來判斷短信是否為垃圾短信。例如,如果一個號碼在短時間內(nèi)頻繁發(fā)送大量內(nèi)容相似的短信,就會被系統(tǒng)判定為垃圾短信發(fā)送者,其發(fā)送的短信會被攔截。
? 號碼識別與分類:榮耀手機會對發(fā)送短信的號碼進行識別和分類。對于一些常見的垃圾短信發(fā)送號碼,如營銷號碼、詐騙號碼等,系統(tǒng)會將其標記并進行攔截。同時,對于一些新出現(xiàn)的號碼,系統(tǒng)會根據(jù)其發(fā)送短信的行為和特征進行判斷,如果符合垃圾短信的特征,也會被攔截。
? 場景化識別:根據(jù)不同的場景和用戶需求,榮耀手機的垃圾短信過濾功能還具備場景化識別能力。例如,在用戶進行網(wǎng)購后,可能會收到一些商家的促銷短信,系統(tǒng)會根據(jù)用戶的購物行為和偏好,對這些短信進行智能識別和分類,避免將一些有用的促銷短信誤判為垃圾短信。
4.7 魅族
? 智能攔截系統(tǒng):魅族手機的智能攔截系統(tǒng)通過對短信的文本內(nèi)容、發(fā)送號碼、發(fā)送頻率等信息進行分析,來判斷短信是否為垃圾短信。系統(tǒng)會根據(jù)預設(shè)的規(guī)則和算法,對短信進行自動攔截。例如,如果一條短信的發(fā)送號碼是一個陌生的虛擬號碼,且短信內(nèi)容中包含大量的廣告宣傳詞匯,系統(tǒng)就會將其攔截。
? 用戶反饋與社區(qū)共享:魅族手機支持用戶手動標記垃圾短信,用戶將某條短信標記為垃圾短信后,系統(tǒng)會將該短信的特征上傳到魅族的服務(wù)器。同時,魅族還建立了一個用戶社區(qū),用戶可以在社區(qū)中分享自己遇到的垃圾短信信息,其他用戶可以根據(jù)這些信息對自己的手機進行設(shè)置,提高垃圾短信的攔截效果。
? 定期更新與優(yōu)化:魅族會定期更新垃圾短信攔截的規(guī)則和算法,以適應(yīng)不斷變化的垃圾短信形式。通過對新出現(xiàn)的垃圾短信特征的學習和分析,不斷優(yōu)化攔截系統(tǒng),提高垃圾短信的識別準確率。
4.8 一加
系統(tǒng)自帶的騷擾攔截功能:
? 智能攔截模式:一加手機的系統(tǒng)會基于一定的算法模型對短信進行智能判斷。例如,系統(tǒng)會根據(jù)短信的文本內(nèi)容、發(fā)送號碼的特征等信息進行分析。如果短信的內(nèi)容中包含一些常見的垃圾短信關(guān)鍵詞,如“促銷”“抽獎”“免費”等,或者發(fā)送號碼是一些已被標記為不良的號碼段,系統(tǒng)就會將其識別為疑似垃圾短信進行攔截。這種智能攔截模式能夠在一定程度上自動過濾掉大部分常見的垃圾短信。
? 用戶自定義攔截規(guī)則:用戶可以在手機的設(shè)置中自行添加垃圾短信關(guān)鍵詞。當接收到的短信中包含用戶設(shè)定的關(guān)鍵詞時,系統(tǒng)會自動攔截該短信。此外,用戶還可以設(shè)置攔截特定號碼發(fā)送的短信,比如將一些經(jīng)常發(fā)送垃圾短信的號碼添加到黑名單中,從而實現(xiàn)精準攔截。
? 攔截通知設(shè)置:在攔截規(guī)則界面,用戶可以設(shè)置攔截通知的提醒方式,如顯示所有攔截通知、不顯示攔截通知或顯示除黑名單外的攔截通知等,方便用戶及時了解短信的攔截情況。
與第三方應(yīng)用的協(xié)作:
? 號碼識別應(yīng)用:一加手機用戶可以安裝第三方的號碼識別應(yīng)用,如騰訊手機管家、360手機衛(wèi)士等。這些應(yīng)用擁有龐大的號碼數(shù)據(jù)庫,能夠?qū)黼姾投绦诺陌l(fā)送號碼進行快速識別和分類。如果是被標記為騷擾電話、詐騙電話或垃圾短信發(fā)送者的號碼,應(yīng)用會自動攔截相關(guān)的通信。并且,這些應(yīng)用還會不斷更新數(shù)據(jù)庫,以提高識別的準確性。
? 短信過濾應(yīng)用:一些專門的短信過濾應(yīng)用可以與一加手機的系統(tǒng)進行協(xié)作,進一步增強垃圾短信的過濾效果。這些應(yīng)用通常會采用更先進的算法和技術(shù),對短信的內(nèi)容進行深度分析,識別出潛在的垃圾短信。例如,通過對短信的語義理解、文本模式識別等技術(shù),判斷短信是否屬于垃圾短信范疇。
5 結(jié)論與展望
手機自動識別垃圾短信的技術(shù)在不斷進步,對于提供服務(wù)的企業(yè)來說,如何讓自己的服務(wù)短信不被識別為垃圾短信,而讓用戶能夠看到,成為了一個亟待解決的問題。本文深入探討了手機自動識別垃圾短信的邏輯,并提出了優(yōu)化服務(wù)短信可見性的策略。通過精準定位目標用戶、優(yōu)化短信內(nèi)容、合理控制發(fā)送頻率、提升用戶參與度以及加強與運營商的合作等措施,企業(yè)可以顯著提升服務(wù)短信的可見性,提高用戶的打開率和回復率。
未來隨著技術(shù)的不斷發(fā)展,手機自動識別垃圾短信的邏輯可能會更加復雜和智能。因此,企業(yè)服務(wù)人員需要持續(xù)關(guān)注這一領(lǐng)域的發(fā)展動態(tài),不斷優(yōu)化自己的服務(wù)策略和手段。同時,也需要加強與運營商、第三方服務(wù)商等合作伙伴的合作,共同推服務(wù)短信的合規(guī)性和可見性的提升。只有這樣,才能在激烈的市場競爭中脫穎而出,贏得用戶的信任和支持。
更多其他內(nèi)容:
AIGC項目中的【模板進程】方案的設(shè)計實踐: https://developer.jdcloud.com/article/4123?mid=30
AIGC系統(tǒng)中多個模型的切換調(diào)用方案探索: https://developer.jdcloud.com/article/4110
前后端數(shù)據(jù)傳輸約定探討: https://developer.jdcloud.com/article/3900
如何做標準化?: https://developer.jdcloud.com/article/3576
chrome插件新版本(v3版本)中的熱更新,即加載更新遠程js的方法探索: https://developer.jdcloud.com/article/3852
審核編輯 黃宇
-
通訊
+關(guān)注
關(guān)注
9文章
902瀏覽量
34889 -
自動識別
+關(guān)注
關(guān)注
3文章
221瀏覽量
22831
發(fā)布評論請先 登錄
相關(guān)推薦
評論