RM新时代APP官网网址,RM新时代正常可以出正常提

1、概述

word embedding 是現(xiàn)在自然語(yǔ)言處理中最常用的 word representation 的方法，常用的word embedding 是word2vec的方法，然而word2vec本質(zhì)上是一個(gè)靜態(tài)模型，也就是說(shuō)利用word2vec訓(xùn)練完每個(gè)詞之后，詞的表示就固定了，之后使用的時(shí)候，無(wú)論新句子上下文的信息是什么，這個(gè)詞的word embedding 都不會(huì)跟隨上下文的場(chǎng)景發(fā)生變化，這種情況對(duì)于多義詞是非常不友好的。例如英文中的 Bank這個(gè)單詞，既有河岸的意思，又有銀行的意思，但是在利用word2vec進(jìn)行word embedding 預(yù)訓(xùn)練的時(shí)候會(huì)獲得一個(gè)混合多種語(yǔ)義的固定向量表示。即使在根據(jù)上下文的信息能明顯知道是“銀行”的情況下，它對(duì)應(yīng)的word embedding的內(nèi)容也不會(huì)發(fā)生改變。

ELMO的提出就是為了解決這種語(yǔ)境問(wèn)題，動(dòng)態(tài)的去更新詞的word embedding。ELMO的本質(zhì)思想是：事先用語(yǔ)言模型在一個(gè)大的語(yǔ)料庫(kù)上學(xué)習(xí)好詞的word embedding，但此時(shí)的多義詞仍然無(wú)法區(qū)分，不過(guò)沒(méi)關(guān)系，我們接著用我們的訓(xùn)練數(shù)據(jù)（去除標(biāo)簽）來(lái)fine-tuning 預(yù)訓(xùn)練好的ELMO 模型。作者將這種稱(chēng)為domain transfer。這樣利用我們訓(xùn)練數(shù)據(jù)的上下文信息就可以獲得詞在當(dāng)前語(yǔ)境下的word embedding。作者給出了ELMO 和Glove的對(duì)比

自然語(yǔ)言處理的ELMO使用

對(duì)于Glove訓(xùn)練出來(lái)的word embedding來(lái)說(shuō)，多義詞play，根據(jù)他的embedding 找出的最接近的其他單詞大多數(shù)幾種在體育領(lǐng)域，這主要是因?yàn)橛?xùn)練數(shù)據(jù)中包含play的句子大多數(shù)來(lái)源于體育領(lǐng)域，之后在其他語(yǔ)境下，play的embedding依然是和體育相關(guān)的。而使用ELMO，根據(jù)上下文動(dòng)態(tài)調(diào)整后的embedding不僅能夠找出對(duì)應(yīng)的“表演”相同的句子，還能保證找出的句子中的play對(duì)應(yīng)的詞性也是相同的。接下來(lái)看看ELMO是怎么實(shí)現(xiàn)這樣的結(jié)果的。

2、模型結(jié)構(gòu)

ELMO 基于語(yǔ)言模型的，確切的來(lái)說(shuō)是一個(gè) Bidirectional language models，也是一個(gè) Bidirectional LSTM結(jié)構(gòu)。我們要做的是給定一個(gè)含有N個(gè)tokens的序列

t1, t2, ... , tN

其前向表示為：

自然語(yǔ)言處理的ELMO使用

反向表示為：

自然語(yǔ)言處理的ELMO使用

從上面的聯(lián)合概率來(lái)看是一個(gè)典型的語(yǔ)言模型，前向利用上文來(lái)預(yù)測(cè)下文，后向利用下文來(lái)預(yù)測(cè)上文。假設(shè)輸入的token是自然語(yǔ)言處理的ELMO使用，在每一個(gè)位置 k ，每一層LSTM 上都輸出相應(yīng)的context-dependent的表征。

這里 j = 1 , 2 , ... , L ，L 表示LSTM的層數(shù)。頂層的LSTM 輸出，通過(guò)softmax層來(lái)預(yù)測(cè)下一個(gè)。

對(duì)數(shù)似然函數(shù)表示如下：

自然語(yǔ)言處理的ELMO使用

模型的結(jié)構(gòu)圖如下：

自然語(yǔ)言處理的ELMO使用

ELMO 模型不同于之前的其他模型只用最后一層的輸出值來(lái)作為word embedding的值，而是用所有層的輸出值的線(xiàn)性組合來(lái)表示word embedding的值。

對(duì)于每個(gè)token，一個(gè)L層的 biLM要計(jì)算出 2L + 1 個(gè)表征：

自然語(yǔ)言處理的ELMO使用

在上面等于，表示的是token層的值。

在下游任務(wù)中會(huì)把 Rk壓縮成一個(gè)向量：

自然語(yǔ)言處理的ELMO使用

其中是softmax標(biāo)準(zhǔn)化權(quán)重，γtask?是縮放系數(shù)，允許任務(wù)模型去縮放整個(gè)ELMO向量。

ELMO的使用主要有三步：

1）在大的語(yǔ)料庫(kù)上預(yù)訓(xùn)練 biLM 模型。模型由兩層bi-LSTM 組成，模型之間用residual connection 連接起來(lái)。而且作者認(rèn)為低層的bi-LSTM層能提取語(yǔ)料中的句法信息，高層的bi-LSTM能提取語(yǔ)料中的語(yǔ)義信息。

2）在我們的訓(xùn)練語(yǔ)料（去除標(biāo)簽），fine-tuning 預(yù)訓(xùn)練好的biLM 模型。這一步可以看作是biLM的domain transfer。

3）利用ELMO 產(chǎn)生的word embedding來(lái)作為任務(wù)的輸入，有時(shí)也可以即在輸入時(shí)加入，也在輸出時(shí)加入。

ELMO 在六項(xiàng)任務(wù)上取得了the state of the art ，包括問(wèn)答，情感分析等任務(wù)?？偟膩?lái)說(shuō)，ELMO提供了詞級(jí)別的動(dòng)態(tài)表示，能有效的捕捉語(yǔ)境信息，解決多義詞的問(wèn)題。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

計(jì)算機(jī)

計(jì)算機(jī)

+關(guān)注

關(guān)注
19

文章
7488

瀏覽量
87849
人工智能

人工智能

+關(guān)注

關(guān)注
1791

文章
47183

瀏覽量
238247

評(píng)論

相關(guān)推薦

python自然語(yǔ)言

最近，python自然語(yǔ)言是越來(lái)越火了，那么什么是自然語(yǔ)言。自然語(yǔ)言（Natural Language ）廣納了眾多技術(shù)，對(duì)自然或人類(lèi)語(yǔ)言進(jìn)

發(fā)表于 05-02 13:50

【推薦體驗(yàn)】騰訊云自然語(yǔ)言處理

`相信大家對(duì)NLP自然語(yǔ)言處理的技術(shù)都不陌生，它是計(jì)算機(jī)科學(xué)領(lǐng)域和AI領(lǐng)域中的一個(gè)分支，它與計(jì)算機(jī)和人類(lèi)之間使用自然語(yǔ)言進(jìn)行交互密切相關(guān)，而NLP的最終目標(biāo)是使計(jì)算機(jī)能夠像人類(lèi)一樣理解語(yǔ)言

發(fā)表于 10-09 15:28

自然語(yǔ)言處理的分詞方法

自然語(yǔ)言處理——75 自動(dòng)分詞基本算法

發(fā)表于 03-19 11:46

自然語(yǔ)言處理的語(yǔ)言模型

自然語(yǔ)言處理——53 語(yǔ)言模型（數(shù)據(jù)平滑）

發(fā)表于 04-16 11:11

自然語(yǔ)言處理的詞性標(biāo)注方法

自然語(yǔ)言處理——78 詞性標(biāo)注方法

發(fā)表于 04-21 11:38

求自然語(yǔ)言處理筆記

自然語(yǔ)言處理筆記9-哈工大關(guān)毅

發(fā)表于 06-04 16:34

自然語(yǔ)言處理——總結(jié)、習(xí)題

自然語(yǔ)言處理——79 總結(jié)、習(xí)題

發(fā)表于 06-19 11:22

什么是自然語(yǔ)言處理？

會(huì)識(shí)別出我們正確說(shuō)的話(huà)。我們使用免費(fèi)服務(wù)將在線(xiàn)遇到的外語(yǔ)短語(yǔ)翻譯成英語(yǔ)，有時(shí)它們可以為我們提供準(zhǔn)確的翻譯。盡管自然語(yǔ)言處理取得了長(zhǎng)足的進(jìn)步，但仍有很大的改進(jìn)空間。[理...

發(fā)表于 07-23 10:22

什么是自然語(yǔ)言處理

什么是自然語(yǔ)言處理？自然語(yǔ)言處理任務(wù)有哪些？自然語(yǔ)言處理的方法是什么？

發(fā)表于 09-08 06:51

什么是自然語(yǔ)言處理_自然語(yǔ)言處理常用方法舉例說(shuō)明

自然語(yǔ)言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向。它研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語(yǔ)言進(jìn)行有效通信的各種理論和方法。自然語(yǔ)言處理是

發(fā)表于 12-28 16:56 ?1.8w次閱讀

自然語(yǔ)言處理怎么最快入門(mén)_自然語(yǔ)言處理知識(shí)了解

自然語(yǔ)言處理就是實(shí)現(xiàn)人機(jī)間自然語(yǔ)言通信，實(shí)現(xiàn)自然語(yǔ)言理解和自然語(yǔ)言生成是十分困難的，造成困難的根本原因是

發(fā)表于 12-28 17:10 ?5308次閱讀

自然語(yǔ)言處理的概念和應(yīng)用 自然語(yǔ)言處理屬于人工智能嗎

　　自然語(yǔ)言處理(Natural Language Processing)是一種人工智能技術(shù)，它是研究自然語(yǔ)言與計(jì)算機(jī)之間的交互和通信的一門(mén)學(xué)科。自然語(yǔ)言

發(fā)表于 08-23 17:31 ?1553次閱讀

自然語(yǔ)言處理和人工智能的概念及發(fā)展史 自然語(yǔ)言處理和人工智能的區(qū)別

自然語(yǔ)言處理(Natural Language Processing, NLP)的定義是通過(guò)電腦軟件程序?qū)崿F(xiàn)人們?nèi)粘?b class='flag-5'>語(yǔ)言的機(jī)器自動(dòng)處理。為了幫助計(jì)算機(jī)理解，掌握

發(fā)表于 08-23 18:22 ?961次閱讀

自然語(yǔ)言處理包括哪些內(nèi)容

自然語(yǔ)言處理（Natural Language Processing，簡(jiǎn)稱(chēng)NLP）是人工智能領(lǐng)域的一個(gè)重要分支，它涉及到計(jì)算機(jī)與人類(lèi)語(yǔ)言之間的交互。NLP的目標(biāo)是讓計(jì)算機(jī)能夠理解、生成和處理

發(fā)表于 07-03 14:15 ?820次閱讀

自然語(yǔ)言處理與機(jī)器學(xué)習(xí)的關(guān)系 自然語(yǔ)言處理的基本概念及步驟

自然語(yǔ)言處理（Natural Language Processing，簡(jiǎn)稱(chēng)NLP）是人工智能和語(yǔ)言學(xué)領(lǐng)域的一個(gè)分支，它致力于研究如何讓計(jì)算機(jī)能夠理解、解釋和生成人類(lèi)語(yǔ)言。機(jī)器學(xué)習(xí)（Ma

發(fā)表于 12-05 15:21 ?451次閱讀

RM新时代网站-首页

搜索歷史

自然語(yǔ)言處理的ELMO使用

評(píng)論

python自然語(yǔ)言

【推薦體驗(yàn)】騰訊云自然語(yǔ)言處理

自然語(yǔ)言處理的分詞方法

自然語(yǔ)言處理的語(yǔ)言模型

自然語(yǔ)言處理的詞性標(biāo)注方法

求自然語(yǔ)言處理筆記

自然語(yǔ)言處理——總結(jié)、習(xí)題

什么是自然語(yǔ)言處理？

什么是自然語(yǔ)言處理

什么是自然語(yǔ)言處理_自然語(yǔ)言處理常用方法舉例說(shuō)明

自然語(yǔ)言處理怎么最快入門(mén)_自然語(yǔ)言處理知識(shí)了解

自然語(yǔ)言處理的概念和應(yīng)用自然語(yǔ)言處理屬于人工智能嗎

自然語(yǔ)言處理和人工智能的概念及發(fā)展史自然語(yǔ)言處理和人工智能的區(qū)別

自然語(yǔ)言處理包括哪些內(nèi)容

自然語(yǔ)言處理與機(jī)器學(xué)習(xí)的關(guān)系自然語(yǔ)言處理的基本概念及步驟