RM新时代APP官网,新时代下载安装最新版

摘要

Few-shot關(guān)系提取涉及使用有限數(shù)量的注釋樣本識別文本中兩個特定實體之間的關(guān)系類型。通過應(yīng)用元學習和神經(jīng)圖技術(shù)，已經(jīng)出現(xiàn)了對這個問題的各種解決方案，這些技術(shù)通常需要訓練過程進行調(diào)整。

最近，上下文學習策略已被證明在沒有訓練的情況下顯示出顯著的結(jié)果。很少有研究利用上下文學習進行zero-shot信息提取。不幸的是，推理的證據(jù)在思維鏈提示的構(gòu)建過程中沒有被考慮或隱式建模。

本文提出了一種使用大型語言模型進行Few-shot關(guān)系提取的新方法，稱為CoT-ER，具有顯式證據(jù)推理的思維鏈。特別是，CoT-ER首先誘導大型語言模型使用特定任務(wù)和概念級知識生成證據(jù)。然后將此證據(jù)明確納入思維鏈提示以進行關(guān)系提取。實驗結(jié)果表明，在FewRel 1.0和FewRel 2.0數(shù)據(jù)集上，與完全監(jiān)督（具有100%訓練數(shù)據(jù)）的最先進方法相比，本文的CoT-ER方法（具有0%訓練數(shù)據(jù)）實現(xiàn)了具有競爭力的性能。

簡介

關(guān)系提取（Relation Extraction, RE）旨在基于上下文語義信息識別兩個給定實體之間的關(guān)系。

當標記的數(shù)據(jù)不足時，RE模型的性能往往會顯著下降。few-shot關(guān)系提取任務(wù)需要使用有限數(shù)量的注釋訓練數(shù)據(jù)。最近，許多研究人員通過使用元學習和神經(jīng)圖技術(shù)來解決這個問題，通過在大型數(shù)據(jù)集上對模型進行元訓練或結(jié)合外部知識，取得了令人滿意的結(jié)果。

近年來，預訓練的LLMs，如GPT系列模型，已經(jīng)顯示出顯著的上下文學習（LLM可以有效地執(zhí)行各種任務(wù)，而無需參數(shù)優(yōu)化，這一概念被稱為上下文學習）能力，在許多NLP任務(wù)中取得了出色的結(jié)果。在上下文學習的范式中，LLM在許多NLP任務(wù)中表現(xiàn)出與標準的完全監(jiān)督方法相比的競爭性能，即使只提供了幾個示例作為提示中的few-shot示例。

思維鏈（Chain-of-Thought, CoT）提示方法在數(shù)學問題和常識推理中從LLM引出令人印象深刻的推理能力。在RE任務(wù)中，存在指導LLM確定關(guān)系標簽的推理過程。然而，缺乏填補這一空白的研究。盡管GPT-RE引入了一種標簽誘導推理方法，通過提示LLM僅基于給定的標簽生成合適的推理過程。與特定的few-shot示例檢索方法相比，自動生成推理過程的性能改進微乎其微。

本文為FSRE（Few-shot Relation Extraction, FSRE）任務(wù)提出了一種新的思想鏈提示方法：具有顯式證據(jù)推理的思想鏈，與FewRel 1.0和FewRel 2.0上的最先進結(jié)果相比，獲得了具有競爭力的結(jié)果。本文的方法采用三步推理方法來解決上述問題。在第一步和第二步中，CoT-ER要求LLM輸出與頭部和尾部實體相對應(yīng)的概念級實體，這是RE特定推理的基礎(chǔ)。在第三步中，CoT-ER提示LLM提取相關(guān)的上下文跨度作為明確建立這兩個實體之間特定關(guān)系的證據(jù)。通過將頭部實體、尾部實體和關(guān)系標簽組合成連貫的句子，LLM可以更語義地確定兩個給定實體之間的關(guān)系標簽，解決了提示方法中關(guān)系標簽的語義模糊問題。下圖展示了Auto-CoT和CoT-ER之間的差異。

CoT-ER

本文提出的CoT-ER的概述如下圖所示，它由3個組件組成：

Human-Instructed Reasoning Module：旨在通過用人工注釋數(shù)據(jù)提示LLM，將推理過程與支持集中的每個實例相關(guān)聯(lián)。
Similarity Based KNN Retrieval Module：基于相似性的KNN檢索模塊將根據(jù)與查詢實例的相似性從支持集中選擇具有推理過程的實例，這些實例在最終提示中被視為few-shot示例。
Inference Module：推理模塊通過最終提示指示LLM來預測查詢實例的關(guān)系標簽，最終提示將任務(wù)指令、few-shot示例和關(guān)于實例的問題連接起來。

Human-Instructed Reasoning Module

由于LLM具有上下文學習的能力，本文提出了一種人工指導的方法來指導LLM使用最少的注釋數(shù)據(jù)執(zhí)行準確的推理。

CoT-ER設(shè)計：為了充分利用LLM中存儲的知識并促進逐步推理，引入了一種新的具有概念級知識和明確證據(jù)的三步推理框架。在步驟1中，LLM推斷與頭部實體相關(guān)的概念級知識，而步驟2對尾部實體進行同樣的操作。通過這些步驟，LLM可以很容易地排除概念實體不正確的選項。步驟3：為了找出在給定的上下文中哪一個關(guān)系標簽最適合這對實體，明確強調(diào)相關(guān)的文本跨度作為證據(jù)，然后構(gòu)建一個連貫的表達式，將兩個實體和關(guān)系標簽結(jié)合在一起。為了進一步說明三步推理過程，下圖中的幾個shot示例演示了該推理過程的模板。

CoT-ER生成：為數(shù)據(jù)集中的每個關(guān)系類注釋了一個CoT-ER推理示例作為種子示例。然后，設(shè)計了一個適當?shù)奶崾?，使用注釋的示例作為few-shot示例演示，以指導LLM為每個支持實例生成類似的推理步驟。每個具有CoT-ER推理步驟的支持實例都將附加到候選集合中。上圖顯示了為人工指導推理模塊設(shè)計的類似提示。

Retrieval Module

有研究表明，基于相似性選擇few-shot示例會大大改善上下文學習。由于LLM的輸入tokens有限，在給定N路K-Shot任務(wù)的情況下，單個提示可能無法容納所有支持實例。在本文中，遵循基于相似性的方法來選擇few-shot示例。為了獲得特定關(guān)系的相似性表示，首先通過合并實體級信息，將輸入文本重構(gòu)為“上下文：[文本]給定上下文，“[頭部實體]”和“[尾部實體]”之間的關(guān)系是什么？”。然后，利用GPT系列模型“text-embedding-ad-002”作為編碼器來獲得語義嵌入。隨后，計算候選集合中的每個實例與查詢實例之間的歐幾里得距離。最后，基于候選集合中的M個實例到查詢實例的較低歐幾里得距離，選擇它們作為few-shot示例。

Inference Module

為了創(chuàng)建最終提示，只需將一條任務(wù)指令、few-shot示例和一個針對查詢實例定制的問題連接起來，使用具有CoT-ER推理的支持實例作為few-shot示例。值得注意的是，LLM在一般情況下有很強的錯誤輸出NULL的傾向。本文中強制LLM選擇所提供的關(guān)系標簽之一，因為沒有考慮FewRel數(shù)據(jù)集中的“無上述”場景示例。

實驗

Datasets

有兩個標準的few-shot關(guān)系提取數(shù)據(jù)集：FewRel 1.0和FewRel 2.0。

FewRel 1.0由維基百科構(gòu)建，維基百科由70000個句子組成，注釋有100個關(guān)系標簽，這100個關(guān)系標記被分為64/16/20個部分，用于訓練/驗證/測試集。
FewRel2.0通過引入醫(yī)學領(lǐng)域的額外驗證和測試集擴展了FewRel 1.0，其中包括分別具有1000個實例的10個關(guān)系標簽和具有1500個實例的15個關(guān)系標簽。

實驗細節(jié)

在現(xiàn)實場景中，直接使用固定的、手動注釋的示例執(zhí)行RE任務(wù)是合理的，作為每個關(guān)系標簽的少量鏡頭演示。為此，通過從預先確定的人工注釋CoT-ER數(shù)據(jù)集中選擇few-shot示例來評估性能，該數(shù)據(jù)集表示為手動CoT-ER。在此設(shè)置中，few-shot示例獨立于支持集，這意味著LLM將使用較少的注釋數(shù)據(jù)執(zhí)行RE任務(wù)。相反，Auto-CoT-ER利用自動生成的CoT-ER推理過程作為人工指導推理模塊中描述的支持集的few-shot示例。

對比模型

本文考慮FSRE任務(wù)的兩類方法。

100% 訓練數(shù)據(jù)的方法：MTB、CP、HCPR、FAEA、GTPN、GM_GEN和KEFDA。通常，這些方法在FewRel 1.0訓練集上訓練模型，并在FewRel 1.0、2.0驗證和測試集上評估其性能。

0% 訓練數(shù)據(jù)的方法：應(yīng)用Vanilla-ICL和Auto-CoT作為基線提示格式化方法。這些方法利用一些示例作為演示，并提示LLM執(zhí)行NLP任務(wù)。Vanilla-ICL設(shè)計了一個直接結(jié)合文本和關(guān)系標簽的模板，例如“上下文：[文本]，給定上下文，[頭部實體]和[尾部實體]之間的關(guān)系就是[關(guān)系標簽]”。Auto-CoT通過自動生成的推理步驟擴展了Vanilla-ICL。

在整個實驗中，注意到是否要求LLM在最后的回答階段進行推理可能會導致不一致的結(jié)果，如下表所示。此外，利用預先訓練的BERT基本模型6和GPT系列模型text-embedding-ada-002作為編碼器，直接獲得輸入文本的表示。對于每個N路K-shot任務(wù)，我們通過對屬于該類的K instance進行平均來獲得每個類的原型。然后，將查詢實例的預測標簽分配給其原型與查詢實例具有最接近歐幾里得距離的類。將這兩種方法稱為Bert-proto和GPT-proto。

結(jié)果與分析

結(jié)果

與Vanilla-ICL相比，在few-shot場景中，Auto-CoT沒有表現(xiàn)出顯著的改進。這可能歸因于推理過程的低質(zhì)量，以及由于最大token限制，few-shot演示中的實例數(shù)量減少。此外，當涉及到在最終答案中生成推理過程時，具有推理的Auto-CoT優(yōu)于在FewRel 1.0上直接生成關(guān)系標簽的版本。然而，在FewRel 2.0上得出了相反的結(jié)論。原因可能為：FewRel 1.0從維基百科中提取實例，通常需要常識來進行推理，而FewRel 2.0需要醫(yī)學相關(guān)專業(yè)知識，與常識相比，在預訓練語料庫中所占比例較小。因此，LLM在執(zhí)行醫(yī)學領(lǐng)域的推理任務(wù)時遇到困難。
手動CoT-ER和Auto-CoT-ER都優(yōu)于無訓練基線，在few-shot演示中使用的實例更少。表明有必要設(shè)計一種針對RE任務(wù)的特定CoT提示方法，以便在few-shot場景中獲得更好的性能。
CoT-ER提示方法在FewRel 1.0和FewRel 2.0上都比最先進的完全監(jiān)督方法具有競爭力，并以最少的人工超過了大多數(shù)完全監(jiān)督方法。這表明，當提供高質(zhì)量的關(guān)系信息和精心設(shè)計的推理過程時，GPT系列LLM有可能擊敗以前的完全監(jiān)督方法。

消融CoT-ER

合并實體信息是否對CoT-ER有顯著好處？本文進行了消融實驗，以證明三步推理過程的必要性。在這個實驗中，去掉了第一步和第二步，并將性能與Auto-CoT reasoning進行了比較。出于公平考慮，使用Auto-CoT-ER實現(xiàn)了這個實驗，它還采用了LLM自動生成的推理過程。由于最大輸入和輸出token的限制，將消融實驗的few-shot演示中的實例數(shù)量設(shè)置為13。結(jié)果如下圖所示。

結(jié)果表明：

除第一步和第二步后，Auto-CoT-ER的性能顯著下降，在FewRel 1.0和FewRel 2.0上的精度分別降低了3.4、2.2、1.8、2.9和5.2、6、5.3、7.6。這意味著實體類型的更高層次抽象，特別是概念級實體，有利于LLM在few-shot場景中執(zhí)行RE任務(wù)。
CoT-ER的第三步是將支持實例與Auto-CoT相比更簡單的推理過程配對，但它在某些具有挑戰(zhàn)性的場景中實現(xiàn)了卓越的性能。這一發(fā)現(xiàn)表明，關(guān)系標簽提供的語義信息比低質(zhì)量的推理信息更有利于LLM。

CoT-ER穩(wěn)定性實驗

本文對提出的CoT-ER進行了兩項穩(wěn)定性實驗。

Different Random Seeds for Task Sampling：由于“text-davinci-003”的成本很高，本文對數(shù)量相對較少的查詢進行了采樣測試，特別是每個N路K-Shot任務(wù)的查詢數(shù)量為100×N。為此，使用8個隨機種子對CoT-ER和Vanilla-ICL進行了評估，用于N路K-Shot任務(wù)采樣。下表中顯示了FewRel 2.0的平均值±標準偏差的實驗結(jié)果。值得注意的是，CoT-ER在所有N路K-shot設(shè)置中始終以較低的標準差優(yōu)于Vanilla-ICL。

Different Number of Few-shot Instances：為了研究所選演示數(shù)量如何有助于CoT-ER的性能，在5-Way，5-Shot 設(shè)置下進行了實驗。單個提示在最壞的情況下可以保持13個CoT-ER推理演示，而所有支持實例(25)都可以附加到Vanilla-ICL中的提示。結(jié)果如下表所示。

觀察到CoT-ER和Vanilla-ICL都可以受益于更多的few-shot示例，然而，隨著示例數(shù)量的增加，Vanilla-ICL的性能迅速下降。CoT-ER可以有效地利用來自提供實例的信息，即使實例數(shù)量減少，也能保持強大的性能。這表明當few-shot實例的數(shù)量發(fā)生變化時，CoT-ER表現(xiàn)出比Vanilla-ICL更大的穩(wěn)定性。

下表展示了CoT-ER和Auto-CoT方法的案例分析。

結(jié)論

本文探索了LLM上下文內(nèi)學習在few-shot關(guān)系提取方面的潛力。為了提高低質(zhì)量自動生成推理過程所帶來的總體性能，引入了CoT-ER，這是一種專門用于few-shot關(guān)系提取的提示方法。核心思想是促使LLM使用存儲在其預訓練階段的特定任務(wù)和概念級別的知識來生成證據(jù)。LLM將在RE任務(wù)中使用這些證據(jù)，并促進推理過程。此外，設(shè)計了一種標簽描述技術(shù)，通過將實體和關(guān)系標簽集成到一個連貫的表達式中。該技術(shù)解決了關(guān)系標簽的語義歧義，這是在上下文學習中使用關(guān)系提取時遇到的常見挑戰(zhàn)。FewRel 1.0和FewRel 2.0的實驗結(jié)果優(yōu)于所有無訓練基線，證明了本文提出的方法的有效性。此外，實現(xiàn)與最先進的完全監(jiān)督方法相當?shù)慕Y(jié)果表明，上下文學習范式有望成為few-shot關(guān)系提取任務(wù)的新解決方案。

盡管CoT-ER在FewRel 1.0和FewRel 2.0上取得了不錯的結(jié)果，但仍有未來改進的潛力。由于最大長度的限制，本文提出的方法在處理較大的數(shù)據(jù)集時并沒有充分利用所有實例。盡管采用了基于相似性的KNN檢索來為few-shot演示選擇優(yōu)越的實例，結(jié)果發(fā)現(xiàn)，與其他在有大量候選集可用時表現(xiàn)良好的方法相比，它在few-shot設(shè)置中并不有效。由于通過GPT-3的API使用合理所需ICL的成本很高，本文尚未在具有更長最大輸入token和更大規(guī)模的高級LLM上評估CoT-ER。有限的預算也限制了種子示例構(gòu)建的優(yōu)化。可以通過更具信息性和適當?shù)脑O(shè)計來提高性能。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

語言模型

語言模型

+關(guān)注

關(guān)注
0

文章
520

瀏覽量
10268
nlp

nlp

+關(guān)注

關(guān)注
1

文章
488

瀏覽量
22033
LLM

LLM

+關(guān)注

關(guān)注
0

文章
286

瀏覽量
327

原文標題：EMNLP2023 | 基于顯式證據(jù)推理的few-shot關(guān)系抽取CoT

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

基于將 CLIP 用于下游few-shot圖像分類的方案

對比性圖像語言預訓練模型（CLIP）在近期展現(xiàn)出了強大的視覺領(lǐng)域遷移能力，可以在一個全新的下游數(shù)據(jù)集上進行 zero-shot 圖像識別。

發(fā)表于 09-27 09:46 ?5275次閱讀

基于改進模糊熵和證據(jù)推理的多屬性決策方法

針對證據(jù)推理方法框架下屬性權(quán)重難以獲取的問題，提出一種基于改進模糊熵和證據(jù)推理的多屬性決策方法。首先，定義證據(jù)

發(fā)表于 12-13 11:40 ?1次下載

深度學習：遠程監(jiān)督在關(guān)系抽取中的應(yīng)用

什么是關(guān)系抽取知識就是力量。使人類及機器能夠更好地利用知識是提升工作效率及實現(xiàn)人工智能的關(guān)鍵所在，也催生了包括知識表示、知識推理在內(nèi)的一系列研究。作為一切對知識的利用的基礎(chǔ)，我們首先要獲取知識，即

發(fā)表于 11-02 15:43 ?2635次閱讀

NLP：關(guān)系抽取到底在乎什么

關(guān)系抽取到底在乎什么？這是來自EMNLP20上清華大學劉知遠團隊的“靈魂發(fā)問”～ 關(guān)系抽取是每一位NLPer都很熟知的任務(wù)，特別是基于BERT的神經(jīng)

發(fā)表于 01-07 14:46 ?5689次閱讀

NLP事件抽取綜述之挑戰(zhàn)與展望

Prototypical Network for Few-Shot Event Detection, WSDM 2020[1] 事件檢測(ED)是事件抽取

發(fā)表于 01-18 16:33 ?3815次閱讀

細解讀關(guān)系抽取SOTA論文

本文主要詳細解讀關(guān)系抽取SOTA論文Two are Better than One:Joint Entity and Relation Extraction with Table-Sequence

發(fā)表于 02-10 17:18 ?2668次閱讀

基于機器學習的中文隱式實體關(guān)系抽取方法

基于機器學習的中文隱式實體關(guān)系抽取方法

發(fā)表于 06-02 14:42 ?4次下載

樣本量極少可以訓練機器學習模型嗎？

本文首先介紹了用小樣本訓練模型會導致的問題，再介紹了Few-Shot Learning的基本原理即三大思路下的方法。

發(fā)表于 06-23 15:02 ?6944次閱讀

Zero-shot-CoT是multi-task的方法

大規(guī)模預訓練語言模型借助于針對特定任務(wù)設(shè)計的prompt（無論是few shot還是zero shot），在單步驟的system-1任務(wù)上有著出色表現(xiàn)，但是對于那些緩慢和需要多步推理的

發(fā)表于 06-15 10:53 ?2426次閱讀

實體關(guān)系抽取模型CasRel

許多實驗證明聯(lián)合學習方法由于考慮了兩個子任務(wù)之間的信息交互，大大提升了實體關(guān)系抽取的效果，所以目前針對實體關(guān)系抽取任務(wù)的研究大多采用聯(lián)合學習方法。

發(fā)表于 07-21 14:11 ?3857次閱讀

介紹兩個few-shot NER中的challenge

此部分著重介紹了兩個few-shot NER中的challenge：limited information challenge和knowledge mismatch challenge。前者主要是指

發(fā)表于 08-24 10:01 ?850次閱讀

Few-shot NER的三階段

Few-shot NER的三階段：Train、Adapt、Recognize，即在source域訓練，在target域的support上微調(diào)，在target域的query上測試。

發(fā)表于 08-24 16:12 ?1423次閱讀

基于GLM-6B對話模型的實體屬性抽取項目實現(xiàn)解析

Zero-shot、One-shot以及Few-shot讓人傻傻分不清，讀了很多文章，也沒搞清楚他們的差別，究竟什么叫zero-shot，其在應(yīng)用過程中的no gradient upd

發(fā)表于 03-28 10:11 ?6957次閱讀

邁向多模態(tài)AGI之開放世界目標檢測

OVD的基礎(chǔ)概念：OVD的使用主要涉及到 few-shot 和 zero-shot兩大類場景，few-shot是指有少量人工標注訓練樣本的目標類別，zero-shot則是指不存在任何人

發(fā)表于 06-15 16:08 ?781次閱讀

基于多任務(wù)預訓練模塊化提示

對 Few-shot 場景時，PT 的調(diào)優(yōu)方法還是存在一定的局限性。針對這個問題，復旦提出了多任務(wù)預訓練模塊化 Prompt（簡稱為：），來提高模型在 Few-shot 場景下的 PT 效果，使模型能夠快速適應(yīng)下游

發(fā)表于 06-20 11:04 ?680次閱讀

RM新时代网站-首页

搜索歷史

基于顯式證據(jù)推理的few-shot關(guān)系抽取CoT

摘要

簡介

相關(guān)工作

Few-shot Relation Extraction

In-context Learning

CoT-ER

Human-Instructed Reasoning Module

Retrieval Module

Inference Module

實驗

Datasets

實驗細節(jié)

對比模型

結(jié)果與分析

結(jié)果

消融CoT-ER

CoT-ER穩(wěn)定性實驗

結(jié)論

評論

基于將 CLIP 用于下游few-shot圖像分類的方案

基于改進模糊熵和證據(jù)推理的多屬性決策方法

深度學習：遠程監(jiān)督在關(guān)系抽取中的應(yīng)用

NLP：關(guān)系抽取到底在乎什么

NLP事件抽取綜述之挑戰(zhàn)與展望

細解讀關(guān)系抽取SOTA論文

基于機器學習的中文隱式實體關(guān)系抽取方法

樣本量極少可以訓練機器學習模型嗎？

Zero-shot-CoT是multi-task的方法

實體關(guān)系抽取模型CasRel

介紹兩個few-shot NER中的challenge

Few-shot NER的三階段

基于GLM-6B對話模型的實體屬性抽取項目實現(xiàn)解析

邁向多模態(tài)AGI之開放世界目標檢測

基于多任務(wù)預訓練模塊化提示