新时代官方下载,RM新时代官方

測試結(jié)果并不一定意味著人工智能可以“理解”人。

心智理論是指可以理解他人心理狀態(tài)的能力，正是它驅(qū)使著人類社會運(yùn)轉(zhuǎn)。它幫助你決定在緊張的情況下該說什么、猜測其他車輛的駕駛員將要做什么，以及與電影中的角色產(chǎn)生共鳴。一項(xiàng)最新的研究表明，ChatGPT等工具所使用的大語言模型在模仿這一典型人類特征方面表現(xiàn)得非常出色。

“在進(jìn)行這項(xiàng)研究之前，我們都相信大語言模型無法通過這些測試，特別是那些判斷不易察覺的心理狀態(tài)能力的測試。”該研究的合著者克里斯蒂娜?貝奇奧（Cristina Becchio）說，她是德國漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心的認(rèn)知神經(jīng)科學(xué)教授。這項(xiàng)她認(rèn)為“出乎意料和令人驚訝”的研究結(jié)果發(fā)表在2024年5月20日的《自然?人類行為》雜志中。

貝奇奧和她的同事并不是首先提出證據(jù)表明大語言模型的反應(yīng)能夠表現(xiàn)這種推理能力的人。在2023年發(fā)表的一篇預(yù)印本論文中，斯坦福大學(xué)心理學(xué)家邁克爾?科辛斯基（Michal Kosinski）報告了幾個模型在幾種常見心智理論測試中的測試情況。他發(fā)現(xiàn)，其中最好的是OpenAI的GPT-4，它正確完成了75%的任務(wù)，他說，這相當(dāng)于過去研究中6歲兒童的表現(xiàn)。不過，這項(xiàng)研究中的方法遭到了其他研究人員的批評，他們進(jìn)行了后續(xù)實(shí)驗(yàn)，并得出結(jié)論，大語言模型之所以能得出正確答案，往往是基于“淺顯的啟發(fā)”和捷徑，而不是真正基于心智理論推理。

本研究的作者很清楚這種爭論。“在論文中，我們的目標(biāo)是使用廣泛的心理測試，以更加系統(tǒng)的方式來應(yīng)對機(jī)器心智理論的評估挑戰(zhàn)?！痹撗芯康暮现哒材匪?斯特拉坎（James Strachan）說，他是一名認(rèn)知心理學(xué)家，目前是漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心的訪問科學(xué)家。他指出，進(jìn)行嚴(yán)謹(jǐn)?shù)难芯恳馕吨獪y試人類和大語言模型處理相同任務(wù)的能力，這項(xiàng)研究比較了1907個人與幾個流行的大語言模型的能力。

大語言模型和人類都完成了5種典型的心智理論測試，前3種是理解暗示、反語和失禮。此外，他們還回答了“錯誤信念”問題，這些問題通常用于確定幼兒心智理論的發(fā)展程度。這些問題是這樣的：如果愛麗絲在鮑勃不在房間的時候移動了某樣?xùn)|西，那么鮑勃回來后應(yīng)該去哪里找這個東西？最后，他們回答了“奇怪故事”中一些相當(dāng)復(fù)雜的問題，這些故事中的人物相互撒謊、操縱并產(chǎn)生了很多誤解。

總體而言，GPT-4占據(jù)了優(yōu)勢。它的得分在錯誤信念測試中與人類相當(dāng)，在反語、暗示和奇怪故事方面的總分高于人類，只在失禮測試中表現(xiàn)不如人類。為了理解失禮測試結(jié)果有所不同的原因，研究人員對該模型進(jìn)行了一系列后續(xù)測試，探索了幾種假設(shè)。他們得出的結(jié)論是，GPT-4能夠?qū)τ嘘P(guān)失禮的問題給出正確答案，但在固執(zhí)己見方面受到“極端保守”編程的限制。斯特拉坎指出，OpenAI在模型周圍設(shè)置了許多圍欄，“旨在保持模型真實(shí)、誠實(shí)和正確”，他認(rèn)為，旨在防止GPT-4產(chǎn)生幻覺（即編造內(nèi)容）的策略可能會妨礙它對一些問題輸出觀點(diǎn)，比如故事角色是否在高中同學(xué)聚會上無意間侮辱了老同學(xué)。

研究人員很謹(jǐn)慎。他們沒有說自己的研究結(jié)果表明大語言模型實(shí)際上擁有心智理論能力，而是說大語言模型“在心智理論任務(wù)中的表現(xiàn)與人類行為沒有區(qū)別”。這就引出了一個問題：如果一個仿品和真品一樣好，那你怎么知道它不是真品？斯特拉坎說，這是一個社會科學(xué)家以前從未嘗試回答的問題，因?yàn)閷θ祟惖臏y試會假設(shè)這種品質(zhì)在某種程度上是存在的?！拔覀兡壳斑€沒有一種方法甚至是一種理念來測試心智理論的存在，這是一種現(xiàn)象學(xué)品質(zhì)。”他說。

華盛頓大學(xué)計(jì)算語言學(xué)教授艾米麗?本德（Emily Bender）因堅(jiān)持揭露人工智能行業(yè)的膨脹炒作而成為了該領(lǐng)域的傳奇人物。她對這個激勵著研究人員的問題提出了異議?！懊鎸ο嗤瑔栴}，文本處理系統(tǒng)能否產(chǎn)生與人類相似的答案為什么如此重要？”她問道，“我們能夠了解大語言模型內(nèi)部是如何運(yùn)作的嗎？它們可能有什么用處，又可能帶來哪些危險？”

本德對論文中的擬人化表示擔(dān)憂，論文研究人員說大語言模型有認(rèn)知、推理和作出選擇的能力，還使用了“大語言模型和人類參與者之間的物種公平比較”這一措辭。本德說，這“完全沒有將軟件囊括在內(nèi)”。

漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心團(tuán)隊(duì)的研究結(jié)果可能并不表明人工智能真的能理解我們，但值得思考的是，人工智能能夠做出令人信服的行為，這會帶來什么影響。雖然這種大語言模型在與人類用戶交互和預(yù)測用戶需求方面會做得更好，但它們也可能更多地用于欺騙和操縱。它們會引來更多的擬人化，讓人類用戶相信用戶界面的另一端是有思想的。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1791

文章
47183

瀏覽量
238212

原文標(biāo)題：人工智能在心智理論測試中戰(zhàn)勝人類

文章出處：【微信號：AI智勝未來，微信公眾號：AI智勝未來】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

嵌入式和人工智能究竟是什么關(guān)系?

領(lǐng)域，如工業(yè)控制、智能家居、醫(yī)療設(shè)備等。 人工智能是計(jì)算機(jī)科學(xué)的一個分支，它研究如何使計(jì)算機(jī)具備像人類一樣思考、學(xué)習(xí)、推理和決策的能力。人工智能的發(fā)展歷程可以追溯到上世紀(jì)50年代，經(jīng)

發(fā)表于 11-14 16:39

人工智能對人類的影響有哪些

人工智能（AI）作為現(xiàn)代科技的杰出代表，正在以前所未有的速度改變著人類的生活、工作和社會結(jié)構(gòu)。這種影響是全方位的，既帶來了顯著的積極變化，也伴隨著一系列挑戰(zhàn)和問題。一、積極影響工作變革與經(jīng)濟(jì)增長

發(fā)表于 10-22 17:23 ?1681次閱讀

《AI for Science：人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

幸得一好書，特此來分享。感謝平臺，感謝作者。受益匪淺。在閱讀《AI for Science：人工智能驅(qū)動科學(xué)創(chuàng)新》的第6章后，我深刻感受到人工智能在能源科學(xué)領(lǐng)域中的巨大潛力和廣泛應(yīng)用。這一章詳細(xì)

發(fā)表于 10-14 09:27

AI for Science：人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

農(nóng)業(yè)、環(huán)保等，為人類社會的可持續(xù)發(fā)展做出貢獻(xiàn)。總結(jié) 《AI for Science：人工智能驅(qū)動科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分，為我們展示了一個充滿希望和機(jī)遇的未來。在這個未來中，人工智能

發(fā)表于 10-14 09:21

《AI for Science：人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

，還促進(jìn)了新理論、新技術(shù)的誕生。 3. 挑戰(zhàn)與機(jī)遇并存盡管人工智能為科學(xué)創(chuàng)新帶來了巨大潛力，但第一章也誠實(shí)地討論了伴隨而來的挑戰(zhàn)。數(shù)據(jù)隱私、算法偏見、倫理道德等問題不容忽視。如何在利用AI提升科研效率

發(fā)表于 10-14 09:12

risc-v在人工智能圖像處理應(yīng)用前景分析

RISC-V在人工智能圖像處理領(lǐng)域的應(yīng)用前景十分廣闊，這主要得益于其開源性、靈活性和低功耗等特點(diǎn)。以下是對RISC-V在人工智能圖像處理應(yīng)用前景的詳細(xì)分析：一、RISC-V的基本特點(diǎn) RISC-V

發(fā)表于 09-28 11:00

人工智能ai 數(shù)電模電模擬集成電路原理電路分析

人工智能ai 數(shù)電模電模擬集成電路原理電路分析想問下哪些比較容易學(xué) 不過好像都是要學(xué)的

發(fā)表于 09-26 15:24

人工智能ai4s試讀申請

目前人工智能在繪畫對話等大模型領(lǐng)域應(yīng)用廣闊，ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題，本書對ai4s基本原理和原則，方法進(jìn)行描訴，有利于總結(jié)經(jīng)驗(yàn)，擬按照要求準(zhǔn)備相關(guān)體會材料。看能否有助于入門和提高ss

發(fā)表于 09-09 15:36

名單公布！【書籍評測活動NO.44】AI for Science：人工智能驅(qū)動科學(xué)創(chuàng)新

大力發(fā)展AI for Science的原因。第2章從科學(xué)研究底層的理論模式與主要困境，以及人工智能三要素（數(shù)據(jù)、算法、算力）出發(fā)，對AI for Science的技術(shù)支撐進(jìn)行解讀。第3章介紹了在

發(fā)表于 09-09 13:54

報名開啟！深圳（國際）通用人工智能大會將啟幕，國內(nèi)外大咖齊聚話AI

8月28日至30日，2024深圳（國際）通用人工智能大會暨深圳（國際）通用人工智能產(chǎn)業(yè)博覽會將在深圳國際會展中心（寶安）舉辦。大會以“魅力AI·無限未來”為主題，致力于打造全球通用人工智能領(lǐng)域集產(chǎn)品

發(fā)表于 08-22 15:00

FPGA在人工智能中的應(yīng)用有哪些？

FPGA（現(xiàn)場可編程門陣列）在人工智能領(lǐng)域的應(yīng)用非常廣泛，主要體現(xiàn)在以下幾個方面：一、深度學(xué)習(xí)加速訓(xùn)練和推理過程加速：FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性

發(fā)表于 07-29 17:05

5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)（SC171開發(fā)套件V2）

*附件：泛邊緣案例課.pdf 人工智能 引體向上測試案例 14分21秒 https://t.elecfans.com/v/27186.html *附件：引體向上測試案例_20240126.pdf

發(fā)表于 05-10 16:46

5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)（SC171開發(fā)套件V1）

機(jī)器人案例.pdf 人工智能 AI泛邊緣：智能安防實(shí)訓(xùn) 31分38秒 https://t.elecfans.com/v/25509.html *附件：泛邊緣案例課.pdf 人工智能 引體向上測

發(fā)表于 04-01 10:40

嵌入式人工智能的就業(yè)方向有哪些?

嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時代背景下，嵌入式人工智能成為國家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時在此背景驅(qū)動下，眾多名企也紛紛在嵌入式人工智能領(lǐng)域布局

發(fā)表于 02-26 10:17

人工智能在軟件測試中的應(yīng)用

隨著信息技術(shù)的飛速發(fā)展，軟件測試的重要性越來越凸顯。傳統(tǒng)的軟件測試方法往往需要耗費(fèi)大量時間和人力，而且難以發(fā)現(xiàn)一些深層次的缺陷。為了提高軟件的質(zhì)量和可靠性，越來越多的企業(yè)開始探索人工智能技術(shù)在軟件

發(fā)表于 12-26 11:02 ?617次閱讀

RM新时代网站-首页

搜索歷史

心智理論測試:人工智能擊敗人類

評論