RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新火種AI|秒殺GPT-4,狙殺GPT-5,橫空出世的Claude 3振奮人心!

新火種 ? 來(lái)源:新火種 ? 作者:新火種 ? 2024-03-06 22:22 ? 次閱讀

2024年第一季度才剛過(guò)半,AI領(lǐng)域就大動(dòng)作不斷,大家卯著勁的出新品,可謂卷出天際。

3月4日,Anthropic發(fā)布了最新的Claude 3系列模型,用Anthropic的話說(shuō),Claude 3的出現(xiàn)意味著打開了一個(gè)全新的世界,其系列模型在推理,數(shù)學(xué),編碼,多語(yǔ)言理解和視覺(jué)方面,都樹立了全新的行業(yè)新基準(zhǔn)。

wKgZomXofCqAHVbgAALexcwIK9w322.jpg

也正是因?yàn)镃laude 3的出現(xiàn),全球最強(qiáng)AI模型一夜易主,曾經(jīng)被認(rèn)為不可一世的GPT-4被拉下神壇,Claude 3很可能對(duì)GPT-4實(shí)現(xiàn)全方位的碾壓。

Anthropic發(fā)布3個(gè)模型,全方位實(shí)現(xiàn)Claude 3的超強(qiáng)性能。

據(jù)悉,本次Anthropic共發(fā)布了三個(gè)模型,按照性能從低到高,分別是Claude 3 Haiku,Claude 3 Sonnet,以及Claude 3 Opus,并發(fā)布了一份長(zhǎng)達(dá)42頁(yè)的技術(shù)報(bào)告。

值得一提的是,此次3個(gè)模型的命名是很有講究的。依照功能的從低到高,它名字的翻譯分別是緋句(Haiku),代表性價(jià)比之王;十四行詩(shī)(Sonnet),代表響應(yīng)較快,是性能加強(qiáng)版;以及巨作(Opus),堪稱性能頂配。

wKgaomXofCuALSXhAAF0xRrhdfU322.jpg

由此可見,Claude 3 Opus在本系列中性能最強(qiáng)大。該模型已在多項(xiàng)AI系統(tǒng)常用評(píng)估標(biāo)準(zhǔn)中領(lǐng)先業(yè)界LLM,如本科級(jí)別專業(yè)知識(shí)(MMLU),研究生級(jí)別專家推理(GPQA),基礎(chǔ)數(shù)學(xué)(GSM8K)等。特別需要說(shuō)明的是,Claude 3 Opus在處理復(fù)雜任務(wù)時(shí),其理解和表達(dá)能力幾乎接近于人類,這意味著人類在AI領(lǐng)域又邁進(jìn)了一大步。

通過(guò)將Claude 3系列模型與同類產(chǎn)品進(jìn)行對(duì)比,我們可以看到,Claude 3 Opus模型性能完全能夠碾壓GPT-4,以及Gemini 1.0 Ultra;Claude 3 Sonnet在部分基準(zhǔn)上,諸如GSM8K,MATH等方面超越了GPT-4;Claude 3 Haiku也可以與Gemini 1.0 Pro相抗衡。

擁有三大核心優(yōu)勢(shì)傍身,Claude 3前途無(wú)量。

總結(jié)Claude 3所具有的優(yōu)勢(shì),主要有以下三點(diǎn):

性能無(wú)短板,擅長(zhǎng)長(zhǎng)文本優(yōu)化,顯著降低拒絕率。

先來(lái)說(shuō)說(shuō)性能方面。Claude 3的大語(yǔ)言模型全面趕超了GPT-4,多模態(tài)視覺(jué)任務(wù)處理性能力優(yōu)秀,在回答復(fù)雜開放性問(wèn)題時(shí)的準(zhǔn)確率也翻倍提升。特別是當(dāng)用戶直接上傳數(shù)學(xué),物理這一類考驗(yàn)邏輯和準(zhǔn)確度的理科題照片,或者細(xì)節(jié)豐富的圖表時(shí),Claude 3所回復(fù)的解題水平和準(zhǔn)確率相較于先前版本提高了很多,甚至在一些細(xì)節(jié)描述上比GPT- 4更勝一籌。在多模態(tài)能力方面,Claude 3模型可以從視覺(jué)上識(shí)別物體,能用復(fù)雜的方式思考,既能理解物體的外觀,也能理解它與數(shù)學(xué)等概念的聯(lián)系。

Anthropic AI研究工程師Emmanuel Ameisen就曬出了一個(gè)測(cè)試示例:向Opus輸入2小時(shí)13分鐘視頻原始文本,每隔5秒截取的屏幕截圖等圖文素材,它就能成功將其轉(zhuǎn)換成一篇圖文并茂的HTML格式博客文章。

wKgZomXofCuATa-PAALtPHU_KA8907.jpg

在文本優(yōu)化方面,Claude 3也交出了一份令人滿意的答卷。要知道,先前的Claude 2.1版本常被吐槽長(zhǎng)文本理解效果差,Claude 3便在這個(gè)方面做了重點(diǎn)改進(jìn),頂配Opus在200K tokens NIAH測(cè)試中準(zhǔn)確率超過(guò)99%,展現(xiàn)了強(qiáng)大的召回能力(1K tokens相當(dāng)于750個(gè)單詞)。

此外,Claude 3還顯著減少了拒絕回答問(wèn)題的頻率。很多大語(yǔ)言模型會(huì)頻繁拒絕回答詢問(wèn),Claude 3則顯著改進(jìn)了這一點(diǎn),它能夠更明確的辨別真正的風(fēng)險(xiǎn)問(wèn)題,減少無(wú)故拒絕回答安全詢問(wèn)的情況。

“OpenAI叛軍”完美制衡住了GPT-4,未來(lái)的AI王者將鹿死誰(shuí)手?

Anthropic用一記絕殺將GPT-4拉下了神壇,很多人覺(jué)得這是AI新秀的一次勝利。但如果你了解過(guò)Anthropic與OpenAI之間潛藏的錯(cuò)綜復(fù)雜關(guān)系的話,就會(huì)發(fā)現(xiàn)此次Claude 3的勝利,并非偶然。

wKgaomXofCyAObZIAAflRfJQi8E594.jpg

Anthropic究竟是誰(shuí)?有消息來(lái)源表示,Anthropic其實(shí)就是原OpenAI員工組建的公司,這些員工因?yàn)槟承┌l(fā)展理念不合直接出走,并選擇“反叛”,最終成為了OpenAI的最強(qiáng)勁敵。

2021年,多名OpenAI員工不滿OpenAI在獲得微軟投資后走向封閉,憤而出走并聯(lián)合創(chuàng)立了Anthropic。他們對(duì)OpenAI在安全問(wèn)題尚未解決的情況下就直接發(fā)布GPT-3的行為感到不滿,認(rèn)為OpenAI已經(jīng)為追逐利益而“遺忘了初心”。

這一干出走的員工之中就包括打造出GPT-2和GPT-3的研究部門副總裁Dario Amodei。他在2016年進(jìn)入OpenAI,離開前擔(dān)任研究副總裁,這絕對(duì)是OpenAI的核心位置。離開時(shí),Dario還帶走了GPT-3首席工程師Tom Brown,以及擔(dān)任安全與策略部門副總監(jiān)的妹妹Daniela Amodei以及10多名心腹,可謂人才多多。這些人才,也最終成為了Anthropic的中流砥柱。

wKgZomXofC2AYiS6AAC9Gw0I32U363.jpg

2023年1月,Claude開啟內(nèi)測(cè),彼時(shí)很多網(wǎng)友在第一時(shí)間體驗(yàn)了Claude,并表示它比當(dāng)時(shí)的GPT-3強(qiáng)太多。

除了擁有諸多人才,Anthropic如今也獲得了強(qiáng)大的資本為其背書,截至目前,它已經(jīng)獲得了包括谷歌,亞馬遜科技在內(nèi)的26個(gè)機(jī)構(gòu)或個(gè)人的融資,總計(jì)融資金額達(dá)到了76億美元。

毫無(wú)疑問(wèn)的是,如今Anthropic的飛速發(fā)展和進(jìn)步令更令業(yè)界十分振奮。這個(gè)僅誕生3年的大模型初創(chuàng)公司,不是手握頂級(jí)人才,更擁有了鈔能力和雄厚的計(jì)算資源。這說(shuō)明OpenAI在大模型技術(shù)上的領(lǐng)先身位并非遙不可及。坐擁Top級(jí)創(chuàng)始成員和精兵強(qiáng)將的創(chuàng)業(yè)團(tuán)隊(duì),完全有能力做出與OpenAI風(fēng)庭抗禮的產(chǎn)品,所消耗的人力,財(cái)力,算力資源卻只會(huì)更少。

Claude 3的橫空出世和巨大成功或許會(huì)給我們帶來(lái)一些啟發(fā):或許,我們也是有機(jī)會(huì)和能力來(lái)做出超越GPT-4的產(chǎn)品的。

如果單論規(guī)模,Anthropic顯然不及OpenAI,但它依舊取得了巨大的成功。每每提起AI賽道,我們總會(huì)認(rèn)為這個(gè)賽道就是要無(wú)止盡的燒錢,卷人才,卷技術(shù)。不過(guò),相較于耗費(fèi)了多大的成本去卷,怎么卷,朝哪個(gè)方向卷顯然是更重要的事情。畢竟,在AI領(lǐng)域,選擇永遠(yuǎn)大于努力。

或許在不久的未來(lái),OpenAI還會(huì)推出令人驚艷的GPT-5,但至少就目前而言,GPT不可戰(zhàn)勝的神話已經(jīng)破滅了。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30728

    瀏覽量

    268874
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47183

    瀏覽量

    238211
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1079

    瀏覽量

    6480
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    OPPO A5青春版橫空出世

    集微網(wǎng)消息,前不久OPPO悄悄給專攻線下的A系列手機(jī)升級(jí)硬件配置,于是A5橫空出世。
    的頭像 發(fā)表于 07-11 15:30 ?6376次閱讀

    華為云手機(jī)橫空出世,云手機(jī)的運(yùn)用領(lǐng)域和優(yōu)勢(shì)

    9月1日,華為突然扔出一顆重磅炸彈:華為云手機(jī),橫空出世!
    的頭像 發(fā)表于 09-13 10:40 ?5630次閱讀

    GPT-4是這樣搞電機(jī)的

    GPT-4寫電機(jī)基礎(chǔ)程序沒(méi)問(wèn)題
    的頭像 發(fā)表于 04-17 09:41 ?1012次閱讀
    <b class='flag-5'>GPT-4</b>是這樣搞電機(jī)的

    Auto GPT橫空出世,力推算力設(shè)施

    Auto GPT 區(qū)別于傳統(tǒng) GPT,可在沒(méi)有任何用戶指導(dǎo)的情況下搜索互聯(lián)網(wǎng)和執(zhí)行保存文件等操作的能力: 如下圖所示,Auto GTP 在 GitHub 上的展示任務(wù)為為即將到來(lái)的復(fù)活節(jié)等活動(dòng)發(fā)現(xiàn)和生成獨(dú)特的原始食譜,Auto GPT
    的頭像 發(fā)表于 04-18 10:07 ?1066次閱讀

    OpenAI已為GPT-5申請(qǐng)商標(biāo),GPT-5要來(lái)了?

    OpenAI 此前曾在前幾代模型(例如 GPT-4GPT-3.5)的商標(biāo)申請(qǐng)中,使用過(guò)同樣的“用于使用語(yǔ)言模型的可下載計(jì)算機(jī)軟件”這一描述。但很遺憾,最新申請(qǐng)文件中透露的唯一關(guān)鍵細(xì)節(jié)就只有“GPT-5”字樣,并不代表 Op
    的頭像 發(fā)表于 08-02 15:51 ?734次閱讀
    OpenAI已為<b class='flag-5'>GPT-5</b>申請(qǐng)商標(biāo),<b class='flag-5'>GPT-5</b>要來(lái)了?

    GPT-4沒(méi)有推理能力嗎?

    今年三月,OpenAI 重磅發(fā)布了 GPT-4 大模型,帶來(lái)了比 ChatGPT 背后 GPT-3.5 更強(qiáng)的推理、計(jì)算、邏輯能力,也引發(fā)了全民使用的熱潮。在各行各領(lǐng)域研究人員、開發(fā)者、設(shè)計(jì)師的使用過(guò)程中,「GPT-4 是最為領(lǐng)
    的頭像 發(fā)表于 08-11 14:20 ?888次閱讀
    <b class='flag-5'>GPT-4</b>沒(méi)有推理能力嗎?

    OpenAI最新大模型曝光!劍指多模態(tài),GPT-4之后最大升級(jí)!

    目前為止,OpenAI還沒(méi)有對(duì)爆料中的傳聞做出回應(yīng),但此前發(fā)布過(guò)多模態(tài)模型測(cè)試。CEO奧特曼在回應(yīng)有關(guān)GPT-5的傳聞時(shí),也暗示過(guò)GPT-4“正在增強(qiáng)”。
    的頭像 發(fā)表于 09-20 17:34 ?1219次閱讀
    OpenAI最新大模型曝光!劍指多模態(tài),<b class='flag-5'>GPT-4</b>之后最大升級(jí)!

    火種AI|谷歌深夜發(fā)布復(fù)仇神器Gemini,原生多模態(tài)碾壓GPT-4?

    谷歌背水一戰(zhàn),發(fā)布Gemini,狙擊GPT-4
    的頭像 發(fā)表于 12-08 09:09 ?1129次閱讀
    新<b class='flag-5'>火種</b><b class='flag-5'>AI</b>|谷歌深夜發(fā)布復(fù)仇神器Gemini,原生多模態(tài)碾壓<b class='flag-5'>GPT-4</b>?

    火種AI|從GPT-5AI芯片廠,山姆·奧特曼在下一盤多大的棋?

    標(biāo)題:從GPT-5AI芯片廠,山姆·奧特曼在下一盤多大的棋? 轉(zhuǎn)發(fā)語(yǔ):山姆·奧特曼暴露野心,同時(shí)挑戰(zhàn)英偉達(dá)和臺(tái)積電?
    的頭像 發(fā)表于 01-26 09:54 ?388次閱讀
    新<b class='flag-5'>火種</b><b class='flag-5'>AI</b>|從<b class='flag-5'>GPT-5</b>到<b class='flag-5'>AI</b>芯片廠,山姆·奧特曼在下一盤多大的棋?

    全球最強(qiáng)大模型易主:GPT-4被超越,Claude 3系列嶄露頭角

    近日,人工智能領(lǐng)域迎來(lái)了一場(chǎng)革命性的突破。Anthropic公司發(fā)布了全新的Claude 3系列模型,該系列模型在多模態(tài)和語(yǔ)言能力等關(guān)鍵指標(biāo)上展現(xiàn)出卓越性能,成功超越了此前被廣泛認(rèn)為是全球最強(qiáng)AI模型的
    的頭像 發(fā)表于 03-05 09:42 ?642次閱讀

    Anthropic推出Claude 3系列模型,全面超越GPT-4,樹立AI新標(biāo)桿

    近日,AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic震撼發(fā)布了全新的Claude 3系列模型,該系列模型在多模態(tài)和語(yǔ)言能力等關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能,成功擊敗了此前被廣泛認(rèn)為是全球最強(qiáng)AI模型的
    的頭像 發(fā)表于 03-05 09:49 ?678次閱讀

    全球最強(qiáng)大模型易主,GPT-4被超越

    近日,AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic宣布推出全新的Claude 3系列模型,其中包括最強(qiáng)版Claude 3 Opus。據(jù)該公司稱,
    的頭像 發(fā)表于 03-05 09:58 ?645次閱讀

    OpenAI預(yù)計(jì)最快今年夏天發(fā)布GPT-5

    OpenAI正計(jì)劃在未來(lái)數(shù)月內(nèi),可能是今年夏季,發(fā)布備受矚目的GPT-5模型。據(jù)悉,部分企業(yè)客戶已提前體驗(yàn)了OpenAI最新模型及其ChatGPT工具的改進(jìn)版Demo。一位CEO在體驗(yàn)后贊不絕口:“它真的令人驚艷,相較于之前的版本,GPT-5帶來(lái)了實(shí)質(zhì)性的飛躍?!?/div>
    的頭像 發(fā)表于 03-22 10:40 ?758次閱讀

    OpenAI有望在年中推出全新GPT-5模型

    近日,人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI傳來(lái)了令人振奮的消息。據(jù)悉,他們有望在今年的年中,大約是夏季時(shí)分,推出全新的GPT-5模型。這一消息引發(fā)了業(yè)界的廣泛關(guān)注與期待。
    的頭像 發(fā)表于 03-22 11:29 ?774次閱讀

    OpenAI CEO: GPT-4o and GPT-5引領(lǐng)未來(lái)12個(gè)月編程領(lǐng)域,GPT-5更具潛力

    據(jù)報(bào)道,OpenAI首席執(zhí)行官阿萊夫·阿爾特曼在接受Redpoint風(fēng)投公司LoganBartlett的專訪中,透露了最近發(fā)布的GPT-40以及即將面世的GPT-5
    的頭像 發(fā)表于 05-17 16:25 ?551次閱讀
    RM新时代网站-首页