OpenAI o1大模型震撼發(fā)布,號(hào)稱秒殺GPT-4o、claude-3.5-sonnet、llama3.1-405b、deepseekv2.5、Qwen2?還超越了人類專家?
9月13日午夜(北京時(shí)間),OpenAI正式公開一系列全新AI大模型,這些模型旨在專門攻克各類難題。它們具備強(qiáng)大的復(fù)雜推理能力,作為通用模型,其所能解決問題的難度遠(yuǎn)超前代的科學(xué)、代碼和數(shù)學(xué)模型。
o1便是此前OpenAI從山姆?奧特曼到各位科學(xué)家們一直大力“高調(diào)宣傳”的草莓大模型。據(jù)了解,它具備真正意義上的通用推理能力。在一系列高難度的基準(zhǔn)測試中,o1大模型展現(xiàn)出了令人驚嘆的超強(qiáng)實(shí)力,相較于GPT-4o實(shí)現(xiàn)了巨大的跨越,使大模型的水平從不盡人意直接躍升至優(yōu)秀級(jí)別。它無需專門訓(xùn)練就能在數(shù)學(xué)奧賽中斬獲金牌,甚至在博士級(jí)別的科學(xué)問答環(huán)節(jié)中超越了人類專家。
不過,由于o1等大型語言模型是基于大量文本數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練的,盡管它們蘊(yùn)含了廣泛的世界知識(shí),但在實(shí)際應(yīng)用中,可能存在成本高昂且運(yùn)行速度較慢的問題。
因此,更多的企業(yè)或許會(huì)優(yōu)先選擇開源模型。
說到開源模型,大家在評(píng)估開源模型使用效果時(shí),通常會(huì)使用哪些站點(diǎn)呢?
在此,我推薦我正在使用的兩個(gè)平臺(tái):www.perfxcloud.cn和llmworld.net,PerfXCloud可以免費(fèi)評(píng)估各類主流大模型,包括llama3.1-405b、deepseek,面壁小鋼炮等各類主流大模型,llmworld上還有一些非常實(shí)用的AI小應(yīng)用。
目前,o1-preview每位用戶每周僅能發(fā)送30條消息,o1-mini每位用戶每周僅能發(fā)送50條消息,我們都在期待正式上線后的價(jià)格公布。在llmworld.net上暫時(shí)還沒有看到該模型的價(jià)格信息。
在人工智能飛速發(fā)展的當(dāng)下,OpenAI的o1大模型無疑為我們帶來了新的思考和挑戰(zhàn)。一方面,我們驚嘆于其強(qiáng)大的性能表現(xiàn),另一方面也不得不面對(duì)其在實(shí)際應(yīng)用中的局限性。
期待有更多優(yōu)秀的開源模型崛起,為我們提供更多的選擇和可能性!
審核編輯 黃宇
-
GPT
+關(guān)注
關(guān)注
0文章
352瀏覽量
15342 -
OpenAI
+關(guān)注
關(guān)注
9文章
1079瀏覽量
6481 -
大模型
+關(guān)注
關(guān)注
2文章
2423瀏覽量
2640
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論