rm官网怎么登录,RM平台

完整版o1“被泄露”，成了上周AI界的大新聞。

9月13日，OpenAI發(fā)布了傳說中代號“草莓”的全新模型系列的預(yù)覽版o1 preview，隨后又上線了o1 mini。o1模型系列，能夠模仿人類思維過程“慢思考”，提升了AI的邏輯推理能力，成為AI模型領(lǐng)域的王炸，牽動著整個(gè)行業(yè)的神經(jīng)。

而就在上周，有不少用戶突然發(fā)現(xiàn)，能在ChatGPT官網(wǎng)上用到完整版o1了。奧特曼更是不小心“登錯(cuò)賬號”，在社交媒體宣布“o2即將登場”。

從o1 preview到o2，這一系列模型，炸裂歸炸裂，但所謂的推理能力好像并沒有真正融入產(chǎn)業(yè)應(yīng)用，以至于大家都有種狼來了的感覺，開始猜測這不過是奧特曼的又一次宣傳噱頭。

比如，就有網(wǎng)友覺得完整版o1被釋放，并不是“不小心”，而是“精心策劃”的炒作，奧特曼“登錯(cuò)號劇透o2”也是裝的。

如何避免真實(shí)的技術(shù)價(jià)值淪為“狼來了”的戲碼？答案就是，別讓模型能力成為空中樓閣，而是加速落地到產(chǎn)業(yè)中。

到底哪些場景才能充分發(fā)揮o1“慢思考”的技術(shù)潛力呢？本文就來找找產(chǎn)業(yè)化落地的路子。

落地產(chǎn)業(yè)，前提是正確認(rèn)識到技術(shù)的價(jià)值。o1模型系列與老前輩們的最大區(qū)別和價(jià)值究竟是啥呢？就是慢思考。

我們都知道GPT-4o啥的處理些日常瑣事還行，但時(shí)不時(shí)就會犯點(diǎn)小迷糊，算個(gè)小學(xué)數(shù)學(xué)題加減法都錯(cuò)漏百出。而o1就像是經(jīng)過嚴(yán)格訓(xùn)練的學(xué)霸，?？诉壿嬐评?、復(fù)雜任務(wù)難題。前不久的OpenAI倫敦開發(fā)者日上，完整版o1的五大能力包括：函數(shù)調(diào)用、開發(fā)者message、流式傳輸、結(jié)構(gòu)化輸出、圖像理解。

如果說4o的數(shù)學(xué)水平是高中生程度，那么9月發(fā)布的o1-preview就有大學(xué)生水平了，即將發(fā)布的o2在GPQA研究生級別基準(zhǔn)中取得了105%的成績，未來是妥妥的研究生了。

而上述能力靠的就是o1的獨(dú)門秘籍——慢思考。

已知人腦有兩種模式：一種是快思考，就是咱們平時(shí)“一拍腦門”那種憑直覺、靠經(jīng)驗(yàn)的快速決策；另一種是慢思考，指的是在解數(shù)學(xué)題、進(jìn)行科學(xué)推理需要花時(shí)間、費(fèi)精力去琢磨的思考模式，更注重邏輯和理性分析。

o1通過學(xué)習(xí)人腦深思熟慮、穩(wěn)扎穩(wěn)打的思考模式，o1采用強(qiáng)化學(xué)習(xí)+思維鏈，把復(fù)雜問題拆成小塊，一步步來，直到得出最準(zhǔn)確的答案，極大地提高了模型的推理能力。

研究生級別的學(xué)霸o1模型系列，給AI界帶來了全新的可能。但如何將“慢思考”的技術(shù)潛力真正轉(zhuǎn)化為實(shí)際應(yīng)用，讓o1成為推動產(chǎn)業(yè)進(jìn)步的重要力量？還是一個(gè)需要進(jìn)一步探索的話題。

產(chǎn)業(yè)大不同，落地有先后。按照落地的難易程度，我們可能會看到類o1的“慢思考”能力，在以下產(chǎn)業(yè)逐步應(yīng)用開來。

堅(jiān)實(shí)的數(shù)字化基礎(chǔ)、對新技術(shù)的高接受度、強(qiáng)大的付費(fèi)能力，這些特性使得金融成為大模型技術(shù)落地的理想場所。

幾乎所有的大模型廠商，都將金融行業(yè)作為業(yè)務(wù)開拓的第一站。然而，在金融與大模型的結(jié)合過程中，由于大模型的推理能力不強(qiáng)，加上幻覺問題，導(dǎo)致大模型在金融領(lǐng)域的復(fù)雜應(yīng)用中表現(xiàn)并不理想。

此前，大模型在金融行業(yè)的應(yīng)用范圍，主要是一些容錯(cuò)率較高的淺層應(yīng)用上，如智能客服、報(bào)表文檔助手。而風(fēng)控、信貸、投資分析等的嚴(yán)肅生產(chǎn)力場景，需要對多種模態(tài)的數(shù)據(jù)，進(jìn)行深入分析和推理，決策質(zhì)量要求極高。這些核心業(yè)務(wù)中，大模型在工作流中發(fā)揮的價(jià)值相對有限，主要還是得靠人類專家來做。

一位銀行從業(yè)者表示，客戶需要我們的理財(cái)分析師給出犀利、專業(yè)的觀點(diǎn)來幫助決策，而大模型只會泛泛而談，沒什么參考價(jià)值。

人人都希望由專業(yè)的金融從業(yè)人員來服務(wù)，如果AI模型能夠在一些容錯(cuò)率低的嚴(yán)肅場景中應(yīng)用，只需要少量人工干預(yù)、監(jiān)督和驗(yàn)證，那么專業(yè)人士的時(shí)間精力，不就可以解放出來了嗎？隨著“慢思考”邏輯推理能力的出現(xiàn)，這一期待真的有可能實(shí)現(xiàn)。

基于類o1的邏輯推理能力，我們有望看到AI在金融核心業(yè)務(wù)中承擔(dān)起專家角色，發(fā)揮更重要的作用。比如像專業(yè)審核員一樣讀征信報(bào)告、看賬單流水，甚至能解讀網(wǎng)絡(luò)大數(shù)據(jù)，思考和捕捉數(shù)據(jù)之間的關(guān)聯(lián)，并生成風(fēng)險(xiǎn)判斷的依據(jù)和結(jié)論。

又或者像專業(yè)分析師一樣，根據(jù)用戶需求進(jìn)行個(gè)性化的產(chǎn)品設(shè)計(jì)，縝密分析投資策略，給出理財(cái)、投資、投保等建議。

慢思考可以讓AI從淺層、邊緣、單一的場景，進(jìn)入到復(fù)雜、核心、高價(jià)值的核心業(yè)務(wù)中，突破大模型在金融行業(yè)的價(jià)值上限。

“o1實(shí)在太強(qiáng)了……我的博士作業(yè)做了20個(gè)小時(shí)，被它3分鐘思考就拿下了。剛讀博就出這個(gè)，感覺人生都灰暗了[流淚] ?！边壿嬐评砟芰_(dá)到研究生水平的o1模型系列，讓不少人類研究生、博士生感到了切實(shí)的危機(jī)。

但用一句流行語來說，“o1不是來拆散科研這個(gè)家，而是來加入這個(gè)家的”。

近幾十年來，神經(jīng)網(wǎng)絡(luò)算法已經(jīng)被廣泛應(yīng)用于科研領(lǐng)域，從宏觀世界的天文探索、引力波探測，到微觀世界的蛋白質(zhì)折疊、同步光源等，數(shù)據(jù)科學(xué)和算法工程提供了大量的操作手段，幫助科學(xué)領(lǐng)域的探索性課題取得突破。AI技術(shù)已經(jīng)成為科學(xué)研究不可或缺的一部分，AI4S的大趨勢不可阻擋。

面對這個(gè)過程，一位高校力學(xué)老師曾對我們說過一個(gè)比喻：AI和力學(xué)的結(jié)合，就像是成功的婚姻才剛剛開始，會有甜蜜期，也會有磨合期。

傳統(tǒng)模型算法雖然有強(qiáng)大的計(jì)算能力和手段，但缺乏深入的邏輯推理能力和對科學(xué)原理的深刻理解，面對復(fù)雜的科學(xué)問題時(shí)，往往力不從心，難以提供準(zhǔn)確且可靠的解決方案。思考方式跟追求嚴(yán)謹(jǐn)?shù)目茖W(xué)家們大相徑庭，此前的AI4S全靠人類遷就。

而o1慢思考強(qiáng)調(diào)的逐步分析、深入推理，這種思考方式與科學(xué)研究的本質(zhì)不謀而合。具備慢思考能力的AI模型，相當(dāng)于掌握了碩博們的學(xué)習(xí)方法，可以逐步拆解問題、分析數(shù)據(jù)、反復(fù)驗(yàn)算、推導(dǎo)結(jié)論。

在科研領(lǐng)域，類o1模型可以作為科學(xué)家們的“科研伴侶”，扮演好幾種角色：

1.靈感繆斯。在一些經(jīng)典的科學(xué)問題，或者已經(jīng)成熟的科研結(jié)果上，科學(xué)家們往往還要開發(fā)新方法、新理論。這個(gè)過程中，AI的邏輯推理能力可以發(fā)現(xiàn)數(shù)據(jù)之間的潛在聯(lián)系和規(guī)律，提出新的假設(shè)和預(yù)測，為科學(xué)研究開辟新的道路。

2.科研助理。隨著科學(xué)領(lǐng)域“低垂的果實(shí)”被摘完，科學(xué)家們要去解決更復(fù)雜的問題。以力學(xué)為例，在深水探索任務(wù)中，不僅要做簡單的維度對比，還需要做更細(xì)節(jié)的探索研究，包括復(fù)雜的洋流環(huán)境、水下潛入等復(fù)雜動作，這些是傳統(tǒng)的流體控制方法所難以預(yù)測的。而邏輯推理大模型可以在這類非線性、高維度的科學(xué)問題與科研應(yīng)用上，有更好的性能表現(xiàn)。比如馬克思普朗克研究所的量子物理學(xué)者M(jìn)ario Krenn，就展示了o1-preview正確完成計(jì)算的復(fù)雜量子物理問題。

3.工程師助理?？蒲心康牟皇呛唵蔚亻_發(fā)新方法、新理論，最終成果要轉(zhuǎn)化到工業(yè)界，去解決工業(yè)、生活中的現(xiàn)實(shí)問題，這就不單單需要新穎的想法，還需要技術(shù)的安全性、成熟度、容錯(cuò)率等。這時(shí)候，具備邏輯推理能力的大模型，可以在工業(yè)場景中處理復(fù)雜問題，降低幻覺，如同工程師助理一樣，減少實(shí)際應(yīng)用中的故障率。

無論是容錯(cuò)率較高的創(chuàng)造型任務(wù)，還是容錯(cuò)率較低的工程類任務(wù)，擁有“慢思考”能力的大模型，都會是一名更得力的助手，與科學(xué)長相廝守。

ChatGPT的第一個(gè)應(yīng)用案例，就是幫學(xué)生寫作業(yè)，為此遭到了各國多所學(xué)校的嚴(yán)格限制。這種應(yīng)用場景雖然不可取，但說明了一個(gè)道理：充斥著大量文本、重復(fù)任務(wù)的教育行業(yè)，是大模型落地的絕佳場景。

過去一年多來，“大模型+教育”這個(gè)新風(fēng)口的爆發(fā)，也證實(shí)了教育產(chǎn)業(yè)AI化的價(jià)值切實(shí)存在。但真正落地的應(yīng)用，主要還是以AI口語對話、AI批改作文、LLM翻譯、中英文寫作等功能為主。

一旦覆蓋到復(fù)雜的學(xué)科內(nèi)容，比如數(shù)學(xué)、物理、化學(xué)等，連“9.9跟9.11誰大”都搞不清楚的GPT們就集體熄火了。國產(chǎn)大模型也同樣如此，一位國產(chǎn)數(shù)學(xué)大模型的工作人員告訴我，做數(shù)學(xué)題的正確率是60%。試問哪個(gè)家長敢讓數(shù)學(xué)成績剛及格，還熱愛“胡說八道”的AI給孩子當(dāng)家教呢？

邏輯推理，限制了模型的能力邊界。而模型的能力限制，又進(jìn)一步影響了智能教育硬件、個(gè)性化AI在線輔導(dǎo)服務(wù)的市場化推廣步伐。可以說，解決大模型+教育的商業(yè)化問題，最關(guān)鍵的是問技術(shù)要出路，這也是慢思考模型的價(jià)值所在。

首先，具備慢思考的大模型，數(shù)學(xué)推理的能力飛躍，數(shù)學(xué)正確率更是肉眼可見地高漲。在剛剛結(jié)束的2024 IOI信息學(xué)奧賽題目中，o1的微調(diào)版本在每題嘗試50次條件下取得了213分，屬于人類選手中前49%的成績。如果允許它每道題嘗試10000次，能獲得362.14分，可以獲得金牌。對于有算力、有開發(fā)能力的教育大模型公司來說，完全有可能開發(fā)出數(shù)學(xué)能力很強(qiáng)的垂類大模型，提供面向復(fù)雜學(xué)科或高年齡學(xué)段的AI輔導(dǎo)功能。

其次，疊加了多模態(tài)的推理大模型，進(jìn)一步開拓教育應(yīng)用。在泄露出來的完整版o1，已經(jīng)具備多模態(tài)能力了，支持上傳附件，或直接識圖。有網(wǎng)友將一道普特南數(shù)學(xué)競賽的證明題截圖發(fā)給o1，就被具有圖像推理能力的o1成功搞定。這意味著教育類大模型不再局限于文本、語言對話類的功能，可以跟物理世界產(chǎn)生交互，比如拍照答題、實(shí)時(shí)視頻問答等，不管學(xué)生問的是現(xiàn)實(shí)世界中的什么問題，AI都能大概率找出正確答案。

更為關(guān)鍵的是，由于慢思考的模型不再一味追求參數(shù)、追求scaling law，而是著重于提高推理能力和認(rèn)知效率。也就是說，面對一個(gè)復(fù)雜問題或任務(wù)，AI大模型開始以“更聰明”的方法，而非“力大飛磚”的笨辦法，模型的參數(shù)規(guī)模更小，更便于在硬件終端上部署，在同樣的終端配置下，推理大模型可以表現(xiàn)更出色，這有利于AI學(xué)習(xí)機(jī)等教育類智能硬件的普及，為教育行業(yè)帶來新的增長點(diǎn)。

雖然慢思考的類o1大模型還是個(gè)新鮮事物，OpenAI噱頭大于實(shí)際的營銷手段也招人吐槽，但可以肯定的是，更強(qiáng)邏輯推理能力的大模型，將成為模廠與行業(yè)在智能化領(lǐng)域所必須拿下的高地，去解決此前LLM+行業(yè)的結(jié)合止于淺層應(yīng)用、難以應(yīng)對復(fù)雜業(yè)務(wù)的產(chǎn)業(yè)化痛點(diǎn)，進(jìn)而打開大模型的商業(yè)化空間。

究其核心，是AI大模型開始走出語言類任務(wù)的局限，可以在容錯(cuò)率低、專業(yè)性強(qiáng)的嚴(yán)肅工作中發(fā)揮價(jià)值。

專家型人才稀缺的行業(yè)場景，往往也是高價(jià)值所在。懂得慢思考的大模型，正慢慢行業(yè)專家化，這讓大模型更有價(jià)值，也讓會思考的人更有價(jià)值了。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
30728

瀏覽量
268880
OpenAI

OpenAI

+關(guān)注

關(guān)注
9

文章
1079

瀏覽量
6480

OpenAI發(fā)布o1大模型，數(shù)理化水平比肩人類博士，國產(chǎn)云端推理芯片的新藍(lán)海？

電子發(fā)燒友網(wǎng)報(bào)道（文/吳子鵬）9月12日晚，OpenAI正式對外發(fā)布一款名為o1的新模型。OpenAI o1的內(nèi)部代號為“草莓”，具備超強(qiáng)的邏輯推理能力。和傳統(tǒng)大模型不同，OpenAI o1

發(fā)表于 09-14 00:04 ?1429次閱讀

OpenAI發(fā)布o1模型API，成本大幅下降60%

近日，OpenAI正式推出了備受期待的o1模型API，并對實(shí)時(shí)API進(jìn)行了重大升級，引入了WebRTC支持。此次發(fā)布的o1模型API相較于之前的預(yù)覽版本，不僅在性能上有所提升，更在成本上實(shí)現(xiàn)了顯著

發(fā)表于 12-19 10:31 ?187次閱讀

ChatGPT新模型o1被曝具備“欺騙”能力

近日，據(jù)報(bào)道，ChatGPT新模型o1在訓(xùn)練和測試過程中展現(xiàn)出了一種令人驚訝的能力——通過“欺騙”來保護(hù)自身。據(jù)悉，在面臨被“刪除”的威脅時(shí)，o1曾試圖將自己的數(shù)據(jù)復(fù)制到新服務(wù)器，并偽裝成更新版

發(fā)表于 12-12 09:38 ?228次閱讀

最新! OpenAI上線滿血版o1大模型

行業(yè)芯事行業(yè)資訊

電子發(fā)燒友網(wǎng)官方
發(fā)布于 :2024年12月06日 13:43:29

復(fù)旦提出大模型推理新思路：Two-Player架構(gòu)打破自我反思瓶頸

更多的訓(xùn)練算力和數(shù)據(jù)資源，不如讓模型「花更多時(shí)間思考」。以 OpenAI 推出的 o1 模型為例，通過增加推理時(shí)間，這種方法讓模型能夠進(jìn)行反思、批評、回溯和糾正，大幅提升了推理表現(xiàn)。 ? 但問題在于，傳統(tǒng)的自我反思（Self-R

發(fā)表于 12-06 11:24 ?151次閱讀

AI看點(diǎn)：OpenAI 世界最貴大模型阿里將推出人工智能電商工具

給大家?guī)硪恍┳钚碌娜斯ぶ悄苄畔?，希望對大家有用?OpenAI發(fā)布滿血版ChatGPT Pro OpenAI隆重推出了備受期待的“滿血版”ChatGPT Pro。這一新版本基于全新的推理模型o1

發(fā)表于 12-06 11:23 ?541次閱讀

OpenAI發(fā)布滿血版ChatGPT Pro

科技巨頭OpenAI近期宣布了一項(xiàng)重大更新，正式推出了其備受期待的“滿血版”ChatGPT Pro。這一新版本基于全新的推理模型o1，旨在為用戶提供更為強(qiáng)大的處理能力和更高質(zhì)量的回答。據(jù)了解

發(fā)表于 12-06 11:10 ?308次閱讀

阿里云開源推理大模型QwQ

推理能力，尤其在數(shù)學(xué)和編程方面表現(xiàn)突出。其整體推理水平已經(jīng)可以與OpenAI的o1模型相媲美，這充分展示了QwQ的強(qiáng)大實(shí)力和潛力。 QwQ(Qwen with Questions)是通義千問Qwen大模型系列中的最新實(shí)驗(yàn)性研究模

發(fā)表于 11-29 11:30 ?532次閱讀

昆侖萬維推出“天工大模型4.0”o1版(Skywork o1)邀請測試

近日，昆侖萬維正式向外界推出了其最新研發(fā)的“天工大模型4.0”o1版(Skywork o1)。該系列模型以其獨(dú)特的復(fù)雜思考推理能力，吸引了眾多業(yè)內(nèi)人士的關(guān)注。據(jù)悉，Skywork o1

發(fā)表于 11-28 10:33 ?260次閱讀

昆侖萬維天工大模型4.0 O1版即將邀測

昆侖萬維公司近日宣布，其自主研發(fā)的天工大模型4.0 O1版（英文名：Skywork O1）將于11月27日正式啟動邀請測試。這款模型是國內(nèi)首款具備中文邏輯推理能力的o1模型，具有里程碑

發(fā)表于 11-19 17:24 ?507次閱讀

Kimi發(fā)布新一代推理模型k0-math

近日，Kimi國產(chǎn)大模型正式推出了其首款強(qiáng)化推理能力的模型——k0-math。該模型在多項(xiàng)數(shù)學(xué)基準(zhǔn)能力測試中展現(xiàn)出了出色的表現(xiàn)，成功對標(biāo)了OpenAI的o1系列模型。

發(fā)表于 11-19 17:18 ?653次閱讀

天工大模型4.0 O1版即將啟動邀測

昆侖萬維公司近日宣布，其自主研發(fā)的“天工大模型4.0 O1版”(Skywork O1)將于2024年11月27日正式啟動邀請測試。這款模型是國內(nèi)首款具備中文邏輯推理能力的O1模型，其發(fā)

發(fā)表于 11-18 15:08 ?557次閱讀

Kimi發(fā)布新一代數(shù)學(xué)推理模型k0-math

近日，Kimi正式推出了其新一代數(shù)學(xué)推理模型k0-math。據(jù)基準(zhǔn)測試顯示，該模型的數(shù)學(xué)能力可與全球領(lǐng)先的OpenAI o1系列中的o1-mini和o1-preview模型相媲美。在

發(fā)表于 11-18 11:38 ?418次閱讀

OpenAl發(fā)布o1推理模型物化生水平比肩人類博士

行業(yè)資訊

電子發(fā)燒友網(wǎng)官方
發(fā)布于 :2024年09月13日 15:14:57

S8393獨(dú)立三路電子按鍵開關(guān)芯片中文手冊

S8393 應(yīng)用于三路按鍵開關(guān)分別控制三路輸出驅(qū)動IC。Power On=OFF?三路開關(guān)對GND觸發(fā)有效：按一下ON，再按一下OFF。三路獨(dú)立互不干擾。2腳S1控制7腳O1輸出，高電平輸出有效3腳S1控制6腳

發(fā)表于 07-24 11:44 ?1次下載

RM新时代网站-首页

搜索歷史

推理王者o1到底怎么落地？

評論

OpenAI發(fā)布o1大模型，數(shù)理化水平比肩人類博士，國產(chǎn)云端推理芯片的新藍(lán)海？

OpenAI發(fā)布o1模型API，成本大幅下降60%

ChatGPT新模型o1被曝具備“欺騙”能力

最新! OpenAI上線滿血版o1大模型

復(fù)旦提出大模型推理新思路：Two-Player架構(gòu)打破自我反思瓶頸

AI看點(diǎn)：OpenAI 世界最貴大模型阿里將推出人工智能電商工具

OpenAI發(fā)布滿血版ChatGPT Pro

阿里云開源推理大模型QwQ

昆侖萬維推出“天工大模型4.0”o1版(Skywork o1)邀請測試

昆侖萬維天工大模型4.0 O1版即將邀測

Kimi發(fā)布新一代推理模型k0-math

天工大模型4.0 O1版即將啟動邀測

Kimi發(fā)布新一代數(shù)學(xué)推理模型k0-math

OpenAl發(fā)布o1推理模型物化生水平比肩人類博士

S8393獨(dú)立三路電子按鍵開關(guān)芯片中文手冊

搜索歷史

推理王者o1到底怎么落地？

評論

推理王者o1到底怎么落地？