RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

螞蟻集團(tuán)開源高性能多語言序列化框架Fury解讀

jf_WZTOguxH ? 來源: InfoQ ? 2023-08-25 17:05 ? 次閱讀

作者 | 楊朝坤(慕白) 策劃 | 鄧艷琴

Fury 是一個基于 JIT 動態(tài)編譯和零拷貝的多語言序列化框架,支持 Java/Python/Golang/JavaScript/C++ 等語言,提供全自動的對象多語言 / 跨語言序列化能力,和相比 JDK 最高 170 倍的性能。

代碼主倉庫的 GitHub 地址為:https://github.com/alipay/fury

背景

序列化是系統(tǒng)通信的基礎(chǔ)組件,在大數(shù)據(jù)、AI 框架和云原生等分布式系統(tǒng)中廣泛使用。當(dāng)對象需要跨進(jìn)程、跨語言、跨節(jié)點傳輸、持久化、狀態(tài)讀寫、復(fù)制時,都需要進(jìn)行序列化,其性能和易用性影響運行效率和開發(fā)效率。

靜態(tài)序列化框架 protobuf/flatbuffer/thrift 由于不支持對象引用和多態(tài)、需要提前生成代碼等原因,無法作為領(lǐng)域?qū)ο笾苯用嫦驊?yīng)用進(jìn)行跨語言開發(fā)。而動態(tài)序列化框架 JDK 序列化 /Kryo/Fst/Hessian/Pickle 等,盡管提供了易用性和動態(tài)性,但不支持跨語言,且性能存在顯著不足,并不能滿足高吞吐、低延遲和大規(guī)模數(shù)據(jù)傳輸場景需求。

因此,我們開發(fā)了一個新的多語言序列化框架 Fury,并正式在 Github 開源。通過一套高度優(yōu)化的序列化基礎(chǔ)原語,結(jié)合JIT 動態(tài)編譯和 Zero-Copy等技術(shù),同時滿足了性能、功能和易用性的需求,實現(xiàn)了任意對象自動跨語言序列化,并提供極致的性能。

fbdee6be-2a06-11ee-a368-dac502259ad0.jpg

Fury 簡介

Fury 是一個基于 JIT 動態(tài)編譯和零拷貝的多語言序列化框架,提供極致的性能和易用性:

支持主流編程語言Java/ Python/ C++/ Golang/ JavaScript,其它語言可輕易擴展;

統(tǒng)一的多語言序列化核心能力:

高度優(yōu)化的序列化原語;

Zero-Copy 序列化支持,支持 Out of band 序列化協(xié)議,支持堆外內(nèi)存讀寫;

基于JIT 動態(tài)編技術(shù)在運行時異步多線程自動生成序列化代碼優(yōu)化性能,增加方法內(nèi)聯(lián)、代碼緩存和消除死代碼,減少虛方法調(diào)用 / 條件分支 /Hash 查找 / 元數(shù)據(jù)寫入 / 內(nèi)存讀寫等,提供相比別的序列化框架最高 170 倍的性能;

多協(xié)議支持:兼顧動態(tài)序列化的靈活性和易用性,以及靜態(tài)序列化的跨語言能力。

Java 序列化:

無縫替代 JDK/Kryo/Hessian,無需修改任何代碼,但提供最高 170x 的性能,可以大幅提升高性能場景RPC 調(diào)用、數(shù)據(jù)傳輸和對象持久化效率;

100% 兼容 JDK 序列化,原生支持 JDK 自定義序列化方法 writeObject/ readObject/ writeReplace/ readResolve/ readObjectNoData

跨語言對象圖序列化:

多語言 / 跨語言自動序列化任意對象,無需創(chuàng)建 IDL 文件、手動編譯 schema 生成代碼以及將對象轉(zhuǎn)換為中間格式;

多語言 / 跨語言自動序列化共享引用和循環(huán)引用,不需要關(guān)心數(shù)據(jù)重復(fù)或者遞歸錯誤;

支持對象類型多態(tài),多個子類型對象可以同時被序列化;

行存序列化:

提供緩存友好的二進(jìn)制隨機訪問行存格式,支持跳過序列化和部分序列化,適合高性能計算和大規(guī)模數(shù)據(jù)傳輸場景;

支持和 Arrow 列存自動互轉(zhuǎn) ;

序列化核心能力

盡管不同的場景對序列化有需求,但序列化的底層操作都是類似的。因此 Fury 定義和實現(xiàn)了一套序列化的基礎(chǔ)能力,基于這套能力能夠快速構(gòu)建不同的多語言序列化協(xié)議,并通過編譯加速等優(yōu)化具備高性能。同時針對一種協(xié)議在基礎(chǔ)能力上的性能優(yōu)化,也能夠讓所有的序列化協(xié)議都受益。

序列化原語

序列化涉及的常見操作主要包括:

bitmap 位操作

整數(shù)編解碼

整數(shù)壓縮

字符串創(chuàng)建 * 拷貝優(yōu)化

字符串編碼:ASCII/UTF8/UTF16

內(nèi)存拷貝優(yōu)化

數(shù)組拷貝壓縮優(yōu)化

元數(shù)據(jù)編碼 & 壓縮 & 緩存

Fury 針對這些操作在每種語言內(nèi)部都做了大量的優(yōu)化,結(jié)合 SIMD 指令和語言高級特性,將性能推到極致,從而方便不同協(xié)議使用。

零拷貝序列化

在大規(guī)模數(shù)據(jù)傳輸場景,一個對象圖內(nèi)部往往有多個 binary buffer,而序列化框架在序列化過程當(dāng)中會把這些數(shù)據(jù)寫入一個中間 buffer,引入多次耗時內(nèi)存拷貝。Fury 借鑒了 pickle5、ray 以及 arrow 的零拷貝設(shè)計,實現(xiàn)了一套Out-Of-Band 序列化協(xié)議,能夠把一個對象圖當(dāng)中的所有 binary buffer 直接抓取出來,避免掉這些 buffer 的中間拷貝,將序列化期間的內(nèi)存拷貝開銷降低到 0。

下圖是 Fury 關(guān)閉引用支持時 Zero-Copy 的大致序列化過程。

fbf6c752-2a06-11ee-a368-dac502259ad0.png

目前 Fury 內(nèi)置了以下類型的 Zero-Copy 支持:

Java:所有基本類型數(shù)組、ByteBuffer、ArrowRecordBatch、VectorSchemaRoot

Python:array 模塊的所有 array、numpy 數(shù)組、pyarrow.Table、pyarrow.RecordBatch

Golang:byte slice

用戶也可以基于 Fury 的接口擴展新的零拷貝類型。

JIT 動態(tài)編譯加速

對于要序列化的自定義類型對象,其中通常包含大量類型信息,F(xiàn)ury利用這些類型信息在運行時直接生成高效的序列化代碼,將大量運行時的操作在動態(tài)編譯階段完成,從而增加方法內(nèi)聯(lián)和代碼緩存,減少虛方法調(diào)用 / 條件分支 /Hash 查找 / 元數(shù)據(jù)寫入 / 內(nèi)存讀寫等,最終大幅加速了序列化性能。

對于 Java 語言,F(xiàn)ury 實現(xiàn)了一套運行時代碼生成框架,定義了一套序列化邏輯的算子表達(dá)式 IR,在運行時基于對象類型的泛型信息進(jìn)行類型推斷,然后構(gòu)建一顆描述序列化代碼邏輯的表達(dá)式樹,根據(jù)表達(dá)式樹生成高效的 Java 代碼,再在運行時通過 Janino 編譯成字節(jié)碼,再加載到用戶的 ClassLoader 里面或者 Fury 創(chuàng)建的 ClassLoader 里面,最終通過 Java JIT 編譯成高效的匯編代碼。

由于 JVM JIT 會跳過大方法編譯和內(nèi)聯(lián),F(xiàn)ury 也實現(xiàn)了一套優(yōu)化器,將大方法遞歸拆分成小方法,這樣就保證了 Fury 生成的所有代碼都可以被編譯和內(nèi)聯(lián),壓榨 JVM 的性能到極致。

fc139a62-2a06-11ee-a368-dac502259ad0.png

同時 Fury 也支持異步多線程動態(tài)編譯,將不同序列化器的代碼生成任務(wù)提交到線程池執(zhí)行,在編譯完成之前使用解釋模式執(zhí)行,從而保證不會出現(xiàn)序列化毛刺,不需要提前預(yù)熱所有類型的序列化。

Python 和 JavaScript 場景也是采用的類似代碼生成方式,這樣的生成方式開發(fā)門檻低,更容易排查問題。

由于序列化需要密切操作每種編程語言的對象,而編程語言并沒有暴露內(nèi)存模型的低階 API,通過 Native 方法調(diào)用存在較大開銷,因此我們并不能通過 LLVM 構(gòu)建一個統(tǒng)一的序列化器 JIT 框架,而是需要在每種語言內(nèi)部結(jié)合語言特性實現(xiàn)特定的代碼生成框架以及序列化器構(gòu)建邏輯。

靜態(tài)代碼生成

盡管 JIT 編譯能夠大幅提升序列化效率,并且在運行時能夠根據(jù)數(shù)據(jù)的統(tǒng)計分布重新生成更優(yōu)的序列化代碼,但 C++/Rust 等語言不支持反射,沒有虛擬機,也沒有提供內(nèi)存模型的低階 API,因此我們無法針對這類語言通過 JIT 動態(tài)編譯生成序列化代碼。

對于此類場景,F(xiàn)ury 正在實現(xiàn)一套 AOT 靜態(tài)代碼生成框架,在編譯時根據(jù)對象的 schema 提前生成序列化代碼,然后使用生成的代碼進(jìn)行自動序列化。對于 Rust,未來也會通過 Rust 的 macro 在編譯時生成代碼,提供更好的易用性。

緩存優(yōu)化

在序列化自定義類型時,會把字段進(jìn)行重排序,保證相同接口類型的字段依次序列化,增加緩存命中的概率,同時也促進(jìn)了CPU 指令緩存,實現(xiàn)了更加高效的序列化。對于基本類型字段將寫入順序按照字節(jié)字段大小降序排列,這樣如果開始地址是對齊的,隨后的讀寫都會發(fā)生在內(nèi)存地址對齊的位置,CPU 執(zhí)行起來更加高效。

多協(xié)議設(shè)計與實現(xiàn)

基于 Fury 提供的多語言序列化核心能力,我們在這之上構(gòu)建了三種序列化協(xié)議,分別適用于不同的場景:

Java 序列化:適合純 Java 序列化場景,提供最高百倍以上的性能提升;

跨語言對象圖序列化:適合面向應(yīng)用的多語言編程,以及高性能跨語言序列化;

行存序列化:適合分布式計算引擎如 Spark/Flink/Dories/Velox/ 樣本流處理框架 / 特征存儲等;

后續(xù)我們也會針對一些核心場景添加新的協(xié)議,用戶也可以基于 Fury 的序列化能力構(gòu)建自己的協(xié)議。

Java 序列化

由于 Java 在大數(shù)據(jù)、云原生、微服務(wù)和企業(yè)級應(yīng)用的廣泛使用,對 Java 序列化的性能優(yōu)化可以大幅降低系統(tǒng)延遲,提升吞吐率,降低服務(wù)器成本。

因此 Fury 針對 Java 序列化進(jìn)行了大量極致性能優(yōu)化,我們的實現(xiàn)具備以下能力:

極致性能:通過利用 Java 對象的類型和泛型信息,結(jié)合 JIT 編譯、Unsafe 低階操作,F(xiàn)ury 相比 JDK 最高有 170 倍的性能提升,相比 Kryo/Hessian 最高有 50~100 倍的性能提升。

100% JDK 序列化 API 兼容性:支持了所有 JDK 自定義序列化方法 writeObject/readObject/ writeReplace/ readResolve/readObjectNoData 的語義,保證任意場景替換 JDK 序列化的正確性。而已有的 Java 序列化框架如 Kryo/Hessian 在這些場景,都存在一定的正確性問題

類型前后兼容:在反序列化端和序列化端 Class Schema 不一致時,仍然可以正確反序列化,支持應(yīng)用獨立升級部署,獨立增刪字段。并且我們對元數(shù)據(jù)進(jìn)行了極致的壓縮和共享,類型兼容模式相比類型強一致模式做到了幾乎沒有任何性能損失。

元數(shù)據(jù)共享:在某個上下文 (TCP 連接) 下多次序列化之間共享元數(shù)據(jù)(類名稱、字段名稱、Final 字段類型信息等),這些信息會在該上下文下第一次序列化時發(fā)送到對端,對端可以根據(jù)該類型信息重建相同的反序列化器,后續(xù)序列化可以避免傳輸元數(shù)據(jù),減小網(wǎng)絡(luò)流量壓力,同時也自動支持類型前后兼容。

零拷貝支持:支持 Out of band 零拷貝和堆外內(nèi)存讀寫。

跨語言對象圖序列化

跨語言對象圖序列化主要用于對動態(tài)性和易用性有更高要求的場景。盡管 Protobuf/Flatbuffer 等框架提供了多語言序列化能力,但仍然存在一些不足:

需要提前編寫 IDL 并靜態(tài)編譯生成代碼,不具備足夠的動態(tài)性和靈活性;

生成的類不符合面向?qū)ο笤O(shè)計也無法給類添加行為,并不能作為領(lǐng)域?qū)ο笾苯佑糜诙嗾Z言應(yīng)用開發(fā)。

不支持子類序列化。面向?qū)ο缶幊痰闹饕攸c是通過接口調(diào)用子類方法。這類模式也無法得到很好的支持。盡管 Flatbuffer 提供了 Union,Protobuf 提供了 OneOf/Any 特性,這類特性需要在序列化和反序列化時判斷對象的類型,不符合面向?qū)ο缶幊痰脑O(shè)計。

不支持循環(huán)和共享引用,需要針對領(lǐng)域?qū)ο笾匦露x一套 IDL 并自己實現(xiàn)引用解析,然后在每種語言里面編寫代碼實現(xiàn)領(lǐng)域?qū)ο蠛蛥f(xié)議對象之間的相互轉(zhuǎn)換,如果對象圖嵌套層數(shù)較深,則需要編寫更多的代碼。

結(jié)合以上幾點,F(xiàn)ury 實現(xiàn)了一套跨語言的對象圖序列化協(xié)議:

多語言 / 跨語言自動序列化任意對象:在序列化和反序列化端定義兩個 Class,即可自動將一種語言的對象自動序列化為另一種語言的對象,無需創(chuàng)建 IDL 文件、編譯 schema 生成代碼以及手寫轉(zhuǎn)換代碼;

多語言 / 跨語言自動序列化共享引用和循環(huán)引用;

支持對象類型多態(tài),符合面向?qū)ο缶幊谭妒?,多個子類型對象可以同時被自動反序列化,無需用戶手動處理;

同時我們在這套協(xié)議上面也支持了 Out of band 零拷貝;

自動跨語言序列化示例:

fc2b1a7a-2a06-11ee-a368-dac502259ad0.png

行存序列化

對于高性能計算和大規(guī)模數(shù)據(jù)傳輸場景,數(shù)據(jù)序列化和傳輸往往是整個系統(tǒng)的性能瓶頸。如果用戶只需要讀取部分?jǐn)?shù)據(jù),或者根據(jù)對象某個字段進(jìn)行過濾,反序列化整個數(shù)據(jù)將帶來額外開銷。因此 Fury 也提供了一套二進(jìn)制數(shù)據(jù)結(jié)構(gòu),在二進(jìn)制數(shù)據(jù)上直讀直寫,避開序列化。

Apache arrow 是一個成熟的列存格式,支持二進(jìn)制讀寫。但列存并不能滿足所有場景需求,在線鏈路和流式計算場景的數(shù)據(jù)天然就是行存結(jié)構(gòu),同時列式計算引擎內(nèi)部在涉及到數(shù)據(jù)變更和 Hash/Join/Aggregation 操作時,也會使用到行存結(jié)構(gòu)。

而行存并沒有一個統(tǒng)一標(biāo)準(zhǔn)實現(xiàn),計算引擎如 Spark/Flink/Doris/Velox 等都定義了一套行存格式,這些格式不支持跨語言,且只能被自己引擎內(nèi)部使用,無法用于其它框架。盡管 Flatbuffer 能夠支持按需反序列化,但需要靜態(tài)編譯 Schema IDL 和管理 offset,無法滿足復(fù)雜場景的動態(tài)性和易用性需求。

因此 Fury 在早期借鑒了 spark tungsten 和 apache arrow 格式,實現(xiàn)了一套可以隨機訪問的二進(jìn)制行存結(jié)構(gòu),目前實現(xiàn)了 Java/Python/C++ 版本,實現(xiàn)了在二進(jìn)制數(shù)據(jù)上面直讀直寫,避免掉了所有序列化開銷。

下圖是 Fury Row Format 的二進(jìn)制格式:

fc6baf18-2a06-11ee-a368-dac502259ad0.png

該格式密集存儲,數(shù)據(jù)對齊,緩存友好,讀寫更快。由于避免了反序列化,能夠減少 Java GC 壓力。同時降低 Python 開銷,同時由于 Python 的動態(tài)性,F(xiàn)ury 的數(shù)據(jù)結(jié)構(gòu)實現(xiàn)了 _getattr__/getitem/slice/ 和其它特殊方法,保證了行為跟 python dataclass/list/object 的一致性,用戶沒有任何感知。

性能對比

這里給出部分 Java 序列化性能數(shù)據(jù),其中標(biāo)題包含 compatible 的圖表是支持類型前后兼容下的性能數(shù)據(jù),標(biāo)題不包含 compatible 的圖表是不支持類型前后兼容下的性能數(shù)據(jù)。為了公平起見,所有測試 Fury 關(guān)閉了零拷貝特性。

更多 benchmark 數(shù)據(jù)請參考 Fury Github 官方文檔

fbdee6be-2a06-11ee-a368-dac502259ad0.jpg

fcafa1be-2a06-11ee-a368-dac502259ad0.jpg

fcc74fee-2a06-11ee-a368-dac502259ad0.jpg

未來規(guī)劃

元數(shù)據(jù)壓縮和自動共享

跨語言序列化支持類型前后兼容

靜態(tài)代碼生成框架,用于提前生成 c++/golang/rust 代碼

C++/Rust 支持跨語言對象圖序列化

Golang/Rust/JavaScript 支持行存

兼容 ProtoBuffer 生態(tài),支持根據(jù) Proto IDL 自動生成 Fury 序列化代碼

新的協(xié)議實現(xiàn):AI 特征存儲,知識圖譜序列化

持續(xù)改進(jìn)我們的序列化基礎(chǔ)原語,提供更高性能實現(xiàn)

標(biāo)準(zhǔn)化協(xié)議,提供二進(jìn)制兼容性

文檔和易用性改進(jìn)

加入我們

我們致力于將 Fury 打造為一個開放中立、追求極致與創(chuàng)新的社區(qū)項目,后續(xù)的研發(fā)與討論等工作都會在社區(qū)以開源透明的方式進(jìn)行。歡迎任何形式的參與,包括但不限于提問、代碼貢獻(xiàn)、技術(shù)討論等。非常期待收到大家的想法和反饋,一起參與到項目的建設(shè)中來,推動項目向前發(fā)展,打造最先進(jìn)的序列化框架。

代碼主倉庫的 GitHub 地址為:https://github.com/alipay/fury

作者簡介

楊朝坤,螞蟻集團(tuán)技術(shù)專家,F(xiàn)ury 框架作者。2018 年加入螞蟻集團(tuán),先后從事流計算框架、在線學(xué)習(xí)框架、科學(xué)計算框架和 Ray 等分布式計算框架開發(fā),對批計算、流計算、Tensor 計算、高性能計算、AI 框架、張量編譯等有深入的理解。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3309

    瀏覽量

    42471
  • C++
    C++
    +關(guān)注

    關(guān)注

    22

    文章

    2108

    瀏覽量

    73618
  • JDK
    JDK
    +關(guān)注

    關(guān)注

    0

    文章

    81

    瀏覽量

    16592
  • Rust
    +關(guān)注

    關(guān)注

    1

    文章

    228

    瀏覽量

    6601
  • 螞蟻集團(tuán)
    +關(guān)注

    關(guān)注

    0

    文章

    95

    瀏覽量

    3589

原文標(biāo)題:比 JDK 最高快 170 倍,螞蟻集團(tuán)開源高性能多語言序列化框架 Fury

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    如何使用Serde進(jìn)行序列化和反序列化

    Serde 是一個用于序列化和反序列化 Rust 數(shù)據(jù)結(jié)構(gòu)的庫。它支持 JSON、BSON、YAML 等多種格式,并且可以自定義序列化和反序列化方式。Serde 的特點是代碼簡潔、易于
    的頭像 發(fā)表于 09-30 17:09 ?1280次閱讀

    多語言開發(fā)的流程詳解

    現(xiàn)在不少應(yīng)用都是要求有多語言切換的, 使用QT開發(fā)上位機也同樣需要做多語言功能, 不過QT是自帶了多語言翻譯功能, 可以很方便的借助原生工具進(jìn)行, 下面就簡單來看看多語言開發(fā)的流程!
    的頭像 發(fā)表于 11-30 09:08 ?1101次閱讀

    Java序列化的機制和原理

    本文講解了Java序列化的機制和原理。從文中你可以了解如何序列化一個對象,什么時候需要序列化以及Java序列化的算法。AD:WOT2014課程推薦:實戰(zhàn)MSA:用
    發(fā)表于 07-10 07:27

    c語言序列化和反序列化有何區(qū)別

    這里寫自定義目錄標(biāo)題c語言序列化和反序列化tplut.htplut.c測試代碼參考c語言序列化和反序列化
    發(fā)表于 07-14 07:32

    關(guān)于c語言序列化和反序列化的知識點看完你就懂了

    關(guān)于c語言序列和反序列化的知識點你就懂了
    發(fā)表于 10-15 08:47

    SpringMVC JSON框架的自定義序列化與反序列化

    ,也可以使用fastjson。jackson框架自定義序列化如果項目使用jackson框架做json序列化,推薦的方案是使用@JsonSerialize注解,示例代碼如下:@JsonS
    發(fā)表于 10-10 16:02

    SoC多語言協(xié)同驗證平臺技術(shù)研究

    SoC基于IP設(shè)計的特點使驗證項目中多語言VIP(Verification IP)協(xié)同驗證的需求不斷增加,給驗證工作帶來了很大的挑戰(zhàn)。為了解決多語言VIP在SoC驗證環(huán)境靈活重用的問題。提出了一種
    發(fā)表于 12-31 09:25 ?12次下載

    java序列化和反序列化范例和JDK類庫中的序列化API

    一、序列化和反序列化的概念 把對象轉(zhuǎn)換為字節(jié)序列的過程稱為對象的序列化。 把字節(jié)序列恢復(fù)為對象的過程稱為對象的反
    發(fā)表于 09-27 10:13 ?6次下載

    Multilingual多語言預(yù)訓(xùn)練語言模型的套路

    Facebook在Crosslingual language model pretraining(NIPS 2019)一文中提出XLM預(yù)訓(xùn)練多語言模型,整體思路基于BERT,并提出了針對多語言預(yù)訓(xùn)練的3個優(yōu)化任務(wù)。后續(xù)很多多語言
    的頭像 發(fā)表于 05-05 15:23 ?2971次閱讀

    static屬性為什么不會被序列化

    實現(xiàn)序列化和反序列化為什么要實現(xiàn)Serializable接口?
    的頭像 發(fā)表于 07-15 11:03 ?1757次閱讀

    什么是序列化 為什么要序列化

    什么是序列化? “序列化”(Serialization )的意思是將一個對象轉(zhuǎn)化為字節(jié)流。 這里說的對象可以理解為“面向?qū)ο蟆崩锏哪莻€對象,具體的就是存儲在內(nèi)存中的對象數(shù)據(jù)。 與之相反的過程是“反序列化
    的頭像 發(fā)表于 09-14 17:22 ?2540次閱讀
    什么是<b class='flag-5'>序列化</b> 為什么要<b class='flag-5'>序列化</b>

    如何用C語言進(jìn)行json的序列化和反序列化

    json是目前最為流行的文本數(shù)據(jù)傳輸格式,特別是在網(wǎng)絡(luò)通信上廣泛應(yīng)用,隨著物聯(lián)網(wǎng)的興起,在嵌入式設(shè)備上,也需要開始使用json進(jìn)行數(shù)據(jù)傳輸,那么,如何快速簡潔地用C語言進(jìn)行json的序列化和反序列化
    的頭像 發(fā)表于 10-07 11:05 ?1464次閱讀

    基于LLaMA的多語言數(shù)學(xué)推理大模型

    MathOctopus在多語言數(shù)學(xué)推理任務(wù)中,表現(xiàn)出了強大的性能。MathOctopus-7B 可以將LLmMA2-7B在MGSM不同語言上的平均表現(xiàn)從22.6%提升到40.0%。更進(jìn)一步,MathOctopus-13B也獲得了
    發(fā)表于 11-08 10:37 ?476次閱讀
    基于LLaMA的<b class='flag-5'>多語言</b>數(shù)學(xué)推理大模型

    語言模型(LLMs)如何處理多語言輸入問題

    研究者們提出了一個框架來描述LLMs在處理多語言輸入時的內(nèi)部處理過程,并探討了模型中是否存在特定于語言的神經(jīng)元。
    發(fā)表于 03-07 14:44 ?607次閱讀
    大<b class='flag-5'>語言</b>模型(LLMs)如何處理<b class='flag-5'>多語言</b>輸入問題

    ChatGPT 的多語言支持特點

    )技術(shù)迎來了巨大的挑戰(zhàn)和機遇。ChatGPT,作為一個領(lǐng)先的語言模型,其多語言支持的特點成為了它在眾多應(yīng)用場景中不可或缺的優(yōu)勢。 1. 多語言理解能力 ChatGPT 的多語言支持首先
    的頭像 發(fā)表于 10-25 17:30 ?767次閱讀
    RM新时代网站-首页