RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用Redis和Spring?Ai構建rag應用程序

虹科網絡可視化技術 ? 2024-04-29 08:04 ? 次閱讀

隨著AI技術的不斷進步,開發(fā)者面臨著如何有效利用現(xiàn)有工具和技術來加速開發(fā)過程的挑戰(zhàn)。Redis與Spring AI的結合為Java開發(fā)者提供了一個強大的平臺,以便快速構建并部署響應式AI應用。探索這一整合如何通過簡化的開發(fā)流程,讓開發(fā)者能夠更專注于創(chuàng)新而非底層實現(xiàn)。

一、Spring AI 簡介

由大型語言模型(LLM)驅動的應用程序中,向量數(shù)據(jù)庫常作為人工智能應用程序的核心存儲技術。此類數(shù)據(jù)庫需要支持語義搜索,并為LLM提供相關的上下文環(huán)境。

在此之前,通過Spring和Redis來構建人工智能應用程序的選項還相對有限。而最近,Redis作為一種高性能的向量數(shù)據(jù)庫方案,現(xiàn)已引起廣泛關注。Spring社區(qū)推出了一個名為Spring?AI的新項目,旨在簡化人工智能應用程序特別是那些涉及向量數(shù)據(jù)庫的應用的開發(fā)流程。

下面將介紹如何使用Redis作為向量數(shù)據(jù)庫構建一個Spring AI應用程序,實現(xiàn)檢索增強生成(RAG)工作流。

二、檢索增強生成

檢索增強生成(RAG)是一種結合數(shù)據(jù)與人工智能模型的技術方法。在RAG工作流中,首先需要將數(shù)據(jù)加載入向量數(shù)據(jù)庫(例如Redis)。接收到用戶查詢后,向量數(shù)據(jù)庫會檢索出一組與查詢相似的文檔。這些文檔將作為解答用戶問題的上下文,并結合用戶的查詢,通常通過人工智能模型來生成響應。

本例中,我們將利用一個包含各類啤酒信息的數(shù)據(jù)集進行演示,數(shù)據(jù)集中包含啤酒的名稱、酒精含量(ABV)、國際苦味單位(IBU)和描述等屬性。該數(shù)據(jù)集將被加載到Redis中,以展示RAG工作流的實際應用。

三、代碼和依賴關系

可以在GitHub上找到Spring?AI和Redis演示的全部代碼。

本項目使用了Spring Boot作為Web應用程序的啟動依賴項,并結合了Azure OpenAI和Spring?AI?Redis。

四、數(shù)據(jù)加載

我們的應用程序將采用提供啤酒信息的JSON文檔作為數(shù)據(jù)來源。每個文檔的結構如下:

{ "id": "00gkb9", "name": "Smoked Porter Ale", "description": "The Porter Pounder Smoked Porter is a dark rich flavored ale that is made with 5 malts that include smoked and chocolate roasted malts. It has coffee and mocha notes that create a long finish that ends clean with the use of just a bit of dry hopping", "abv": 8, "ibu": 36}

為了將啤酒數(shù)據(jù)集加載到 Redis 中,我們將使用 RagDataLoader 類。該類包含一個方法,在應用程序啟動時執(zhí)行。在該方法中,我們使用一個 JsonReader 來解析數(shù)據(jù)集,然后使用自動連接的?VectorStore 將文檔插入 Redis。

// Create a JSON reader with fields relevant to our use caseJsonReader loader = new JsonReader(file, "name", "abv", "ibu", "description");// Use the autowired VectorStore to insert the documents into RedisvectorStore.add(loader.get());

至此,我們得到了一個包含約 22,000種啤酒及其相應嵌入的數(shù)據(jù)集。

五、RAGService

RagService 類實現(xiàn)了 RAG 工作流程。當收到用戶提示時,會調用 retrieve 方法,執(zhí)行以下步驟:

計算用戶提示的向量

查詢Redis數(shù)據(jù)庫,檢索最相關的文檔

使用檢索到的文檔和用戶提示構建一個提示信息

使用提示調用聊天客戶端以生成響應

public Generation retrieve(String message) { SearchRequest request = SearchRequest.query(message).withTopK(topK); // Query Redis for the top K documents most relevant to the input message List docs = store.similaritySearch(request); Message systemMessage = getSystemMessage(docs); UserMessage userMessage = new UserMessage(message); // Assemble the complete prompt using a template Prompt prompt = new Prompt(List.of(systemMessage, userMessage)); // Call the autowired chat client with the prompt ChatResponse response = client.call(prompt); return response.getResult();}

六、Controller

現(xiàn)在我們已經實現(xiàn)了 RAG 服務,可以將其封裝在 HTTP 端點中。

RagController 類將服務作為 POST 端點公開:

@PostMapping("/chat/{chatId}")@ResponseBodypublic Message chatMessage(@PathVariable("chatId") String chatId, @RequestBody Prompt prompt) { // Extract the user prompt from the body and pass it to the autowired RagService Generation generation = ragService.retrieve(prompt.getPrompt()); // Reply with the generated message return Message.of(generation.getOutput().getContent());}

七、用戶界面

在用戶界面方面,創(chuàng)建一個簡單的 React 前端,允許用戶提出有關啤酒的問題。前端通過向/chat/{chatId}端點發(fā)送 HTTP 請求并顯示響應來與 Spring 后端交互。

036c3cec-05bc-11ef-9118-92fbcf53809c.png

僅通過簡單的幾個類,我們就用 Spring AI 和 Redis 實現(xiàn)了一個 RAG 應用程序。

若要更進一步,我們建議您查看?Github?上的示例代碼。將 Redis 的高效和易用性與 Spring AI 提供的便捷抽象相結合,Java 開發(fā)人員使用 Spring 構建響應式 AI 應用程序將變得更加容易。

有關向量數(shù)據(jù)庫的更多信息,歡迎與我們溝通交流~

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30728

    瀏覽量

    268882
  • spring
    +關注

    關注

    0

    文章

    340

    瀏覽量

    14338
  • Redis
    +關注

    關注

    0

    文章

    374

    瀏覽量

    10871
收藏 人收藏

    評論

    相關推薦

    Redis緩存與Memcached的比較

    Redis和Memcached都是廣泛使用的內存數(shù)據(jù)存儲系統(tǒng),它們主要用于提高應用程序的性能,通過減少對數(shù)據(jù)庫的直接訪問來加速數(shù)據(jù)檢索。以下是對Redis和Memcached的比較,涵蓋了它們的一些
    的頭像 發(fā)表于 12-18 09:33 ?91次閱讀

    RAG的概念及工作原理

    檢索增強型生成(RAG)系統(tǒng)正在重塑我們處理AI驅動信息的方式。作為架構師,我們需要理解這些系統(tǒng)的基本原理,從而有效地發(fā)揮它們的潛力。 什么是RAG? 總體而言,RAG系統(tǒng)通過將大型語
    的頭像 發(fā)表于 12-17 13:41 ?115次閱讀
    <b class='flag-5'>RAG</b>的概念及工作原理

    Cloudera推出RAG Studio,助力企業(yè)快速部署聊天機器人

    近日,數(shù)據(jù)、分析和AI混合平臺廠商Cloudera宣布了一項創(chuàng)新舉措——推出RAG(Retrieval-Augmented Generation,檢索增強生成)Studio。這一平臺的問世,標志著
    的頭像 發(fā)表于 12-12 11:06 ?287次閱讀

    【書籍評測活動NO.52】基于大模型的RAG應用開發(fā)與優(yōu)化

    Agenerated,檢索增強生成)與Agent(AI智能體)。本篇小棗君首先嘗試用通俗易懂的語言幫助大家認識RAG這一重要應用形式。 01 了解大模型的“幻覺” 在了解為什么出現(xiàn)RAG之前,我們
    發(fā)表于 12-04 10:50

    使用OpenVINO和LlamaIndex構建Agentic-RAG系統(tǒng)

    RAG 系統(tǒng)的全稱是 Retrieval-augmented Generation,本質上是 Prompt Engineering,通過在 Prompt 中注入檢索得到的外部數(shù)據(jù),可以有效地
    的頭像 發(fā)表于 10-12 09:59 ?253次閱讀
    使用OpenVINO和LlamaIndex<b class='flag-5'>構建</b>Agentic-<b class='flag-5'>RAG</b>系統(tǒng)

    使用OpenVINO GenAI API在C++中構建AI應用程序

    許多桌面應用程序是使用 C++ 開發(fā)的,而將生成式AI(GenAI)功能集成到這些應用程序中可能會很具有挑戰(zhàn)性,尤其是因為使用像 Hugging Face 這樣的 Python 庫的復雜性。C++
    的頭像 發(fā)表于 10-12 09:36 ?366次閱讀
    使用OpenVINO GenAI API在C++中<b class='flag-5'>構建</b><b class='flag-5'>AI</b><b class='flag-5'>應用程序</b>

    Spring Cloud Gateway網關框架

    SpringCloud Gateway功能特征如下: (1) 基于Spring Framework 5, Project Reactor 和 Spring Boot 2.0 進行構建; (2) 動態(tài)路由:能夠匹配任何請求屬性;
    的頭像 發(fā)表于 08-22 09:58 ?481次閱讀
    <b class='flag-5'>Spring</b> Cloud Gateway網關框架

    英特爾軟硬件構建模塊如何幫助優(yōu)化RAG應用

    軟硬件構建模塊如何幫助優(yōu)化RAG應用,在簡化部署和支持擴展的同時,增強其上下文感知能力和實時響應性能。 1 為您的應用量身定制GenAI ChatGPT的面世改變了AI的發(fā)展格局。企業(yè)爭相利用這項新技術
    的頭像 發(fā)表于 07-24 15:12 ?409次閱讀
    英特爾軟硬件<b class='flag-5'>構建</b>模塊如何幫助優(yōu)化<b class='flag-5'>RAG</b>應用

    什么是RAG,RAG學習和實踐經驗

    高級的RAG能很大程度優(yōu)化原始RAG的問題,在索引、檢索和生成上都有更多精細的優(yōu)化,主要的優(yōu)化點會集中在索引、向量模型優(yōu)化、檢索后處理等模塊進行優(yōu)化
    的頭像 發(fā)表于 04-24 09:17 ?875次閱讀
    什么是<b class='flag-5'>RAG</b>,<b class='flag-5'>RAG</b>學習和實踐經驗

    Redis開源版與Redis企業(yè)版,怎么選用?

    點擊“藍字”關注我們數(shù)以千計的企業(yè)和數(shù)以百萬計的開發(fā)人員Redis開源版來構建應用程序。但隨著用戶數(shù)量、數(shù)據(jù)量和地區(qū)性的增加,成本、可擴展性、運營和可用性等問題也隨之而來。Redis
    的頭像 發(fā)表于 04-04 08:04 ?1047次閱讀
    <b class='flag-5'>Redis</b>開源版與<b class='flag-5'>Redis</b>企業(yè)版,怎么選用?

    使用ADS .NET Framework構建一個應用程序,.s (匯編文件)文件無法編譯的原因?

    我正在嘗試使用 ADS .NET Framework 構建一個應用程序。 我遇到了以下錯誤,因為 .s (匯編文件)文件無法編譯。
    發(fā)表于 03-04 06:58

    u8g2應用程序無法在moduStoolBox中構建是為什么?

    我正在嘗試按照 ModustoolBox API 文檔中的英飛凌 SSD1306 OLED 說明進行操作。 當我按照它的指示運行演示程序時,它無法構建。 我能否得到一些關于如何正確完成此操作的幫助
    發(fā)表于 01-24 07:03

    Redis為LangChain定制AI代理——OpenGPTs

    OpenAI最近推出了OpenAIGPTs——一個構建定制化AI代理的無代碼“應用商店”,隨后LangChain開發(fā)了類似的開源工具OpenGPTs。OpenGPTs是一款低代碼的開源框架,專用
    的頭像 發(fā)表于 01-13 08:03 ?833次閱讀
    用<b class='flag-5'>Redis</b>為LangChain定制<b class='flag-5'>AI</b>代理——OpenGPTs

    谷歌發(fā)布新的AI SDK,簡化Gemini模型與Android應用程序的集成

    對于 Android 應用程序,Google 提供了 Google AI Client SDK for Android,它將 Gemini REST API 封裝為慣用的 Kotlin API
    的頭像 發(fā)表于 01-03 16:29 ?933次閱讀

    如何構建linux開發(fā)環(huán)境和編譯軟件工程、應用程序

    前文介紹了如何使用官方提供的鏡像文件啟動開發(fā)板,本文將說明如何構建linux開發(fā)環(huán)境和編譯軟件工程、應用程序。
    的頭像 發(fā)表于 01-03 12:31 ?2037次閱讀
    如何<b class='flag-5'>構建</b>linux開發(fā)環(huán)境和編譯軟件工程、<b class='flag-5'>應用程序</b>
    RM新时代网站-首页