谷歌云最近在 Cloud SQL for PostgreSQL 和 AlloyDB for PostgreSQL 中增加了對 pgvector 的支持。這個擴展為托管數據庫帶來了向量搜索操作,允許開發人員存儲大型語言模型(LLM)生成的向量嵌入并執行相似性搜索。
Cloud SQL 和 AlloyDB 現在可以與 Vertex AI 上的生成性 AI 服務配對,幫助創建能夠感知應用程序和用戶狀態的 AI 應用程序。谷歌高級產品經理 Sandhya Ghai 和產品經理 Bala Narasimhan 解釋說:
向量嵌入是一種數值表示,通常用于將復雜的用戶生成內容(如文本、音頻和視頻)轉換為易于存儲、操作和索引的形式。這些表示由嵌入模型生成,如果兩個內容在語義上相似,它們各自的嵌入就會在嵌入向量空間中彼此相鄰。然后,向量嵌入會被索引,被用于基于相似性進行有效的數據過濾。
例如,開發人員可以使用 Vertex AI 的預訓練模型在文本和圖像之間生成嵌入,并將它們存儲并索引到數據庫中,簡化查找相似記錄的過程。
用戶現在可以使用 CREATE EXTENSION 命令在現有的數據庫中安裝 pgvector 擴展:
postgres=> CREATE EXTENSION IF NOT EXISTS vector;
CREATE EXTENSION
postgres=> CREATE TABLE embeddings(
id INTEGER,
embedding vector(3)
);
CREATE TABLE
postgres=> INSERT INTO embeddings
VALUES
(1, '[1, 0, -1]'),
(2, '[1, 1, 1]'),
(3, '[1, 1, 50]');
INSERT03
正如 Ghai 和 Narasimhan 所解釋的那樣,這一新功能還可以幫助開發人員利用預訓練的 LLM:
我們需要了解的是,LLM 沒有狀態的概念……嵌入允許你將大型上下文(如文檔或歷史聊天記錄)存儲在數據庫中,并過濾它們,以便查找最相關的信息。然后,你可以將最相關的聊天歷史記錄或文檔片段輸入模型來模擬長期記憶和業務特定知識。
谷歌云發布了一個 Colab Notebook 和一個視頻,用 pgvector、開源框架 LangChain 和 LLM 構建 AI 驅動的應用程序。谷歌高級軟件工程師 Saket Saurabh 演示了如何在示例 Python 應用程序中添加生成式 AI 功能,他寫道:
pgvector 擴展還引入了用于對向量執行相似性匹配的新運算符,你可以用它查找語義上相似的向量。這樣的運算符有兩個:
‘<->’:返回兩個向量之間的歐幾里得距離…… ‘<=>’:返回兩個向量之間的余弦距離
在過去的幾個月中,谷歌云并不是唯一一個瞄準向量數據庫的云供應商,Amazon RDS for PostgreSQL 也支持 pgvector 擴展,微軟還展示了如何將 Azure Data Explorer(ADX)作為向量數據庫,并討論了幾種連接到向量數據庫的連接器。
-
連接器
+關注
關注
99文章
15233瀏覽量
139334 -
AI
+關注
關注
87文章
34274瀏覽量
275460 -
數據庫
+關注
關注
7文章
3901瀏覽量
65785
原文標題:增強AI能力:谷歌云在托管數據庫中集成向量搜索
文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
HarmonyOS5云服務技術分享--云數據庫使用指南
《AI Agent 應用與項目實戰》閱讀心得3——RAG架構與部署本地知識庫
聚云科技榮獲亞馬遜云科技生成式AI能力認證
適用于Oracle的Python連接器:可訪問托管以及非托管的數據庫
一般企業購買云服務器帶數據庫嗎?
華為云榮登Gartner?云數據庫挑戰者象限
數據庫數據恢復—通過拼接數據庫碎片恢復SQLserver數據庫

評論