女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌開源張量網絡庫TensorNetwork,GPU處理提升100倍!

WpOh_rgznai100 ? 來源:yxw ? 2019-06-06 13:56 ? 次閱讀

世界上許多最嚴峻的科學挑戰,如開發高溫超導體和理解時空的本質,都涉及處理量子系統的復雜性。然而,這些系統中量子態的數量程指數級增長,使得暴力計算并不可行。為了解決該問題,數據結構采用了張量網絡的方式。張量網絡讓人們關注與現實世界問題最相關的量子態,如低能態。張量網絡已經越來越多地在機器學習中得到應用。

然而,目前仍存在相當多的一些挑戰阻礙了其在機器學習社區中的廣泛使用:1)用于加速硬件的生產級張量網絡庫還不能用于大規模運行張量網絡算法;2)大多數張量網絡文獻是面向物理應用的,并產生了一種錯誤的印象,即需要量子力學方面的專業知識來理解算法。

為了解決這一問題,谷歌 X 實驗室與加拿大Perimeter理論物理研究所(Perimeter Institute for Theoretical Physics )的研究人員合作開發了張量網絡 TensorNetwork,以 TensorFlow 作為后端,針對 GPU 處理進行了優化。與在 CPU 上計算工作相比,可以實現高達 100 倍的加速。這是一個全新的開源庫,旨在提高張量計算的效率。

據悉,研究人員已經發布了一些列論文對張量網絡的概念、特性以及應用特例等方面進行了詳細闡釋。

工作原理

張量是一種多維數組,按照順序進行分類。例如,一個普通數零階張量,也稱為標量,一個向量是一階張量,一個矩陣是二階張量。雖然低階張量可以很容易地用數字數組或像 Tijnklm 這樣的數學符號來表示,但一旦開始討論高階張量,這個符號就變得非常麻煩。

這一點上,使用圖解記數法是非常有用的,在這種記數法中,人們只需畫一個有許多條線或” 腿 “的圓(或其他形狀)。在這個符號中,標量只是一個圓,向量只有一條腿,矩陣有兩條腿等。張量的每條腿也有大小,也就是腿的長度。

張量的圖解符號

以這種方式表示張量的好處是簡潔地編碼數學運算,例如,將一個矩陣乘以一個向量得到另一個向量,或者兩個向量相乘得到標量。這個過程被稱為張量收縮。

張量收縮的圖解表示法

向量和矩陣乘法以及矩陣跡線(即矩陣對角元素的總和)。

除了這些案例之外,還有以張量收縮模式進行編碼以形成一個新張量的圖形方式。每個組成張量都有一個由自己的腿數決定的順序。連接的腿在圖中形成一條邊,代表收縮,而剩余懸空腿的數量決定了合成張量的順序。

左:四個矩陣乘積的表示,即 tr(ABCD),它是一個標量。右:三個三階張量收縮,三條腿懸空,產生一個新的三階張量。

雖然這些例子非常簡單,但張量網絡通常代表以各種方式收縮的數百個張量。用傳統的符號來描述這樣一件事情是非常模糊的,這也是 Roger Penrose 在 1971 年發明圖解符號(diagrammatic notation)的原因。

實踐過程

以一些黑白圖像為例,每個圖像可以被看做是 N 個像素值的列表。單個圖像中的單個像素可以被獨熱編碼( one-hot-encoding)成二維向量,并且通過這些像素編碼組合在一起,我們可以得到 2N 個維獨熱編碼的結果。我們可以將高維向量轉化為 N 階張量,然后將圖像集合中所有張量相加,得到量 Ti1,i2,...,iN 的集合。

這聽起來像是一件非常浪費時間的事情。因為以這種方式對約 50 像素的圖像進行編碼已經占用了數千兆字節的內存。這正是張量網絡的作用所在。研究人員沒有直接存儲或操縱張量 T,而是將張量 T 作為張量網絡內的多個小的張量組合。結果證明這非常有效。例如,流行的矩陣乘積態(matrix product state,MPS)網絡可以將 T 表示為 N 個較小的張量,從而總參數量為 N 的線性級,而不是指數級。

高階張量 T 用矩陣乘積態張量網絡中的許多低階張量來表示。

但在有效構建或操縱大型張量網絡的同時又能始終避免使用大量內容的需求,是不太明顯的。但事實證明,這在許多情況下是可能的,這也是張量網絡廣泛用于量子物理和機器學習領域的原因。Stoudenmire 和 Schwab 使用這種編碼來構建圖像分類模型,展示了張量網絡的新用途。而 TensorNetwork 庫旨在推進這類工作,研究人員在 TensorNetwork 相關論文中介紹了該庫如何應用于張量網絡的操作。

在物理場景中的應用性能

TensorNetwork 是一個針對張量網絡算法的通用庫,因此它適用于物理學場景。逼近量子態是張量網絡在物理學中的一個典型用例,可說明張量網絡庫的能力。在另一篇論文《TensorNetwork on TensorFlow: A Spin Chain Application Using Tree Tensor Networks》中,研究人員提出了一種近似樹張量網絡(tree tensor network,TTN),并使用張量網絡庫實現了該算法。此外,研究人員還對比了 CPU 和 GPU 的情況,發現在使用 GPU 和張量網絡庫時,計算速度顯著提高了近 100 倍。

計算時間作為連接維度的函數 X。連接維度( bond dimension )決定了張量網絡中張量的大小。連接維度越大意味著張量網絡約強大,但這個過程也需要更多的計算資源。

總結及未來工作

本文是講述 TensorNetwork 實際應用案例的第一篇文章,后續的論文中,研究人員將使用 TensorNetwork 在 MNIST 和 Fashion-MNIST 上執行圖像分類,后面還將包括時序分析、量子電路仿真等。研究人員希望 TensorNetwork 能成為物理學家和機器學習從業者的寶貴工具。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19812

    瀏覽量

    233608
  • 谷歌
    +關注

    關注

    27

    文章

    6223

    瀏覽量

    107562
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4912

    瀏覽量

    130675

原文標題:谷歌開源張量網絡庫TensorNetwork,GPU處理提升100倍!

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    DeepSeek最新論文:訓練速度提升9,推理速度快11

    電子發燒友網報道(文/梁浩斌)周二xAI發布了Grok3,這個馬斯克稱之為“地球上最聰明的AI”搶占了所有人的眼球。 ? 為了打造最強AI大模型,xAI投入了20萬塊H100 GPU,計算資源
    的頭像 發表于 02-20 11:25 ?1965次閱讀
    DeepSeek最新論文:訓練速度<b class='flag-5'>提升</b>9<b class='flag-5'>倍</b>,推理速度快11<b class='flag-5'>倍</b>!

    高效地擴展Polars GPU Parquet讀取器

    處理大型數據集時,數據處理工具的性能至關重要。Polars 作為一個以速度和效率著稱的開源數據處理,它提供了由 cuDF 驅動的
    的頭像 發表于 04-21 17:12 ?238次閱讀
    高效地擴展Polars <b class='flag-5'>GPU</b> Parquet讀取器

    無法調用GPU插件推理的遠程張量API怎么解決?

    運行了使用 GPU 插件的遠程張量 API 的推理。但是,它未能共享 OpenCL* 內存,但結果不正確。
    發表于 03-06 06:13

    OpenVINO?檢測到GPU,但網絡無法加載到GPU插件,為什么?

    OpenVINO?安裝在舊的 Windows 10 版本 Windows? 10 (RS1) 上。 已安裝 GPU 驅動程序版本 25.20.100.6373,檢測到 GPU,但網絡無法加載
    發表于 03-05 06:01

    摩爾線程完成DeepSeek開源FlashMLA和DeepGEMM適配

    自DeepSeek啟動“開源周”以來,已陸續開源三個代碼。摩爾線程基于全新MUSA Compute Capability 3.1計算架構,可提供原生FP8計算能力,同時升級了高性能線性代數模板
    的頭像 發表于 02-27 14:40 ?496次閱讀

    沐曦GPU跑通DeepSeek開源代碼FlashMLA

    今日,DeepSeek正式啟動"開源周"計劃,首發代碼FlashMLA一經開源即引發全網關注。截至發稿,該項目已在GitHub斬獲超7.2K Star!
    的頭像 發表于 02-25 16:25 ?738次閱讀

    半導體所在光學張量處理領域取得新進展

    在人工神經網絡中,張量作為多維數組,在數據結構中扮演著核心角色。近年來,隨著深度學習領域的蓬勃發展和生成式人工智能技術的興起,神經網絡模型的復雜度持續攀升,模型參數量更是呈現出爆炸式的增長態勢。然而
    的頭像 發表于 01-08 11:38 ?339次閱讀

    開源AI模型是干嘛的

    開源AI模型是指那些公開源代碼、允許自由訪問和使用的AI模型集合。這些模型通常經過訓練,能夠執行特定的任務。以下,是對開源AI模型的詳細
    的頭像 發表于 12-14 10:33 ?702次閱讀

    谷歌正式發布Gemini 2.0 性能提升近兩

    在智能體時代,谷歌再次引領技術潮流,正式發布了其最新力作——Gemini 2.0。這款AI模型不僅在性能上實現了顯著提升,更是在多模態表現和原生工具應用方面展現了前所未有的強大功能。 Gemini
    的頭像 發表于 12-12 14:22 ?750次閱讀

    RK3568國產處理器 + TensorFlow框架的張量創建實驗案例分享

    一、實驗目的 本節視頻的目的是了解張量定義、了解張量的表示形式、并學習基于TensorFlow框架的張量創建方法。 二、實驗原理. 張量定義 1、
    發表于 12-03 14:43

    芯原股份與開源圖形LVGL達成戰略合作

    為廣泛的嵌入式應用提供優化和擴展的圖形處理能力。作為首批為LVGL生態系統提供3D GPU技術支持的提供商之一,芯原將助力進一步提升LVGL圖形的3D圖形渲染能力。
    的頭像 發表于 11-29 09:20 ?689次閱讀

    《算力芯片 高性能 CPUGPUNPU 微架構分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    在數據挖掘工作中,我經常需要處理海量數據的深度學習任務,這讓我對GPU架構和張量運算充滿好奇。閱讀《算力芯片》第7-9章,讓我對這些關鍵技術有了全新認識。 GPU架構從早期的固定功能流
    發表于 11-24 17:12

    摩爾線程開源高性能線性代數模板MUTLASS

    近日,摩爾線程宣布開源高性能線性代數模板MUTLASS,以便開發者能夠更高效針對摩爾線程全功能GPU的MUSA Core及Tensor Core等單元進行編程,加速基于國產GPU的算
    的頭像 發表于 11-13 11:53 ?689次閱讀

    如何構建及優化GPU網絡

    并從計算節點成本優化、集群網絡與拓撲的選擇等方面論述如何構建及優化GPU網絡
    的頭像 發表于 11-06 16:03 ?862次閱讀
    如何構建及優化<b class='flag-5'>GPU</b>云<b class='flag-5'>網絡</b>

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    GPU 中的應用歷史 第9章 張量處理器設計 9.1 張量的定義 9.2 脈動陣列計算單元 9.3 Volta 架構引入張量核心 9.
    發表于 10-15 22:08