在計算機和嵌入式系統中,各種存儲技術扮演著不同的角色,它們的性能特點和應用場景各不相同。很多人對DRAM、SRAM、HBM、ROM、NOR Flash、NAND Flash、eMMC、UFS 等術語感到困惑,不清楚它們之間的區別和關系,以及哪些是片上存儲,哪些是片外存儲。本文將系統地解析這些存儲技術,并以樹莓派和x86個人電腦為例,說明它們在實際系統中的應用。
存儲技術分類框架
存儲技術可以按照數據保存的持久性分為兩大類:
存儲技術 │ ├─ 易失性存儲 (斷電數據丟失) │ ├─ SRAM (靜態隨機存取存儲器) │ └─ DRAM 家族 (動態隨機存取存儲器) │ ├─ 傳統DRAM │ ├─ SDRAM (同步動態隨機存取存儲器) │ ├─ DDR SDRAM (雙倍數據率SDRAM) │ │ ├─ DDR1/2/3/4/5│ │ └─ LPDDR (低功耗DDR) │ └─ HBM (高帶寬內存) │ └─ 非易失性存儲 (斷電數據保留) ├─ ROM 家族 (只讀存儲器) │ ├─ 掩膜ROM │ ├─ PROM (可編程ROM) │ ├─ EPROM (可擦除可編程ROM) │ └─ EEPROM (電可擦除可編程ROM) │ ├─ Flash 家族 │ ├─ NOR Flash │ └─ NAND Flash │ └─ 新型非易失存儲 ├─ eMMC (嵌入式多媒體卡) ├─ SSD (固態硬盤) └─ UFS (通用閃存存儲)
Flash存儲技術詳解
Flash存儲是一種非易失性存儲器,即使斷電后也能保留數據。主要分為NOR Flash和NAND Flash兩種類型。
NOR Flash與NAND Flash對比
特性 | NOR Flash | NAND Flash |
---|---|---|
存儲單元結構 | 每個單元直接連接到位線和字線 | 單元排列成串聯結構 |
隨機訪問能力 | 支持(可按字節訪問) | 不支持(按頁訪問) |
讀取速度 | 快(50-100ns) | 中等(25-50μs) |
寫入速度 | 慢(5-10μs/字節) | 快(200-300μs/頁) |
擦除速度 | 很慢(0.5-2s/塊) | 快(1.5-3ms/塊) |
擦除單位 | 較大塊(64KB-128KB) | 較小塊(4KB-16KB) |
存儲密度 | 低 | 高 |
成本/比特 | 高 | 低 |
耐久性(擦寫次數) | 10萬-100萬次 | 1千-10萬次 |
錯誤率 | 低 | 高(需要ECC錯誤糾正) |
壞塊管理 | 通常不需要 | 必需 |
XIP支持 | 支持(可直接執行代碼) | 不支持 |
典型容量范圍 | 幾MB-幾百MB | 幾GB-幾TB |
典型應用 |
BIOS/UEFI固件 微控制器程序存儲 啟動代碼 |
SSD存儲介質 SD卡/U盤 大容量數據存儲 |
NOR Flash詳解
工作原理:
NOR Flash的存儲單元直接連接到位線和字線,允許隨機訪問任何存儲單元,類似于RAM的訪問方式。
主要特點:
支持隨機讀取,可以按字節訪問
讀取速度快,適合存儲需要直接執行的代碼
支持XIP(Execute In Place),程序可以直接從Flash中執行
寫入和擦除速度較慢
容量相對較小,成本較高
應用場景:
存儲啟動代碼和固件
微控制器內部程序存儲
BIOS/UEFI芯片
需要隨機訪問的小容量存儲
NAND Flash詳解
工作原理:
NAND Flash的存儲單元排列成串聯結構,需要按頁讀取數據,不支持隨機訪問單個字節。
SLC MLC TLC QLC
主要特點:
高存儲密度,適合大容量存儲
按頁(2KB-16KB)讀寫,不支持隨機字節訪問
寫入和擦除速度快
需要錯誤檢測與糾正(ECC)和壞塊管理
成本較低
應用場景:
大容量數據存儲
SSD(固態硬盤)
SD卡和TF卡
智能手機和平板電腦存儲
RAM技術詳解
RAM(隨機存取存儲器)是一種易失性存儲器,斷電后數據會丟失。主要分為SRAM和DRAM兩大類。
SRAM(靜態隨機存取存儲器)
工作原理:
使用雙穩態電路(通常6個晶體管)存儲每個位,只要有電源供應,數據就能保持不變。
主要特點:
速度極快(2-10納秒訪問時間)
不需要刷新操作維持數據
密度低,功耗高,成本高
集成度低,占用芯片面積大
應用場景:
CPU緩存(L1/L2/L3 Cache)
微控制器內部的工作內存
高速緩沖區
是否片上:通常集成在CPU/微控制器內部(片上),作為緩存或工作內存
DRAM(動態隨機存取存儲器)
工作原理:
使用一個晶體管和一個電容存儲每個位,需要定期刷新以防止數據丟失。
主要特點:
密度高,成本低,功耗中等
需要定期刷新(通常每幾毫秒)
訪問時間較長(50-100納秒)
集成度高,適合大容量存儲
DRAM的主要類型:
傳統DRAM:早期的DRAM技術,現已很少使用。
SDRAM(同步動態隨機存取存儲器):
與系統時鐘同步工作
支持突發傳輸模式,提高吞吐量
訪問時間10-20納秒
DDR SDRAM(雙倍數據率SDRAM):
在時鐘信號的上升沿和下降沿都傳輸數據
有多代產品:DDR、DDR2、DDR3、DDR4、DDR5
每代性能提升約一倍
LPDDR(低功耗DDR):
DDR的低功耗版本,專為移動設備設計,筆記本電腦常見
犧牲部分性能換取更低功耗
有多代產品:LPDDR2、LPDDR3、LPDDR4、LPDDR5
應用場景:
系統主內存
圖形卡內存
大容量臨時存儲
是否片上:通常是獨立芯片(片外),通過內存總線連接到CPU,以DIMM或SO-DIMM形式安裝
HBM(高帶寬內存)
HBM是一種革命性的DRAM技術,通過3D堆疊和寬總線接口實現超高帶寬,主要用于高性能計算和圖形處理應用。
工作原理:
HBM將多個DRAM芯片垂直堆疊,并通過硅穿孔(TSV, Through-Silicon Via)技術互連,形成一個緊湊的"內存立方體",然后通過寬接口(通常1024位)與處理器通信。
架構特點:
3D堆疊結構:
多個DRAM芯片(通常4-8層)垂直堆疊
使用TSV(硅穿孔)技術進行層間互連
每個堆棧形成一個"內存立方體"(memory cube)
2.5D封裝技術:
HBM與處理器芯片并排放置在硅中介層(silicon interposer)上
中介層提供高密度互連,替代傳統PCB布線
大幅縮短信號路徑,降低延遲和功耗
超寬接口:
每個HBM堆棧提供1024位寬接口
相比DDR4的64位寬,帶寬提升16倍
工作頻率相對較低(2-3.6Gbps),降低功耗
HBM各代技術規格對比:
特性 | HBM1 | HBM2 | HBM2E | HBM3 | HBM3E |
---|---|---|---|---|---|
發布年份 | 2015 | 2016 | 2019 | 2021 | 2023 |
每引腳帶寬 | 1Gbps | 2Gbps | 3.6Gbps | 6.4Gbps | 9.2Gbps |
堆棧層數 | 4層 | 4-8層 | 8-12層 | 8-12層 | 12-16層 |
每堆棧容量 | 1-4GB | 2-8GB | 8-24GB | 16-32GB | 24-48GB |
每堆棧帶寬 | 128GB/s | 256GB/s | 460GB/s | 819GB/s | 1.2TB/s |
多堆棧總帶寬 | 512GB/s | 1TB/s | 1.84TB/s | 3.27TB/s | 4.8TB/s |
HBM的優勢:
超高帶寬,遠超傳統DDR內存
相比GDDR6,相同帶寬下功耗低50%以上
緊湊尺寸,節省PCB空間
更低的工作頻率,降低電磁干擾
HBM的局限性:
成本高,制造復雜
需要特殊的2.5D封裝技術
容量擴展性有限
供應鏈相對受限
應用場景:
高端GPU(如NVIDIA H100、AMD Instinct MI300)
AI加速器(如Google TPU)
高性能計算(HPC)系統
網絡交換設備
高端FPGA
是否片上:通常與處理器同封裝但分離芯片,采用2.5D封裝技術(硅中介層)
ROM和嵌入式存儲技術詳解
ROM(只讀存儲器)
ROM是一種非易失性存儲器,主要用于存儲固定的程序和數據。
主要類型:
掩膜ROM:
內容在制造時固化,不可修改
成本最低,適合大批量生產
PROM(可編程ROM):
可使用編程器寫入一次數據,之后不可修改
適合小批量生產
EPROM(可擦除可編程ROM):
可通過紫外線擦除數據,然后重新編程
需要特殊的編程設備
EEPROM(電可擦除可編程ROM):
可電擦除可編程ROM,可按字節修改
擦寫次數有限(通常10萬次左右)
適合存儲需要偶爾修改的配置數據
應用場景:
存儲引導程序(BIOS/UEFI)
微控制器程序存儲
存儲固定配置數據
是否片上:可能是片上也可能是片外,取決于系統設計
eMMC(嵌入式多媒體卡)
eMMC是一種集成了NAND Flash和控制器的嵌入式存儲解決方案,提供標準接口,簡化系統設計。
主要特點:
將NAND Flash和控制器集成在一個封裝中
控制器處理壞塊管理、磨損均衡、錯誤糾正等
提供標準接口,簡化系統設計
容量通常從4GB到256GB不等
性能介于原始NAND Flash和SSD之間
應用場景:
低端筆記本電腦
嵌入式系統和單板計算機(如某些樹莓派型號)
是否片上:片外,通常直接焊接在主板上
UFS(通用閃存存儲)
UFS是一種高性能嵌入式存儲標準,旨在替代eMMC,為移動設備提供更高性能和更低功耗。
工作原理:
UFS基于SCSI架構,采用全雙工通信和MIPI M-PHY物理層接口,支持命令隊列和并發操作。
架構特點:
SCSI命令集:
采用成熟的SCSI命令協議
支持復雜的命令隊列和優先級管理
兼容現有軟件生態系統
全雙工通信:
兩條獨立的單向數據通道
同時支持讀寫操作
顯著提高并發性能
MIPI UniPro協議棧:
采用分層協議架構
提供可靠的數據傳輸和錯誤恢復
支持服務質量(QoS)管理
MIPI M-PHY物理層:
高速、低功耗的串行接口
支持多種速率檔位
先進的電源管理功能
UFS各代技術規格對比:
特性 | UFS 2.1 | UFS 3.0 | UFS 3.1 | UFS 4.0 |
---|---|---|---|---|
發布年份 | 2015 | 2018 | 2020 | 2022 |
每通道速率 | 600MB/s | 1450MB/s | 1450MB/s | 2100MB/s |
總理論帶寬 | 1.2GB/s | 2.9GB/s | 2.9GB/s | 4.2GB/s |
通道數 | 2(全雙工) | 2(全雙工) | 2(全雙工) | 2(全雙工) |
特殊功能 | 基本功能 | 深度休眠 |
WriteBooster 性能調節 原子寫入 |
更低功耗 更高可靠性 |
相對功耗 | 基準 | -30% | -30% | -46% |
UFS相比eMMC的優勢:
特性 | UFS 3.1 | eMMC 5.1 |
---|---|---|
最大帶寬 | 2.9 GB/s | 400 MB/s |
通信方式 | 全雙工 | 半雙工 |
命令處理 | 多命令隊列 | 單命令處理 |
接口類型 | 差分串行 | 并行 |
功耗效率 | 高 | 中 |
應用場景:
高端智能手機
平板電腦
增強現實/虛擬現實設備
汽車信息娛樂系統
高性能嵌入式系統
片上與片外存儲
片上存儲(On-chip)
片上存儲是指集成在處理器芯片內部的存儲器,如:
SRAM :用于CPU緩存(L1/L2/L3)
小容量ROM :用于存儲啟動代碼
微控制器內部Flash :用于存儲程序代碼
特點:
訪問速度極快(直接通過片內總線)
容量有限(受芯片面積限制)
成本高(增加芯片復雜度)
功耗低(無需外部接口)
片外存儲(Off-chip)
片外存儲是指與處理器芯片分離的獨立存儲設備,如:
DRAM :系統主內存
SSD/HDD :大容量存儲
外部Flash :擴展存儲
HBM :雖然與處理器封裝在一起,但仍是獨立芯片
特點:
訪問速度較慢(需要通過外部總線)
容量大(不受處理器芯片面積限制)
成本相對較低
功耗較高(需要外部接口)
實際系統中的存儲架構
樹莓派存儲架構
以樹莓派4B為例:
片上(SoC內部)存儲
L1緩存:
類型 :SRAM
容量 :32KB指令緩存 + 32KB數據緩存(每個核心)
用途 :最快速的CPU數據訪問
L2緩存:
類型 :SRAM
容量 :1MB(共享)
用途 :二級CPU緩存
ROM:
類型 :掩膜ROM
容量 :幾KB
用途 :存儲初始引導代碼
片外存儲
主內存:
類型 :LPDDR4 SDRAM
容量 :1GB/2GB/4GB/8GB(取決于型號)
用途 :操作系統和應用程序的運行內存
啟動/系統存儲:
類型 :microSD卡(基于NAND Flash)
容量 :通常8GB-128GB(用戶選擇)
用途 :存儲操作系統、應用程序和用戶數據
可選擴展存儲:
類型 :USB外接硬盤/SSD
容量 :取決于外接設備
用途 :額外數據存儲
樹莓派啟動流程
SoC上電后,執行片上ROM中的代碼
ROM代碼初始化基本硬件并從SD卡加載第一階段引導加載程序
引導加載程序初始化SDRAM并加載操作系統內核
操作系統加載到SDRAM并開始執行
操作系統從SD卡加載其他組件和應用程序
x86個人電腦存儲架構
現代x86個人電腦擁有更復雜的存儲層次結構:
片上(CPU內部)存儲
L1緩存:
類型 :SRAM
容量 :通常32KB-64KB指令緩存 + 32KB-64KB數據緩存(每個核心)
用途 :最快速的CPU數據訪問
L2緩存:
類型 :SRAM
容量 :通常256KB-1MB(每個核心)
用途 :二級CPU緩存
L3緩存:
類型 :SRAM
容量 :通常4MB-64MB(所有核心共享)
用途 :三級CPU緩存
片外存儲
主內存:
類型 :DDR4 SDRAM(現代系統)
容量 :通常8GB-64GB
用途 :操作系統和應用程序的運行內存
接口 :DIMM插槽
BIOS/UEFI存儲:
類型 :NOR Flash
容量 :通常8MB-32MB
用途 :存儲系統固件(BIOS/UEFI)
位置 :主板上
主存儲:
類型 :SSD(基于NAND Flash)或HDD(機械硬盤)
容量 :SSD通常256GB-2TB,HDD通常1TB-8TB
用途 :存儲操作系統、應用程序和用戶數據
接口 :SATA、PCIe或M.2
x86 PC啟動流程
系統上電后,CPU執行位于固定地址的指令,訪問BIOS/UEFI(NOR Flash)
BIOS/UEFI初始化基本硬件并識別啟動設備
從啟動設備(通常是SSD)加載操作系統引導加載程序
引導加載程序加載操作系統內核到主內存(DRAM)
操作系統接管控制權,初始化其他組件
應用程序從SSD加載到DRAM并執行
存儲技術對比表
存儲類型 | 易失性 | 典型訪問時間 | 密度 | 成本 | 功耗 | 主要應用 | 通常位置 |
---|---|---|---|---|---|---|---|
SRAM | 易失 | 2-10ns | 非常低 | 非常高 | 中-高 | CPU緩存 | 片上 |
DRAM | 易失 | 50-100ns | 中 | 中 | 中 | 主內存 | 片外 |
SDRAM | 易失 | 10-20ns | 中 | 中 | 中 | 主內存 | 片外 |
DDR SDRAM | 易失 | 5-15ns | 中-高 | 中 | 中-高 | 現代主內存 | 片外 |
ROM | 非易失 | 50-150ns | 中 | 低 | 非常低 | 固件存儲 | 片上/片外 |
EEPROM | 非易失 | 200-300ns | 低 | 中-高 | 低 | 配置數據 | 片上/片外 |
NOR Flash | 非易失 |
讀:50-100ns 寫:5-10μs 擦:0.5-2s |
低-中 | 中-高 | 低 | 代碼存儲 | 片上/片外 |
NAND Flash | 非易失 |
讀:25-50μs 寫:200-300μs 擦:1.5-3ms |
高 | 低 | 低 | 大容量存儲 | 片外 |
常見問題解答
問:為什么有些存儲是片上而有些是片外?
答:這主要取決于性能需求、成本和物理限制:
片上存儲提供最快的訪問速度,但容量受限且成本高
片外存儲可提供更大容量,成本更低,但訪問速度較慢
高性能部件需要最快速的訪問(如CPU緩存),必須集成在芯片內
大容量存儲由于物理尺寸限制無法集成在處理器芯片上
問:為什么需要這么多不同類型的存儲?
答:計算機系統使用多層次存儲架構來平衡性能、容量和成本:
越靠近CPU的存儲越快但容量小且昂貴(如SRAM緩存)
越遠離CPU的存儲越慢但容量大且便宜(如硬盤/SSD)
不同應用場景需要不同的性能和容量特性
通過組合使用這些技術,系統可以在性能和成本之間取得最佳平衡
問:Flash存儲器會"磨損"是什么意思?
答:Flash存儲單元有有限的擦寫壽命:
每個存儲單元在被擦除后會輕微退化
達到擦寫次數上限后(NAND約1千-10萬次,NOR約10萬-100萬次),單元可能無法可靠存儲數據
這就是所謂的"磨損"
現代Flash存儲設備使用"磨損均衡"技術,確保所有存儲單元均勻使用,延長整體壽命
問:HBM和普通DRAM有什么根本區別?
答:HBM和普通DRAM使用相同的基礎存儲單元技術,但在架構和接口上有根本區別:
HBM采用3D堆疊結構,通過TSV實現層間互連
HBM使用超寬數據總線(1024位),而DDR SDRAM使用64位總線
HBM與處理器通過硅中介層緊密集成,縮短信號路徑
HBM針對帶寬優化,而非延遲,工作頻率實際低于DDR SDRAM
總結
存儲技術是一個復雜而多樣化的領域,不同類型的存儲技術各有優缺點和適用場景:
NOR Flash :適合存儲需要直接執行的代碼,如BIOS和微控制器程序
NAND Flash :適合大容量數據存儲,是SSD、SD卡和U盤的基礎
SRAM :速度極快但容量小,主要用于CPU緩存
DRAM :容量大但需要刷新,是系統主內存的主要選擇
ROM :用于存儲固定的程序和數據,如啟動代碼
eMMC :集成了NAND Flash和控制器,適合嵌入式系統的主存儲
SSD :集成了NAND Flash和控制器,是現代計算機的主存儲設備,提供高性能和大容量
UFS :提供高性能和低延遲,是eMMC的升級版
HBM :用于高性能計算和圖形處理,提供極高帶寬
-
FPGA
+關注
關注
1646文章
22059瀏覽量
619135 -
DRAM
+關注
關注
40文章
2351瀏覽量
185740 -
存儲技術
+關注
關注
6文章
757瀏覽量
46467
原文標題:存儲技術全解析:從芯片到系統
文章出處:【微信號:gh_9d70b445f494,微信公眾號:FPGA設計論壇】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
功率芯片PCB內埋式封裝:從概念到量產的全鏈路解析(下篇:封裝工藝制程全解析)

高性能存儲控制器的技術解析
龍芯中科全棧自主打造安全存儲生態
德明利亮相COMPUTEX 2025: 以全棧存儲技術賦能AI產業落地
COMPUTEX 2025:德明利以全棧存儲技術賦能“AI NEXT”產業落地

美國Odyssey奧德賽電池充電注意事項全解析

評論