本文結合國內主流SSD控制器/盤的研發(fā)中心在購買PCIe Gen 4&5協(xié)議分析儀過程中最關心的點闡述一下如何買到一臺高效、可用、高性價比的PCIe協(xié)議分析儀,這些公司包括浪潮、華芯、大普,Memblaze,YMTC,Longsys,Maxio, Sage Micro等等,下面按照關心的重要程度依次列出這些點供大家參考。
提示:對于Saniffer公司發(fā)布的Gen 4&5 NVMe SSD測試工具白皮書感興趣的朋友,可以訪問saniffer官方網站下面的連接下載最新更新的“PCIe Gen 4&5NVMe SSD測試環(huán)境搭建和常用工具圖解 4.0”文檔。如果有其它問題可以點擊本文左下角的“閱讀原文”留下你的聯系方式。
https://www.saniffer.com/cn/downloads/
1.信號問題
該問題是判斷一個分析儀是否可用的一個基本問題,業(yè)內估計沒有公司愿意花上百萬或者幾百萬人民幣購買一臺PCIe分析儀后發(fā)現在很多場景下無法使用。不幸的是,我們發(fā)現傳統(tǒng)架構的PCIe Gen4&5分析儀普遍存在這種問題甚至更嚴重。我們建議公司在做最終決定前一定要在真實環(huán)境中試用PCIe分析儀,這樣就可以大大避免購買以后出現問題。下面的問題是傳統(tǒng)PCIe分析儀在真實環(huán)境中經常出現的問題
–完全抓不到任何數據
–待測系統(tǒng)無法啟動
–待分析問題癥狀消失
–信號不好,抓到各種錯誤
碰到上述問題以后,傳統(tǒng)PCIe分析儀需要非常復雜的calibration,用戶工程師一般無法搞定,其實,即便原廠R&D設計工程師使用內部專用工具軟件進行信號的calibration校準也不一定搞好,因為這些問題大多由于其interposer內部設計造成的。
SerialTek公司的PCIe Gen 4&5協(xié)議分析儀設計具備自適應的EQ能力,并且當PCIe鏈路特性發(fā)生變化的時候(例如Hotplug或者NSSR)分析儀可以動態(tài)調整,其interposer采用昂貴的高端analog passthrough的模擬芯片將upstream和downstream信號導入分析儀,避免了上述這些問題的出現,也無需用戶進行信號校準(Calibration-free)。
我們來看一下業(yè)內知名的芯片公司Phison的首席工程師是如何來評價SerialTek的這一創(chuàng)新性的專利技術- 信號高保真SI-FI (Signal Fidelity)。
I’ve been using protocol analyzers for 31 years and PCIe analyzers and interposers extensively for the past 5 years. We use them for important assignments that affect revenue and customer satisfaction,” said John Wehman, Principal Engineer at Phison Technology. “With other analyzers I have had to abandon my testing many times, because I could not find a good quality signal lock. SerialTek’s Kodiak analyzer and SI-Fi interposers have changed all that. I have 100% confidence in Kodiak’s ability to achieve lock and give me the trace I need to do my job. Kudos to Ellisys and SerialTek for creating not only an electrically reliable platform, but the actual mechanical hardware itself is beautiful.
視頻一 SerialTek PCIe Gen 4 analyzer實物簡介
2.解碼速度
該問題是判斷一個分析儀問題診斷效率是否高效的重要參考。不論是計算、網絡、存儲、SSD還是其它芯片開發(fā)、驗證過程中會越來越多依賴PCIe分析儀分析各種各樣的問題,尤其在產品驗證的后半期,很多問題的復現本身就需要花費很長時間,如果對于抓取大量數據進行解碼分析再需要花費幾個小時甚至1~2天,相信工程師不會有那么多時間加班。
除了SerialTek之外,業(yè)內的傳統(tǒng)PCIe分析儀內部都沒有任何處理能力,抓取到數據以后,需要通過下面兩個步驟才能看到解碼 – 1)分析儀停止抓取數據后,安裝在用戶電腦的協(xié)議分析儀軟件開始將數據從分析儀BUFFER傳輸到電腦;2)傳輸完畢后解碼。所以,我們看到解碼嚴重依賴用戶的電腦,當然電腦單核CPU配置性能高一些,內存大一些可能效率稍高一點,傳統(tǒng)分析儀軟件都是單線程,多核CPU無法發(fā)揮作用。
傳統(tǒng)分析儀的實際測試結果:抓取32G buffer,傳輸時間4+小時,解碼時間4+小時,總計等待8小時才可以分析這些解碼。如果抓取128G Buffer,考慮到電腦的處理能力各方面,這個并不是簡單4倍的關系,估計需要2整天時間才可以解碼完畢(如果電腦不死機的話),如果有條件大家可以測試一下。
SerialTek分析儀采用高性能服務器架構,內置12 CORE高性能CPU, 使用標準Linux系統(tǒng),配置64G memory供Linux使用,協(xié)議分析儀軟件服務端采用多線程運行在12 CORE上。所以,分析儀一旦停止抓取數據后,CPU通過內置兩條Gen 3 x16總線從upstream (72GB buffer)和downstream(72GB buffer)分析儀板卡的buffer里面將數據取回進行分析。
基本1秒鐘即可解碼所有的數據,工程師可以用鼠標直接拖動到最后一行解碼進行問題定位和分析,不論你抓取的是36G, 72G,還是128GB數據,也不論解碼是2000萬行解碼還是2億行。如果簡單查看一下覺得不是自己需要的數據,下一秒鐘即可start capture重新開始抓取數據。
當然,可能有人問為什么需要抓取這么大的buffer的數據呢?幾個原因如下:
–在高速傳輸的情況下出現性能不穩(wěn)定問題或者功能問題
–問題很難復現,可能幾天出現一次,或者有的時間一天出現幾次,無法根據癥狀現象設置trigger條件,只能人工等待出現問題的時候給工程師預留出足夠的反應時間來停止抓包,這樣就可以將問題發(fā)生時候的數據保留在分析儀內部buffer,因為正常情況下buffer滿了會loopback環(huán)回從而沖掉之前抓取的數據。
3.存儲速度
有時候對于抓取到的數據進行初步分析后覺得有必要進一步分析,或者需交給其它同事分析,這個時候需要存儲該數據(專業(yè)術語: trace文件)。存儲速度也是衡量分析儀是否高效的一個重要指標。
傳統(tǒng)PCIe分析儀對于抓取的數據進行存儲的前提條件是先傳輸到到電腦,解碼完畢,然后才可以通過菜單將trace存儲在電腦本地的某個目錄下面。一般這個時候可能還要重新傳輸一遍數據,所以非常慢。以上面提到的8小時解碼的分析儀為例,如果存儲該trace文件估計需要至少等待8個小時。
SerialTek Gen 4&5協(xié)議分析儀保存144G BUFFER僅需要6.5min, 大大提高了效率。其本質原因在于分析儀架構采用高端服務器架構,和傳統(tǒng)的嵌入式架構的PCIe協(xié)議分析儀完全不一樣,SerialTek分析儀內置了最多4塊Samsung M.2 NVMe SSD,所有存儲書的時候無需導出到電腦,直接將buffer寫到內置的M.2 NVMe SSD閃存盤,所以速度非常塊。
4.問題復現時遇到解碼全錯
傳統(tǒng)PCIe Gen 4/5分析儀在實際使用之前必須進行經過一個“抓取上電過程”的冗長步驟,否則,希望等到問題出現的時候再來接入分析儀嘗試抓數據將無法解碼,具體分為下面三個步驟:1) 啟動協(xié)議分析儀,打開協(xié)議分析軟件,連接分析儀,開始抓取數據;2)啟動待測環(huán)境;3)停止分析儀抓取數據,load數據到分析儀軟件得到解碼所需要的參數信息,該信息將存儲在該電腦的分析軟件,以此作為后續(xù)抓取數據解碼的依據。
所以,上述設計的缺陷顯而易見,所有使用過這類傳統(tǒng)PCIe分析儀的工程師都會碰到這樣“惱人”的問題,即,為了復現某個問題需要反復重啟系統(tǒng),經過幾十次甚至上百次的掉電、上電總算問題復現了,結果發(fā)現分析儀也抓到數據了, 但是解碼全部錯誤。原因就在于問題復現時候的某些參數,例如BAR地址,register,或者PCIe speed或者width等和初始的參數對比發(fā)生了變化,但是分析軟件仍然用之前暫存的參數進行解碼,結果解碼全部錯誤。
SerialTek是業(yè)內唯一通過分析儀硬件實時監(jiān)控每次待測系統(tǒng)加電協(xié)商的參數的分析儀,所以,使用SerialTek協(xié)議分析儀根本不存在需要提前連接軟件抓取開機上電過程這個步驟,任何時候需要抓取的時候再打開分析軟件連接分析儀都可以直接抓取,并且解碼不會出錯。這個功能也是Intel, AMD, Seagate, WDC,Micron, MS, Apple, Broadcom以及國內知名公司一定要購買SerialTek的重要原因之一。
5.“遠程分析”和“遠程協(xié)作”
現在大多數產品開發(fā)公司一般都有多個站點,國內公司一般也會在上海、北京、深圳、成都、蘇州、杭州等城市有多個研發(fā)中心,跨國公司除了在上述城市有辦公室之外,還會在美國,加拿大,臺灣甚至日本設立研發(fā)中心,那么這種情況下,對于動輒抓取到的100GB trace文件如何分享和分析呢?傳統(tǒng)PCIe分析儀由于架構固有的限制,必須把trace文件發(fā)給另一方才可以分析。使用SerialTek則沒有這些問題,幾個典型場景如下:
–辦公室內部的分析和協(xié)作 – 工程師A退出軟件,工程師B連接分析儀,直接打開尚在buffer里面的數據秒解分析,或者打開A已經存儲在分析儀內部閃存盤上面的trace文件分析,時間也是秒解。
–跨辦公室的分析和協(xié)作 – 同上,只不過工程A和B分布在兩個不同的辦公室Site,兩個辦公室可能都在國內,也可能跨國。但是解碼速度也是秒解碼,因為B無論是打開分析儀內部buffer數據還是分析儀內部閃存盤的數據,分析儀本身只是將界面?zhèn)鬏數紹的軟件界面顯示,網絡帶寬占用只有10~20BPS,非常低。
–遠程辦公– 由于目前全球covid-19仍然肆虐,很多時候工程師需要遠程辦公,公司僅在辦公室安排少量的工程師或者實驗室技工協(xié)助搭建環(huán)境等工作。工程師A或者B只要通過VPN連接到公司內網,即可實現遠程操作分析儀抓包分析和多站點協(xié)作。
6.消費級M.2 SSD低功耗分析
當前,M.2 NVMe SSD在筆記本,Pad, GPS等消費類產品以及臺式機(游戲機)以及服務器啟動盤上獲得了廣泛的應用,但是,傳統(tǒng)PCIe Gen 4/5分析儀由于設計的原因導致M.2 SSD低功耗在分析時會出現丟包問題。SerialTek在硬件底層上解決了困擾用戶抓取低功耗碰到的這些問題。
7.企業(yè)級U.2/U.3/Single Port/Dual Port四合一分析
現在國內的企業(yè)級SSD廠商為了打入數據中心市場,有的公司從去年起即啟動U.3 NVMe SSD研發(fā),當然主流的接口仍然是U.2。目前傳統(tǒng)PCIe分析儀需要用戶分別購買U.2和U.3 interposer,價格非常昂貴。SerialTek分析儀提供“四合一”interposer,即一個interposer可以自適應支持U.2/U.3/Single Port/Dual Port這四種組合的SSD,并且,一臺分析儀非常方便地抓取dual port ssd的兩個port的數據。
8.斷網續(xù)傳
傳統(tǒng)PCIe分析儀的網線如果斷掉,即便0.1ms,再接回去網線也會無法使用,只能分析儀重啟然后重新抓取數據才可儀;這個是由于分析儀內部使用精簡OS無法維護網絡狀態(tài)導致。SerialTek分析儀使用標準CentOS完全解決了這個問題。該功能非常利好AE/FAE工程師外出調試問題,當工程師設置好觸發(fā)條件開始抓取數據以后即可斷開電腦離開現場,需要的時候可以接回電腦即可查看解碼數據。
9.對某個特定盤進行抓包或者命令觸發(fā)
現在有很多測試場景抓取的數據中有多個盤的流量,例如,如果使用cable interposer串接在switch卡和背板之間,或者使用slot interposer分析PCIe Gen 4 x16 Host Card連接4塊U.2 SSD的場景,那么分析儀就可以“看見”所有掛接在背板或者卡上面的SSD的流量,傳統(tǒng)分析儀無法區(qū)分抓取某個盤的流量,或者僅觸發(fā)某個盤的特定PCIe packet或者NVMe command,SerialTek 分析儀很好地解決了該問題,通過支持基于BDF以及queue等參數實現抓包過濾或者觸發(fā)。
10.如何解決不同版本沖突帶來的煩惱?**
一般情況下,公司里面都是有多名工程師會使用分析儀抓取數據,有些公司還會經常將分析儀在多個站點間調度使用,這就會帶來一個版本沖突的問題。PCIe分析儀由于會定期發(fā)布一些版本解決一些產品bug或者增加一些新的功能,假如某工程師A下載了一個新的協(xié)議分析儀軟件版本,當他安裝好打開軟件后由于和分析儀內部的firmware不匹配,所以需要升級分析儀。
如果下次另外一個工程師B使用該分析儀,由于他仍然使用上一個軟件版本,所以和拿到的分析儀內部的firmware版本不匹配,所以他如果要使用的話只能將分析儀firmware降級。然后如果A再拿去又不得不升級,如此反復會搞得版本維護非常雜亂,并且會導致潛在風險,因為分析儀firmware升級過程中萬一斷電會導致不得不回原廠返修。
SerialTek Gen 5分析儀使用Web界面管理,不再使用協(xié)議分析客戶端軟件的傳統(tǒng)方式。任意工程師通過Web將版本升級后,其他工程師登錄Web界面使用,就不存在版本反復升級、降級帶來的煩惱以及風險問題。
編輯:jq
-
PCIe
+關注
關注
16文章
1318瀏覽量
84626 -
SSD控制器
+關注
關注
1文章
12瀏覽量
11575 -
華芯
+關注
關注
0文章
8瀏覽量
2203 -
WDC
+關注
關注
0文章
4瀏覽量
3334
原文標題:業(yè)界主流SSD研發(fā)中心選擇PCIe Gen 4&5分析最關心哪幾個點
文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
如何判斷產品需不需要做AT&T認證?AT&T測試內容和要求分享

ADS9234R這個AD的寄存器如何配置,需要用到哪幾個引腳?
onsemi LV/MV MOSFET 產品介紹 &amp;amp; 行業(yè)應用

用TPA3136典型應用電路波形異常,從哪幾個方面尋找問題?
【直播預告】ADI &amp;amp; WT·世健MCU痛點問題探索季:MCU應用難題全力擊破!

Solidigm發(fā)布高性能PCIe 5.0 SSD,引領數據中心存儲新紀元
TAS2505-Q1的MCLK, WCLK, DIN, BCLK這幾個PIN,對應的mcu這邊的哪幾個pin?
美光研發(fā)出世界首款PCIe Gen6 SSD
Prodigy Technovations推出功能強大的PCIe Gen5協(xié)議分析儀

評論