女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用Prometheus與Grafana實現MindIE服務可視化監控功能

OSC開源社區 ? 來源:OSC開源社區 ? 2025-04-21 11:48 ? 次閱讀

作者 | 孫曉 李鋒

1相關概念

1.1 MindIE 服務化監控指標查詢接口

在 MindIE 服務化運行過程中,為了及時掌握服務的運行狀態、性能表現以及發現潛在問題,提供了服務監控指標查詢接口(普羅 (Prometheus) 格式)。該接口能夠幫助開發者和運維人員獲取豐富的服務監控指標數據,為優化服務配置、保障服務質量提供有力支持。

本文將介紹如何使用 Prometheus 與 Grafana 來實現 MindIE 服務可視化監控功能。

當前接口支持以下指標監控,詳情可以參考:服務監控指標查詢接口(普羅格式)

名稱 描述
請求相關指標
request_received_total 服務端接收到的推理請求總數。通過該指標可了解服務的訪問熱度。
request_success_total 推理成功的請求個數,用于衡量服務的推理成功率。
request_failed_total 推理失敗的請求個數,結合成功請求數可計算失敗率,評估服務的穩定性。
num_requests_running 當前正在運行的請求個數,反映服務當前的負載情況。
num_requests_waiting 當前等待處理的請求個數,可用于判斷服務的處理能力是否滿足需求。
num_requests_swapped 當前被交換到 CPU 上的請求個數,幫助了解資源調度情況。
num_preemptions_total 累計觸發請求搶占的次數,用于分析服務資源競爭和調度策略的合理性。
Token 相關指標
prompt_tokens_total 處理的所有請求的輸入 prompt token 總數,反映輸入數據量。
generation_tokens_total 推理后生成的 token 總數,體現服務的輸出量。
avg_prompt_throughput_toks_per_s 平均 Prefill 吞吐量,衡量輸入階段的處理速度。
avg_generation_throughput_toks_per_s 平均 token 吞吐量,反映整體的推理生成速度。
request_prompt_tokens 請求輸入的 token 數量,用于分析單個請求的輸入規模。
request_generation_tokens 請求輸出的 token 數量,幫助了解單個請求的輸出規模。
性能和資源指標
failed_request_perc 推理失敗的請求率,直觀反映服務的可靠性。
npu_cache_usage_perc KV Cache 的 NPU 顯存利用率,監控 NPU 資源使用情況。
cpu_cache_usage_perc KV Cache 的 CPU 利用率,掌握 CPU 資源使用狀況。
npu_prefix_cache_hit_rate NPU 卡上 prefix cache 的命中率,評估緩存的使用效率。
時延指標
time_to_first_token_seconds 首 token 時延,衡量請求推理生成首個 token 的速度,對實時性要求較高的場景至關重要。
time_per_output_token_seconds token 生成時延,反映連續生成 token 之間的時間間隔,影響服務的響應流暢度。
e2e_request_latency_seconds 端到端時延,代表請求從接收到執行完成的總耗時,綜合體現服務的整體性能。

1.2Prometheus 是什么

Prometheus 是一個開源的系統監控和報警工具包,最初由 SoundCloud 開發,現在是 Cloud Native Computing Foundation(CNCF)的一部分。Prometheus 以其強大的數據收集和查詢能力、易于擴展和高可用性在行業內得到了廣泛應用。以下是 Prometheus 的核心概念:

時間序列數據庫:Prometheus 主要用于存儲時間序列數據,即帶有時間戳的指標數據。每個時間序列由一個指標名和一組標簽(key-value 對)標識。

多維數據模型:Prometheus 的數據模型基于指標名稱和標簽,可以靈活地對監控數據進行分類和過濾,從而實現復雜的查詢和分析。

PromQL:Prometheus 查詢語言(PromQL)用于實時查詢和分析存儲在 Prometheus 中的數據。它支持豐富的運算符和函數,能夠滿足多種監控和報警需求.

1.3 Grafana 是什么

Grafana 是一個開源的可視化和監控平臺,廣泛應用于數據分析、監控和報警。它支持多種數據源,提供豐富的可視化工具,使用戶能夠創建交互式的儀表盤。以下是 Grafana 的核心功能:

數據可視化:Grafana 提供了多種圖表類型,包括折線圖、柱狀圖、餅圖、熱圖等,用戶可以通過拖拽的方式輕松創建和自定義儀表盤。

支持多種數據源:Grafana 支持從多種數據源獲取數據,包括 Prometheus、InfluxDB、Graphite、Elasticsearch、MySQL、PostgreSQL 等。

靈活的查詢和過濾:通過集成的數據源查詢語言,Grafana 允許用戶靈活地對數據進行過濾、聚合和轉換。每種數據源都有專門的查詢編輯器,幫助用戶編寫查詢語句。

報警和通知:Grafana 提供強大的報警功能,允許用戶基于查詢結果設置報警規則。當條件滿足時,可以通過郵件、Slack、PagerDuty 等多種渠道發送通知。

用戶管理和權限控制:Grafana 提供詳細的用戶管理和權限控制功能,支持用戶、團隊和組織的管理。用戶可以根據需要設置不同的訪問權限,保護敏感數據。

2 實踐記錄

2.1 Prometheus 安裝

Prometheus 安裝方法參考:

https://prometheus.cloudnative.io/di-san-zhang-prometheus/di-2-jie-an-zhuang/installation

為方便起見,本次實踐筆者采用預編譯二進制文件安裝方法,在 Windows PC 上安裝。

安裝地址:https://prometheus.io/download/

7eb4e734-1c0c-11f0-9310-92fbcf53809c.png

2.2 Grafana 安裝

Grafana 同樣支持在不同操作系統安裝,詳見教程https://grafana.com/docs/grafana/latest/setup-grafana/installation/

本次實踐選擇在 Windows 安裝,安裝地址https://grafana.com/grafana/download?platform=windows

7ed5c5bc-1c0c-11f0-9310-92fbcf53809c.png

2.3 MindIEService 服務部署啟動

需在服務器啟動 MindIE-Service 服務,服務啟動教程不做贅述。

由于 MindIE 服務和 Prometheus+Grafana 在不同主機啟動,因此注意配置 config.json 文件。修改 ipAddress 和 managementIpAddress 為服務器 IP,保證 Prometheus+Grafana 服務可訪問該 IP 地址。同時需要注意端口設置。

7eef39fc-1c0c-11f0-9310-92fbcf53809c.png

另外,需要確保啟動服務前開啟服務化監控開關,開啟服務化監控功能的命令如下:

export MIES_SERVICE_MONITOR_MODE=1

參考:https://www.hiascend.com/document/detail/zh/mindie/10RC3/mindieservice/servicedev/mindie_service0251.html

7f01b370-1c0c-11f0-9310-92fbcf53809c.png

嘗試使用 curl 命令驗證 metricsPort 輸出正常:curl http://{ip}:{port}/metrics

發現能返回普羅格式 metric 輸出

7f11e9ac-1c0c-11f0-9310-92fbcf53809c.png

2.4 啟動 Prometheus 和 Grafana

Step1修改 prometheus 安裝目錄下的 promethues.yml 文件,添加 MindIE 服務的 IP 和 metricsport

7f269960-1c0c-11f0-9310-92fbcf53809c.png

點擊 Prometheus 安裝目錄下的 promethrus.exe 和 Grafana 安裝目錄下的 bin/grafana-server.exe 啟動 Prometheus 和 Grafana

Step2打開 Grafana http://localhost:3000 ,預設賬號密碼是 admin@admin,第一次登錄會需要修改密碼。

7f3b06c0-1c0c-11f0-9310-92fbcf53809c.png

Step3點擊 Connection > Data sources > Add new data source,選擇 prometheus,之后把 prometheus 的 URL http://localhost:9090 / 填上去,點擊最下面 Save & test。

7f54b49e-1c0c-11f0-9310-92fbcf53809c.png

Step4之后可以在 Grafana 頁面建立 dashboard,在 Home-Dashboards-New dashboard 建立 dashboard, Dashboard 手動構建較麻煩,可以參考一些 Grafana 教程 https://imageslr.com/2024/grafana.html

7f67d2ae-1c0c-11f0-9310-92fbcf53809c.png

好在可以通過 json 格式輸入或 json 文件 import 快速構建 dashboard

這里選擇參考下面 vllm 的 grafana json 文件,將其中的 vllm: 字段去掉(因為 MindIE 的 metrics 字段和 vllm 的 metric 有區別)

http://www.gitpp.com/digiman/vllm/-/blob/main/examples/production_monitoring/grafana.json?ref_type=heads

7f82219a-1c0c-11f0-9310-92fbcf53809c.png

最終得到 MindIE 指標監控看板界面

7f99eac8-1c0c-11f0-9310-92fbcf53809c.png

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 接口
    +關注

    關注

    33

    文章

    8932

    瀏覽量

    153183
  • 開源
    +關注

    關注

    3

    文章

    3582

    瀏覽量

    43457
  • 可視化
    +關注

    關注

    1

    文章

    1243

    瀏覽量

    21623
  • 服務端
    +關注

    關注

    0

    文章

    68

    瀏覽量

    7188

原文標題:MindIE服務化部署實現監控功能

文章出處:【微信號:OSC開源社區,微信公眾號:OSC開源社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    軌道交通路面3G手機移動可視化巡檢系統方案

    和動態圖像的采集和傳送功能;實現視頻發送、接收數據通信功能,3G移動可視化巡檢即移動影音采集設備,具備雙向對講功能,夜間拍攝
    發表于 01-28 10:05

    阿里云容器Kubernetes監控(二) - 使用Grafana展現Pod監控數據

    摘要: 簡介 在kubernetes的監控方案中,Heapster+Influxdb+Grafana的組合相比prometheus等開源方案而言更為簡單直接。而且Heapster在
    發表于 05-10 15:28

    可視化MES系統軟件

    和客戶都會造成損失,為了更好的滿足客戶需求、實現企業信息,目前企業制造過程中主要還存在以下需求:(1)數據可視化方面。MES系統軟件之所以能有效的監控整個車間的生產過程,主要是通過對
    發表于 11-30 19:55

    三維可視化的應用和優勢

    ?! 祿y計分析可視化:目前應用較為廣泛,此功能普遍應用于商業智能、***決策、公眾服務、市場營銷等等領域。借助可視化的管理系統,可以更加清晰的進行信息傳達與溝通?! ∪S
    發表于 12-02 11:52

    prometheus監控服務的整個流程介紹

    ,Prometheus,Graphite,InfluxDB等各種數據源中獲取數據,并通過精美的圖形將其可視化Prometheus UI主界面大致如下:所有注冊的Exporter都可以在UI查看,告警也可以在
    發表于 12-23 17:34

    簡述linux-arm64 UOS安裝開源Grafana的步驟

    (linux-arm64)UOS安裝開源Grafana-7.2.0,和CentOS安裝步驟一樣Grafana是一款用Go語言開發的開源數據可視化工具,可以做數據監控和數據統計,帶有告警
    發表于 06-16 15:00

    使用Thanos+Prometheus+Grafana構建監控系統

    對于彈性伸縮和高可用的系統來說,一般有大量的指標數據需要收集和存儲,如何為這樣的系統打造一個監控方案呢?本文介紹了如何使用 Thanos+Prometheus+Grafana 構建監控系統。
    的頭像 發表于 05-05 21:14 ?2943次閱讀

    通過Grafana實現OVL數據可視化的兩種方法

    本文以MySQL數據庫為例介紹如何通過Grafana實現OVL數據的可視化,其中有兩種方法,一種是通過OVL的REST API來實現數據可視化
    的頭像 發表于 05-27 17:52 ?1670次閱讀

    互動倉庫物流監控管理可視化服務

    智能倉庫的優勢在于3D智能可視化服務,使倉庫物流監控和管理能夠實時顯示并自動識別,智能決策可以與各個環節的物流信息系統集成。廣州華銳互動利用3D可視化和3D建模技術,為智能倉庫創建3D
    發表于 06-24 17:40 ?843次閱讀

    Grafana 9泰酷了吧

    Grafana 9.0 的主要重點是改善 Grafana 的用戶體驗,使可觀察性和數據可視化更易用也更容易獲得。無論是通過 Prometheus 和 Loki
    的頭像 發表于 05-30 11:30 ?706次閱讀
    <b class='flag-5'>Grafana</b> 9泰酷了吧

    如何使用Grafana輕松實現OVL數據可視化

    前言本文以MySQL數據庫為例介紹如何通過Grafana實現OVL數據的可視化,其中有兩種方法,一種是通過OVL的RESTAPI來實現數據可視化
    的頭像 發表于 06-01 18:23 ?1061次閱讀
    如何使用<b class='flag-5'>Grafana</b>輕松<b class='flag-5'>實現</b>OVL數據<b class='flag-5'>可視化</b>

    虹科干貨 | 虹科教您使用Grafana輕松實現OVL數據可視化

    虹科IIoT虹科教您使用Grafana輕松實現OVL數據可視化前言本文以MySQL數據庫為例介紹如何通過Grafana實現OVL數據的
    的頭像 發表于 05-27 10:34 ?1002次閱讀
    虹科干貨 | 虹科教您使用<b class='flag-5'>Grafana</b>輕松<b class='flag-5'>實現</b>OVL數據<b class='flag-5'>可視化</b>

    物聯網可視化監控大屏如何實現?有什么功能

    在物聯網飛速發展的時代,可視化監控大屏成為了眾多企業和機構實現智能管理和監控的重要工具。它將各種各樣設備的運行狀態和數據以圖形、圖表、動畫
    的頭像 發表于 04-11 09:25 ?1265次閱讀

    如何實現園區大屏可視化?

    如何實現園區大屏可視化? 1.建立孿生模型:首先需要建立園區的孿生模型,即一個數字的虛擬模型,反映了園區的實際情況、結構、設備、人員等信息。這個模型可以通過傳感器、監控設備、GIS
    的頭像 發表于 06-19 15:39 ?701次閱讀
    如何<b class='flag-5'>實現</b>園區大屏<b class='flag-5'>可視化</b>?

    服務器 Flexus X 實例,Docker 集成搭建 Grafana 開源數據可視化平臺

    Grafana 是一個開源數據可視化平臺,廣泛用于監控和分析系統性能、應用程序指標和其他數據。它支持多種數據源,如 Prometheus、Graphite、InfluxDB 和 MyS
    的頭像 發表于 01-13 15:50 ?372次閱讀
    云<b class='flag-5'>服務</b>器 Flexus X 實例,Docker 集成搭建 <b class='flag-5'>Grafana</b> 開源數據<b class='flag-5'>可視化</b>平臺