女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

穩(wěn)定性 上線三板斧(可灰度、可驗證、可回滾)

京東云 ? 來源:京東物流 馮志文 ? 作者:京東物流 馮志文 ? 2024-12-02 09:31 ? 次閱讀

作者:京東物流 馮志文

背景

從研發(fā)的流程階段來看,在確定產(chǎn)品需求后,我們會經(jīng)歷架構(gòu)設(shè)計、編碼、測試、聯(lián)調(diào)驗證和上線這幾個階段來交付系統(tǒng)。在這個過程中,我們需要特別關(guān)注上線環(huán)節(jié),因為它是事故高發(fā)的階段

為了應(yīng)對這種情況,我們實施了嚴(yán)格的發(fā)布標(biāo)準(zhǔn)操作程序,簡稱為“發(fā)布三板斧”。這包括可灰度發(fā)布、可驗證發(fā)布和可回滾發(fā)布。通過這三個步驟,我們可以確保在發(fā)布過程中盡量減少風(fēng)險,提高系統(tǒng)的穩(wěn)定性和可靠性。

一、灰度要有耐心

1、灰度意義

1.灰度發(fā)布是為了驗證我們的假設(shè),即“還存在我們不知道的問題”。因此,在進行灰度發(fā)布時需要更加謹慎,確保即使問題在生產(chǎn)環(huán)境中出現(xiàn),也能控制其對業(yè)務(wù)和用戶的影響通過灰度盡可能的減少問題的影響面如果通過灰度過程發(fā)現(xiàn)一個線上問題,那么去掉灰度的保護,可能就會產(chǎn)生一個嚴(yán)重的故障。 我們可以逐步驗證系統(tǒng)的穩(wěn)定性和可靠性,減少風(fēng)險并提高產(chǎn)品質(zhì)量。

2.我們需要明確一點:灰度從來不是為了測試。它的主要目的是對抗“未知的不確定性” 。在軟件開發(fā)過程中,我們無法預(yù)測所有可能的問題和錯誤,因此需要通過灰度發(fā)布來驗證系統(tǒng)的穩(wěn)定性和可靠性。

3.在分布式系統(tǒng)中常見通用的灰度過程有 beta 發(fā)布、藍綠發(fā)布,進行流量級別的灰度過程,能夠滿足絕大部分變更灰度驗證需求。如果變更復(fù)雜度較高或者業(yè)務(wù)比較重要,在方案設(shè)計中也需要進行更精細變更影響面控制,例如按照影響用戶維度逐步生效的設(shè)計,但要注意一次業(yè)務(wù)完整流程中開關(guān)一致性問題

4.灰度發(fā)布是一種有效的風(fēng)險管理方法,可以幫助我們在軟件開發(fā)過程中識別和解決潛在的問題,提高產(chǎn)品質(zhì)量和用戶體驗。

2、灰度發(fā)布

為解決用戶手動部署操作耗時高、對人依賴度高、人工容易遺漏等導(dǎo)致線上問題痛點,強烈推薦您使用 【部署編排】 功能,用戶可靈活制定部署策略,實現(xiàn)從編譯構(gòu)建到實例部署的自動化運行,提高部署效率!但部署編排第一次使用的時候需要驗證好。

3、灰度有效性

在灰度的落地與推進過程中,有效性非常重要。因為灰度是一個很耗時的復(fù)雜的過程。如果不注意的話,很容易出現(xiàn)“形式化”的情況,即只是表面上的灰度,而實際上并沒有達到預(yù)期的效果

為了確保灰度的有效性,需要注意以下幾個方面:

1.制定詳細的灰度計劃:在進行灰度之前,應(yīng)該制定詳細的計劃,包括灰度的范圍、時間、節(jié)點等信息,以確保灰度過程的可控性和可預(yù)測性。

2.逐步推進灰度:在進行灰度時,應(yīng)該逐步推進,而不是一下子全面鋪開。比如,可以先在一個機房的一個分組中部分節(jié)點進行灰度,然后再擴大到全部節(jié)點和集群,最后再擴展到另外一個機房的相同步驟。

3.監(jiān)控和反饋:在進行灰度時,應(yīng)該及時監(jiān)控和反饋,以發(fā)現(xiàn)和解決可能出現(xiàn)的問題和風(fēng)險。關(guān)鍵點在于時間和流量

時間: 每個灰度階段至少有 5 ~ 10 分鐘的觀察時間,這個時間可以根據(jù)業(yè)務(wù)系統(tǒng)的具體情況進行調(diào)整。在觀察期間,需要密切關(guān)注監(jiān)控、日志和各方反饋等信息,以發(fā)現(xiàn)和解決可能出現(xiàn)的問題和風(fēng)險。只有當(dāng)這些信息沒有異常時,才能擴大灰度范圍,進一步推廣灰度計劃。在灰度過程中,需要保持高度警惕和敏銳的洞察力,及時發(fā)現(xiàn)和解決問題,以保證系統(tǒng)的穩(wěn)定和可靠性。

流量: 在進行灰度時,流量是一個非常重要的因素,需要特別注意。特別是對于一些業(yè)務(wù)場景,可能需要特定的觸發(fā)條件才能進行灰度測試,比如只有滿足某些條件的用戶或訂單才能參與測試。 在這種情況下,僅僅通過單位時間內(nèi)是否存在異常來判斷灰度是否成功是不足夠的。還需要確保有足夠的有效流量來觸發(fā)這些特定的業(yè)務(wù)場景。否則,即使系統(tǒng)在灰度測試中沒有出現(xiàn)異常,也不能完全保證系統(tǒng)在實際使用中的穩(wěn)定性和可靠性。 因此,在進行灰度測試時,需要確保有足夠的有效流量來觸發(fā)這些特定的業(yè)務(wù)場景。同時,還需要注意監(jiān)控和日志等信息,及時發(fā)現(xiàn)和解決可能出現(xiàn)的問題和風(fēng)險。通過這種方式,可以更好地保證系統(tǒng)的穩(wěn)定和可靠性,提高灰度測試的效果和價值。

有效的灰度可以把問題影響鎖定在一個小范圍內(nèi),但是同樣也降低了問題的“明顯性”,所以你要通過監(jiān)控和日志更加仔細、謹慎地去尋找、觀測異常并對比發(fā)現(xiàn)問題。灰度是一個復(fù)雜的過程,需要仔細考慮和規(guī)劃。通過制定詳細的計劃、逐步推進和及時監(jiān)控和反饋等措施,可以確保灰度的有效性和可持續(xù)性。

4、灰度驗證

如果灰度發(fā)布的時候都是帶有開關(guān)功能,則全部發(fā)布上線后,需要通過DUCC開關(guān)來進行灰度驗證。

4.1、新功能業(yè)務(wù)灰度:

適用場景:新的鏈路功能,比如提供新的API,跟歷史代碼邏輯無關(guān)

操作步驟:代碼無開關(guān),代碼上線確保不影響老邏輯即可。通過業(yè)務(wù)線上灰度驗證相關(guān)邏輯準(zhǔn)確性

4.2、核心鏈路灰度驗證

適用場景: 如果是在原有鏈路添加新功能,則系統(tǒng)上線后,業(yè)務(wù)需要在生產(chǎn)環(huán)境中進行灰度驗證。這樣可以在生產(chǎn)環(huán)境中不影響其他用戶體驗的情況下去測試新功能,只影響灰度的數(shù)據(jù),縮小影響范圍。

操作步驟: DUCC功能開關(guān)可以配置相關(guān)的驗證參數(shù)組合(比如下單前根據(jù)用戶pin、百分百、門店ID、下單后訂單號、倉庫ID等)。DUCC配置如下:

jitSwitch.storeId=1-1,1-2,1-3,1-4,****

4.3、切量灰度

適用場景:比如重構(gòu)、技術(shù)改造、黃金鏈路上線的重要功能

操作步驟:根據(jù)訂單號或者pin百分比逐步切量進行線上驗證。如下圖DUCC配置 :

commonSwith.percent=10

切量比例需要注意hashCode() 返回值為負數(shù),潛在的放大了期望的切量比例

5、灰度注意事項

1.灰度驗證要細心 其實跟上線一樣,主要都是依賴日志&監(jiān)控&報警規(guī)則的建設(shè)和配置。只不過灰度的比例小,通過ump監(jiān)控等報警沒有那么敏感,核心還是需要關(guān)注灰度對應(yīng)logbook日志,業(yè)務(wù)上下游鏈路可視化相關(guān)驗證。

2.灰度回滾:灰度過程務(wù)必具備整體暫停回滾能力 灰度過程中發(fā)生問題,立即暫停灰度,并且把之前灰度機器操作回滾,如機器少可JSF下線或者停止機器。如灰度比例高,則不可停服務(wù),需要快速回滾(通過ducc開關(guān)代碼隔離、或者代碼回滾)

3.灰度回滾過程中歷史數(shù)據(jù)需要糾正處理

二、驗證需要兼容

1、可監(jiān)控

完善的監(jiān)控告警比人工反饋響應(yīng)更快,也會減少故障的持續(xù)時間進而降低影響。在推進監(jiān)控落地的過程中,你要和團隊成員講明監(jiān)控的重要性,還要確保監(jiān)控的完善與有效。對監(jiān)控的覆蓋程度與范圍要求越來越細致。一般情況下,我們監(jiān)控的都是 API 這一層面,但是單純的技術(shù)指標(biāo)并不能完整發(fā)現(xiàn),往往要結(jié)合業(yè)務(wù)場景去設(shè)計,才能夠更加精細化地感知異常。

核心接口UMP(TP99、可用率、流量)或者MQ 等,這個沒什么好講的

2、日志

根據(jù)日志驗證對應(yīng)場景(新功能場景及之前線上核心流程場景) 。比如promise場景復(fù)雜,上線會驗證不同訂單類型的下傳時間等相關(guān)的重要場景訂單,如下圖:

3、向后兼容性

功能A上線,驗證A功能沒問題后,需要看下其他功能是否有問題(比如系統(tǒng)的核心環(huán)節(jié)功能)。

三、回滾就是變更的“后悔藥”

1、制定回滾計劃

故障恢復(fù)最好的手段是各種預(yù)案,而回滾則是預(yù)案中最普遍、也最有效的。

回滾的必要性 應(yīng)用上線應(yīng)該制定詳盡的回滾計劃,能夠在最短時間內(nèi)將應(yīng)用恢復(fù)至上一穩(wěn)定運行版本;然而系統(tǒng)并不是天然可以無縫回滾的,想要系統(tǒng)具備回滾的能力,在設(shè)計與實現(xiàn)階段需要付出額外的精力。可回滾的本質(zhì)是系統(tǒng)的兼容性設(shè)計與實現(xiàn),比如常見的“只增不改”,一個 API 內(nèi)要調(diào)整很多實現(xiàn)邏輯才能滿足新業(yè)務(wù)的需求,此時不妨直接新增一個 API ,兩個 API 保持參數(shù)一致,那么一旦新 API 有異常直接通過開關(guān)技術(shù)切換回舊的 API 即可。一般情況下應(yīng)用本身可回滾,而數(shù)據(jù)層面的可回滾性是重要的考量因素之一。遵循安全的增量變更原則所設(shè)計的數(shù)據(jù)變更方案具備可回滾能力,發(fā)布過程中所產(chǎn)生的增量數(shù)據(jù)列存儲值要求可廢棄。原則上任何應(yīng)用服務(wù)在發(fā)布之前都必須具備可回滾的能力,沒有回滾能力的系統(tǒng)不允許發(fā)布上線。

回滾操作對業(yè)務(wù)的影響: 由于應(yīng)用升級的回滾實施,必然會影響本次升級業(yè)務(wù)所服務(wù)的業(yè)務(wù)需求,同時會直接影響對本次升級有依賴的其他業(yè)務(wù)系統(tǒng);回滾方案中必須明確本次發(fā)布窗口所有相關(guān)性需求項目,明確一旦發(fā)生回滾處理受影響范圍,提前告知相關(guān)項目組及業(yè)務(wù)方,同時盡可能降低多個業(yè)務(wù)關(guān)聯(lián)性較強項目同一發(fā)布窗口的回滾風(fēng)險。

涉及重要性較高的服務(wù)應(yīng)用升級方案要求必須提供回滾方案,且此回滾方案事先在線下環(huán)境得到完整模擬演練并確認可行;回滾完成后要求不得中斷服務(wù),業(yè)務(wù)運行正常

2、回滾原子性

回滾的復(fù)雜性 除應(yīng)用本身及數(shù)據(jù)層面的可回滾性考慮外,若服務(wù)使用客戶端已完成同步升級,則必須考量客戶端的可回滾性;極端情況下,若客戶端的本次同步升級也造成了其作為服務(wù)提供方的使用客戶端同步升級,則存在多個應(yīng)用系統(tǒng)復(fù)雜的連帶可回滾需求;相關(guān)系統(tǒng)也需要評估其應(yīng)用本身及其數(shù)據(jù)層面的可回滾能力,作為本次應(yīng)用升級回滾方案的一并考慮項。在升級方案設(shè)計中,應(yīng)該提前預(yù)知復(fù)雜回滾方案的實施成本,防止發(fā)生上述的同步升級的多重強依賴關(guān)系回滾方案包括但不僅限于:應(yīng)用回滾、數(shù)據(jù)回滾及清理、代碼回滾、運維策略回滾、監(jiān)控方案回滾等。

切記:代碼需要及時回滾,以防在未修復(fù)問題前,下次團隊其他同事上線把未回滾代碼部署到線上導(dǎo)致二次問題發(fā)生。

3、代碼回滾之開關(guān)技術(shù)

在大部分場景下,開關(guān)技術(shù)才是線上代碼問題快速止血,快速回滾的最佳方式(需根據(jù)業(yè)務(wù)系統(tǒng)特性而定)。比如作為下單黃金鏈路,如遇線上問題的話,采用通用的回滾方式需要5-10+分鐘(500+臺機器)并且回滾如果操作不當(dāng)會加重問題,而采用開關(guān)技術(shù)則是秒級

四、結(jié)論:

復(fù)雜需求或者高風(fēng)險需求的前提下,在架構(gòu)設(shè)計階段,應(yīng)該將灰度計劃、驗證兼容和回滾策略等考慮在內(nèi),并做好評估與平衡。具體來說,需要考慮以下兩個方面:

1.風(fēng)險程度: 在評估系統(tǒng)穩(wěn)定性和可靠性時,需要對可能出現(xiàn)的問題和風(fēng)險進行充分的評估,并根據(jù)風(fēng)險程度制定相應(yīng)的灰度計劃、驗證兼容和回滾策略。

2.成本投入: 在進行灰度計劃、驗證兼容和回滾策略時,需要考慮相應(yīng)的成本投入,包括人力、物力、時間等方面,以確保實施計劃的可行性和經(jīng)濟性。

綜上所述,灰度計劃、驗證兼容和回滾策略等應(yīng)該在架構(gòu)設(shè)計階段就進行充分的考慮和評估,以便在實施過程中能夠做到有條不紊、穩(wěn)妥可靠。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 灰度
    +關(guān)注

    關(guān)注

    0

    文章

    10

    瀏覽量

    9843
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4886

    瀏覽量

    70216
  • 驗證
    +關(guān)注

    關(guān)注

    0

    文章

    62

    瀏覽量

    15442
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    逆變器EMC整改:如何驗證整改效果與長期穩(wěn)定性

    南柯電子|逆變器EMC整改:如何驗證整改效果與長期穩(wěn)定性
    的頭像 發(fā)表于 05-27 11:14 ?77次閱讀
    逆變器EMC整改:如何<b class='flag-5'>驗證</b>整改效果與長期<b class='flag-5'>穩(wěn)定性</b>

    物聯(lián)網(wǎng) + 設(shè)備管理,讓管理觸手

    物聯(lián)網(wǎng)技術(shù)快速發(fā)展,設(shè)備管理面臨大挑戰(zhàn):分散、數(shù)據(jù)孤島、安全隱患。中設(shè)智控采用分層架構(gòu)和智能維護模式,提高設(shè)備管理效率和安全性。物聯(lián)網(wǎng)設(shè)備管理“三板斧”包括分布式管理、智能維護和數(shù)據(jù)驅(qū)動預(yù)測性維護。
    的頭像 發(fā)表于 02-28 10:08 ?570次閱讀
    物聯(lián)網(wǎng) + 設(shè)備管理,讓管理觸手<b class='flag-5'>可</b>及

    HarmonyOS官網(wǎng)上線穩(wěn)定性”專欄 助力更穩(wěn)定流暢的鴻蒙原生應(yīng)用開發(fā)

    鴻蒙開發(fā)者官網(wǎng)的最佳實踐中上線穩(wěn)定性專欄,將DevEco Studio問題定位工具與穩(wěn)定性實際場景相結(jié)合,幫助開發(fā)者用好工具的同時,降低穩(wěn)定性問題定位的難度。 下面以CppCrash
    發(fā)表于 02-17 17:17

    A/D變換器采樣速率和穩(wěn)定性的關(guān)系,是什么影響了轉(zhuǎn)換器的穩(wěn)定性?

    我在測量A/D轉(zhuǎn)換器時出現(xiàn)這樣一個問題。采樣率的提高,其A/D轉(zhuǎn)換器的穩(wěn)定性隨之降低。從我個人理解,采樣率的提高已經(jīng)在測量有效位數(shù)上將誤差算出來了,我只需要考慮在高采樣率時,有效分辨率的位數(shù)
    發(fā)表于 02-11 08:24

    旋轉(zhuǎn)測徑儀的底座如何保證穩(wěn)定性

    關(guān)鍵字:旋轉(zhuǎn)測徑儀,底座材質(zhì),測徑儀底座結(jié)構(gòu),旋轉(zhuǎn)測徑儀穩(wěn)定性, 旋轉(zhuǎn)測徑儀的底座保證穩(wěn)定性是確保測量精度和儀器長期穩(wěn)定運行的關(guān)鍵。以下是一些常見的保證旋轉(zhuǎn)測徑儀底座穩(wěn)定性的方法: 一
    發(fā)表于 01-09 14:04

    電阻器的熱穩(wěn)定性分析

    電阻器的熱穩(wěn)定性是指電阻器在溫度變化時,其電阻值保持恒定或變化極小的特性。以下是對電阻器熱穩(wěn)定性的分析: 一、電阻器熱穩(wěn)定性的重要性 電阻器是電子電路中的基本元件,其性能穩(wěn)定性直接影響
    的頭像 發(fā)表于 12-04 14:18 ?753次閱讀

    如何測試晶振的穩(wěn)定性

    以下是一些常用的方法來測試晶振的穩(wěn)定性
    的頭像 發(fā)表于 11-29 16:41 ?822次閱讀

    質(zhì)量視角下的系統(tǒng)穩(wěn)定性保障--穩(wěn)定性保障常態(tài)化自動化實踐

    常態(tài)化穩(wěn)定性治理。在常態(tài)化治理過程中我們將識別問題等重復(fù)性有規(guī)律的工作實現(xiàn)自動化,技術(shù)人員更專注于解決問題。 二、穩(wěn)定性治理常態(tài)化 保障穩(wěn)定性治理常態(tài)化,部門組建了一支由研發(fā)團隊、測試團隊、架構(gòu)師組成的
    的頭像 發(fā)表于 11-19 11:19 ?955次閱讀
    質(zhì)量視角下的系統(tǒng)<b class='flag-5'>穩(wěn)定性</b>保障--<b class='flag-5'>穩(wěn)定性</b>保障常態(tài)化自動化實踐

    簡化穩(wěn)定性檢查

    電子發(fā)燒友網(wǎng)站提供《簡化穩(wěn)定性檢查.pdf》資料免費下載
    發(fā)表于 10-11 11:23 ?0次下載
    簡化<b class='flag-5'>穩(wěn)定性</b>檢查

    鳳凰動力舵輪驅(qū)動輪的穩(wěn)定性如何影響AGV的運行效率和穩(wěn)定性

    舵輪的穩(wěn)定性對AGV(自動導(dǎo)引車)的運行效率和整體穩(wěn)定性具有顯著的影響。以下是關(guān)于舵輪穩(wěn)定性與AGV運行效率和穩(wěn)定性之間關(guān)系的詳細分析: 首先,舵輪的
    的頭像 發(fā)表于 08-27 13:20 ?595次閱讀
    鳳凰動力舵輪驅(qū)動輪的<b class='flag-5'>穩(wěn)定性</b>如何影響AGV的運行效率和<b class='flag-5'>穩(wěn)定性</b>

    VCO的頻率穩(wěn)定性是什么

    VCO(Voltage-Controlled Oscillator,壓控振蕩器)的頻率穩(wěn)定性是一個關(guān)鍵的性能指標(biāo),它描述了VCO輸出頻率對輸入電壓變化的敏感程度及在長時間或不同環(huán)境條件下保持頻率穩(wěn)定
    的頭像 發(fā)表于 08-20 16:08 ?1657次閱讀

    貼片電容的穩(wěn)定性與什么有關(guān)系?

    貼片電容的穩(wěn)定性與其多個方面的因素密切相關(guān),主要包括以下幾個方面: 一、材料因素 材料質(zhì)量:貼片電容的材料對其強度和韌性有著至關(guān)重要的影響。優(yōu)質(zhì)的材料能夠提供更好的機械性能和穩(wěn)定性,減少斷裂的風(fēng)險
    的頭像 發(fā)表于 07-16 14:33 ?787次閱讀

    環(huán)路增益的穩(wěn)定性

    由基本反饋電路的電路組成結(jié)構(gòu),得出閉環(huán)傳遞函數(shù)為,電路的開環(huán)增益是各個晶體管參數(shù)和電容參數(shù)的函數(shù),所以也是頻率的函數(shù),于是閉環(huán)增益就可以寫作,反饋電路的穩(wěn)定性和1環(huán)路增益A(w)有關(guān),當(dāng)環(huán)路增益的幅
    發(fā)表于 06-18 15:00

    智能測徑儀:高穩(wěn)定性成就高精測量之選!

    測量穩(wěn)定性。 具備高頻測量系統(tǒng),500Hz/2000Hz的高頻檢測系統(tǒng),應(yīng)對各種高速產(chǎn)線。 更有防護外殼,測徑儀的防護等級高,可應(yīng)用于各種產(chǎn)線中。 測徑儀的高穩(wěn)定性帶給產(chǎn)線很大的助力!經(jīng)過嚴(yán)格測試
    發(fā)表于 06-05 17:30

    影響放大器穩(wěn)定性的因素

    在電子電路設(shè)計中,放大器作為信號放大的關(guān)鍵元件,其穩(wěn)定性對于整個電路的性能至關(guān)重要。穩(wěn)定性良好的放大器能夠確保信號的準(zhǔn)確傳輸和放大,避免產(chǎn)生自激振蕩、頻率失真等不良影響。因此,深入了解放大器穩(wěn)定性
    的頭像 發(fā)表于 05-28 14:43 ?2497次閱讀