女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Linux內核:soft lockup是由于什么原因導致的呢?

Linux閱碼場 ? 來源:Linuxer ? 2020-09-02 17:26 ? 次閱讀

提到soft lockup,大家都不會陌生:

BUG:softlockup-CPU#3stuckfor23s![kworker/332]

這個幾乎和panic,oops并列,也是非常難以排查甚至比panic更麻煩。至少panic之后你可以去分析一個靜態的尸體,然而soft lockup,那是一個動態的過程,甚至轉瞬即逝,自帶自愈功能。

那么soft lockup是由于什么原因導致的呢?

幾乎沒有這方面的文章,能找到的也只有個別的案例分析,所以我想趁著周末降至來寫一篇關于soft lockup的通用解釋。

首先澄清兩個關于soft lockup的誤區:

soft lockup并不僅僅是由死循環引起的。

soft lockup并不是說在一段代碼里執行了23秒,22秒。

這里簡單解釋一下上面的兩點。

事實上,死循環并不一定會導致soft lockup,比如Linux內核生命周期內的0號進程就是一個死循環,此外很多的內核線程都是死循環。

此外,更難指望一段代碼可以執行20多秒,要對現代計算機的速度有所概念。

soft lockup發生的真實場景是:

soft lockup是針對單獨CPU而不是整個系統的。

soft lockup指的是發生的CPU上在20秒(默認)中沒有發生調度切換。

第一點無須解釋,下面重點看第二點。

很顯然,只要讓一個CPU在20秒左右的時間內都不發生進程切換,就會觸發soft lockup,這個“20秒內不切換”就是soft lockup發生的根因!

好了,現在我們來看20秒不切換的場景。

死循環的情況
這是最簡單的場景,但細節往往不像看起來那么簡單。比如你寫了一個死循環在內核中執行,它一定會導致soft lockup嗎?

我們來看一個內核死循環:

#include #include static int loop_func(void *arg){ int i = 0; while(!kthread_should_stop()) { i++; } return 0;} struct task_struct *kt;static int __init init_loop(void){ kt = kthread_run(loop_func, NULL, "loop_thread"); if (IS_ERR(kt)) { return -1; } return 0;} static void __exit exit_test(void){ kthread_stop(kt);} module_init(init_loop);module_exit(exit_loop);MODULE_LICENSE("GPL");

加載這個模塊,會soft lockup嗎?

我們知道,雖然loop thread是一個死循環,但是它看起來正如一個普通用戶態進程一樣,在執行i++循環的時候,其實是可以被其它task搶占掉的,這是最基本的進程調度的常識。

但是如果你真的去加載這個模塊,你會發現在有些機器上,它確實會soft lockup,但有的機器上不會,這又是為什么?

這里的關鍵在于內核搶占。你看下自己系統內核的配置文件,如果下面的配置打開,意味著上述模塊的死循環不會造成soft lockup:

CONFIG_PREEMPT=y

如果這個配置沒有開,那么便刑不上內核了,因為它在內核態執行,所以沒有誰可以搶占它,進而發生soft lockup。

我們對上述的死循環代碼是否會觸發soft lockup已經很明確了,下面我們看另一種情況。

如果死循環不在內核線程上下文,而是在軟中斷上下文,會怎樣?

很顯然,軟中斷不能被進程搶占,所以一定會soft lockup。

當然,如果真的發生了死循環導致的soft lockup,那肯定是在一個循環代碼中執行超過20秒了,不說20秒,如果無人干涉,200000秒都是有的…

現在我們來看另一種復雜的情況,即timer的情況。在討論timer時,我假設系統的內核搶占是開啟的,這樣更容易分類討論,否則,如果關閉了內核搶占,那么事情會變得更加嚴重。

timer的情況

我們先看下面的timer回調函數:

static void timer_func(unsigned long data){ mdelay(1); mod_timer(&timer, jiffies + 200);}

僅僅執行1ms的函數,它會導致超過20秒不調度切換的soft lockup嗎?

初看,應該不會,但是如果我們詳細看了Linux內核timer的執行原理,就會明白:

pending在一個CPU上的所有過期timer是順序遍歷執行的。

一輪timer的順序遍歷執行是持有自旋鎖的。

這意味著在執行一輪過期timer的過程中,watchdog實時線程將無法被調度從而喂狗,這意味著:

同一CPU上的過期timer積累到一定量,其回調函數的延時之和大于20秒,將會soft lockup。

我們需要進一步了解一下Linux timer的工作機制。

可以把timer的執行過程抽象成下面的邏輯:

run_timers(){ while (now > base.early_jiffies) { for_each_timer(timer, base.list) { detach_timer(timer) forward_early_jiffies(base) call_timer_fn(timer) } }}

很簡單的流程,內核把當前過期的timer執行到結束。run_timers可以在軟中斷上下文中執行,也可以在softirqd內核線程上下文中執行,為了營造soft lockup,我們假設它是在時鐘中斷退出時的軟中斷上下文中執行的(記住之前還有個假設,即系統是開啟內核搶占的!),此時,run_timers不能被watchdog搶占。

如果一個timer中耗時1ms,那么一個循環需要20000個timer遍歷執行,才能湊齊20秒的不能被搶占的時間,進而引發soft lockup。我的天,20000個timer,不可思議!

其實根本就不需要20000個timer,200個足矣!

問題就出現在call_timer_fn,它實際上是調用該timer回調函數的封裝!我們知道,timer回調函數中執行了mod_timer的操作,它的邏輯如下:

mod_timer(timer, expires){ list_add_timer(timer, expires, base.list)}

它事實上是把timer又插回了list,如果我們把這個list看作是一條時間線的話,它事實上只是往后移了expires這么遠的距離:

假設所有timer的expire都是固定的常量,如果:

我們的timer的足夠多,多到按照其expires重新requeue時恰好能填補中間的那段空隙。

我們的timer回調函數耗時恰好和timer的expires流逝速率相一致。

那么,兩個甚至多個batch就合并成了一個batch,這意味著一輪timer的執行將不會結束!

我們來試一下:

#include #include #include static int stop = 1; // timer的數量static int size = 1;module_param(size, int, 0644);MODULE_PARM_DESC(size, "size"); // timer的expiresstatic int interval = 200;module_param(interval, int, 0644);MODULE_PARM_DESC(interval, ""); // 回調函數耗時static int dt = 100;module_param(dt, int, 0644);MODULE_PARM_DESC(dt, ""); struct wrapper { struct timer_list timer; spinlock_t lock;}; struct wrapper *wr; static void timer_func(unsigned long data){ int i = data; struct wrapper *w = &wr[i]; spin_lock_bh(&(w->lock)); if (stop == 0) { udelay(dt); // 以忙等模擬耗時 } spin_unlock_bh(&(w->lock)); w->timer.data = i; if (stop == 0) { mod_timer(&(w->timer), jiffies + interval); }} static int __init maint_init(void){ int i; wr = (struct wrapper *)kzalloc(size*sizeof(struct wrapper), GFP_KERNEL); for (i = 0; i < size; i++) { struct wrapper *w = &wr[i]; spin_lock_init(&(w->lock)); init_timer(&(w->timer)); w->timer.expires = jiffies + 20; w->timer.function = timer_func; w->timer.data = i; add_timer(&(w->timer)); } stop = 0; return 0;} static void __exit maint_exit(void){ int i; stop = 1; udelay(100); for (i = 0; i < size; i++) { struct wrapper *w = &wr[i]; del_timer_sync(&(w->timer)); } kfree(wr); } module_init(maint_init);module_exit(maint_exit);MODULE_LICENSE("GPL");

我的測試虛擬機HZ為1000,這意味1ms將會產生一次時鐘中斷,我們以每個timer函數持鎖執行1ms,一共400個timer來加載模塊,看下結果:


單核跑滿,這意味著timer已經拼接成龍,20秒后,我們將看到soft lockup:


事實上,每個timer回調函數delay 800us,一共200個timer即可觸發soft lockup!使用這個代碼,你基本可以確定你要測試的機器的timer執行時間的安全閾值。

這就是timer導致的soft lockup的動力學。

關于HZ1000
1ms間隔的時鐘中斷對于服務器而言是悲哀的,1ms的時間無法容納太多的timer,也不允許每個timer中有哪怕稍微的合理耗時,1ms一次中斷很容易觸發run_timers在軟中斷上下文中被執行,但很遺憾,這就是事實。

拋開timer不談,HZ1000更多的意義在于快速響應事件而不是增加系統吞吐,這對服務器的單機性能是有傷害的!

說了這么多,現在讓我們考慮一下現實。

除了不要在內核中寫死循環之外,我們也不應該讓timer回調函數執行過久,特別是系統中timer特別多,且expires特別短的情況下。

回到現實中,我們來看一個實例。

假設你使用的內核版本還不支持TCP的lockless listener,那么我們特別要注意一個函數,即inet_csk_reqsk_queue_prune:

這是一個在TCP的per listener的timer中執行的函數。

這個函數的實現采用兩層循環,循環耗時取決于:

外層循環:該listener的backlog大小,受程序配置控制。

內層循環:該listener的半連接隊列的大小,受系統快照控制。

如果系統中的listener特別多,在收到SYN掃描攻擊時,特別容易陷入soft lockup的深淵!幸運的是,這個問題已經在TCP lockless listener的版本中修了,它的效果如下:

將per listener的半連接隊列timer換成了per request timer,減少了回調函數處理耗時。

per request timer增加了timer的數量,會不會抵消縮短回調耗時帶來的收益,需要攻擊來驗證。

我們看一個相關issue和patch:
https://patchwork.ozlabs.org/patch/452426/

好了,再次回到核心主題。

觸發soft lockup的當然不止死循環和timer,我只是用這兩個來說明soft lockup的動力學,即超過2倍的kernel.watchdog_thresh時間不能進行進程調度,就會觸發soft lockup告警。至于說stuck for 23s!那只是表象,并不是如其字面表達的那樣,23秒的時間在執行一段代碼。

此外,頻繁的spinlock,rwlock也會導致soft lockup,我這有一個關于IPv6路由查詢機制的實例,詳情參見:
https://blog.csdn.net/dog250/article/details/91046131

總之,所有的情況將不勝枚舉,也不可能通過一篇文章來展示,所以說,遇到此類問題,還是要有一個明確的排查思路或者說范式,才能快速定位問題的根因并且解決之。

當然了,經理并不關注這些爛八七糟的東西。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11041

    瀏覽量

    216051
  • Linux
    +關注

    關注

    87

    文章

    11465

    瀏覽量

    212840

原文標題:Linux內核為什么會發生soft lockup?

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    ADS1118讀取內部溫度傳感器溫度值偏高,有什么原因導致偏高

    ADS1118讀取內部溫度傳感器溫度值偏高,相對實際板上的溫度偏高幾度,這樣正常嗎,有什么原因導致偏高
    發表于 01-03 08:20

    TLC7135發燙、發熱是什么原因導致的?

    HI,TI:如上圖設計,使用穩壓電源供電接入+5V和-5V,開電后大約1分鐘左右,TLC7135開始發燙,+5V的電流也從70mA(+5V也供電給MCU)變為230mA。請問我的設計是否合理?是什么原因導致這個問題
    發表于 01-03 07:00

    ADS1256IDBR出現轉換失敗,沒有響應的問題,請問是什么原因導致

    您好,ADS1256IDBR出現轉換失敗,沒有響應的問題,請問是什么原因導致
    發表于 11-19 07:35

    什么原因導致單片機系統死機

    ______________________________________ 什么原因導致單片機系統死機
    發表于 10-16 22:32

    什么原因導致單片機程序跑飛

    ______________________________________ 什么原因導致單片機程序跑飛
    發表于 10-16 22:31

    電芯抽芯是什么原因導致

    電芯抽芯,通常指的是電池電芯在制造、使用或存儲過程中,由于各種原因導致電芯內部結構發生變形或損傷,從而使得電芯內部的活性材料與集流體分離,最終導致電芯性能下降或失效的現象。這種現象在鋰
    的頭像 發表于 09-24 09:36 ?1198次閱讀

    運放輸出失真是什么原因導致的?

    下圖為原理圖: 當按下按鍵時,測試三極管集電極的波形如下: 若把R27改為10K后,就不會除了上圖紅色方框的失真現象。這是由什么原因導致
    發表于 09-14 08:03

    INA128放大倍數不對是什么原因導致的?

    INA128放大倍數不對是什么原因導致的?
    發表于 08-30 07:34

    什么原因導致壓力傳感器漂移?

    什么原因導致壓力傳感器漂移的?我們在設計的時候怎么才能消除壓力傳感器漂移
    的頭像 發表于 08-22 18:00 ?1566次閱讀
    <b class='flag-5'>什么原因</b><b class='flag-5'>導致</b>壓力傳感器漂移?

    程序跑到H723ZGT6的flash擦除那一段命令就死機,什么原因導致

    除了死機外,keil彈出對話框:Cannot access target .Shutting down debug session。 請問這個什么原因導致
    發表于 08-14 08:09

    OPA388低頻振蕩是什么原因導致的?

    采樣轉換。 目前遇到的問題是,可能是由于輸入分壓電阻太大, 導致經過OPA緩沖后,會有一個大概頻率為0.05的低頻振蕩,請教大家,這是什么原因導致的,又如何避免次問題。
    發表于 08-09 06:37

    INA826檢測時出現較大幅度偏移,導致結果偏大或偏小是什么原因導致

    電池化成產品上使用許多INA826,用于電池通道電流檢測。目前發現INA826檢測時出現較大幅度偏移,導致結果偏大或偏小,而且檢測通道不固定。請問一下,是什么原因導致
    發表于 08-02 07:35

    STM32G071KBT6復位引腳震蕩是什么原因導致的?

    同樣的軟硬件有部分STM32G071KBT6出現無法燒錄或者燒錄后無法正常運行的問題,測試發現RESET引腳會出現震蕩信號如下圖所示,這會是什么原因導致
    發表于 07-03 06:58

    導致NMEA2000插頭針座變形的原因

    德索工程師說道在NMEA2000插頭針座的使用過程中,我們可能會遇到變形的問題。這種問題不僅會影響設備的正常使用,還可能對設備造成損害。那么,是什么原因導致了NMEA2000插頭針座的變形
    的頭像 發表于 07-01 16:56 ?440次閱讀
    <b class='flag-5'>導致</b>NMEA2000插頭針座變形的<b class='flag-5'>原因</b>

    OTA失敗err=0x1503是什么原因導致的?

    請問可能是什么原因導致
    發表于 06-19 07:04