一、什么是Cgroup,使用場(chǎng)景?
容器本質(zhì)上是進(jìn)程,既然是進(jìn)程就會(huì)消耗掉系統(tǒng)資源,比如:CPU、內(nèi)存、磁盤(pán)、網(wǎng)絡(luò)帶寬等,如果不加以限制,容器在某些情況下就會(huì)無(wú)限制地吃掉宿主機(jī)的系統(tǒng)資源,顯然這不是我們期望發(fā)生的,另外當(dāng)我們的環(huán)境中運(yùn)行了很多容器,且系統(tǒng)資源一定的情況下,我們有優(yōu)先保證主要容器應(yīng)用的需求,如何既能夠解決此問(wèn)題同時(shí)又能夠滿足我們的需求呢?答案就是:Linux Cgroup(全程Linux Control Group),在前面的文章中,介紹了namespace為容器這類進(jìn)程提供了隔離,而Cgroup可以為容器這類進(jìn)程提供資源使用上限,兩者黃金搭檔,共同為容器應(yīng)用保駕護(hù)航。
二、Cgroup的原理和實(shí)踐
CPU的周期控制
Cgroup可以為容器進(jìn)程使用的CPU、內(nèi)存、磁盤(pán)、網(wǎng)絡(luò)帶寬資源進(jìn)行限制,具體是如何實(shí)現(xiàn)的呢?接下來(lái)我們一起來(lái)實(shí)操下,在 Linux 中,Cgroups 給用戶暴露出來(lái)的操作接口是文件系統(tǒng),即它以文件和目錄的方式組織在操作系統(tǒng)的 /sys/fs/cgroup 這個(gè)路徑下,我們先去此目錄查看下
[root@k8s-master /]# cd sys/fs/cgroup/ [root@k8s-master cgroup]# ls blkio cpuacct cpuset freezer memory net_cls,net_prio perf_event rdma cpu cpu,cpuacct devices hugetlb net_cls net_prio pids systemd
可以看到在cgroup的這個(gè)目錄下存在很多子目錄,這些都是cgroup可以限制地資源種類,我們?cè)谶M(jìn)一步進(jìn)入到CPU的子目錄查看下,里面有限制資源種類的詳細(xì)的限制地指標(biāo),比如
1、cpu.cfs_period_us:指定容器對(duì)CPU的使用多長(zhǎng)時(shí)間重新做一次分配
2、cpu.cfs_quota_us:指在cpu.cfs_period_us周期內(nèi)給分配多少時(shí)間給容器
這兩個(gè)指標(biāo)需要一起配合使用來(lái)實(shí)現(xiàn)CPU的周期控制,我們先手動(dòng)模擬容器創(chuàng)建的時(shí)候,如何完成利用cgroup來(lái)實(shí)現(xiàn)資源限制,以CPU周期控制為例子,先在/sys/fs/cgroup/cpu目錄下創(chuàng)建1個(gè)container_
test的目錄,如下所示我已經(jīng)創(chuàng)建好(紅色字體)。
[](javascript:void(0); “復(fù)制代碼”)
[root@k8s-master cgroup]# cd cpu [root@k8s-master cpu]# ls cgroup.clone_children cpuacct.usage_all cpu.cfs_period_us docker cgroup.procs cpuacct.usage_percpu cpu.cfs_quota_us kubepods cgroup.sane_behavior cpuacct.usage_percpu_sys cpu.rt_period_us notify_on_release container_test cpuacct.usage_percpu_user cpu.rt_runtime_us release_agent cpuacct.stat cpuacct.usage_sys cpu.shares system.slice cpuacct.usage cpuacct.usage_user cpu.stat tasks
[](javascript:void(0); “復(fù)制代碼”)
然后進(jìn)入到此目錄下,ls查看下,這里出現(xiàn)了一個(gè)神奇的形象,此目錄下自動(dòng)生成了很多CPU子系統(tǒng)控制的指標(biāo),這些指標(biāo)我們并未進(jìn)行新增,也就是說(shuō)在/sys/fs/cgroup/cpu目錄下會(huì)給新建的目默認(rèn)配置CPU子系統(tǒng)資源限制的指標(biāo)
[](javascript:void(0); “復(fù)制代碼”)
[root@k8s-master cpu]# cd container_test/ [root@k8s-master container_test]# ls cgroup.clone_children cpuacct.usage_percpu cpu.cfs_period_us cpu.stat cgroup.procs cpuacct.usage_percpu_sys cpu.cfs_quota_us notify_on_release cpuacct.stat cpuacct.usage_percpu_user cpu.rt_period_us tasks cpuacct.usage cpuacct.usage_sys cpu.rt_runtime_us cpuacct.usage_all cpuacct.usage_user cpu.shares
[](javascript:void(0); “復(fù)制代碼”)
這些指標(biāo)如何作用呢?為了體現(xiàn)資源的使用情況,我們先寫(xiě)一個(gè)程序來(lái)模擬來(lái)吃掉系統(tǒng)資源的情況,然后再來(lái)查看指標(biāo)
[root@k8s-master sh]# cat while.sh #!/bin/bash while : ; do : ; done &
[root@k8s-master sh]# sh while.sh
通過(guò)如上程序,寫(xiě)了一個(gè)while無(wú)限循環(huán)的shell腳本,默認(rèn)情況下,這個(gè)程序之后的進(jìn)程會(huì)占據(jù)掉系統(tǒng)所剩集群的所有資源,可通過(guò)top命令查看下
[root@k8s-master sh]# ps -ef |grep while root 14975 1 97 20:29 pts/1 00:02:48 sh while.sh
如上圖所示,while循環(huán)的進(jìn)程占據(jù)掉了96.3%的CPU資源,在實(shí)際的應(yīng)用中若進(jìn)程這樣無(wú)限制的使用資源,將會(huì)給操作系統(tǒng)帶來(lái)很大的負(fù)擔(dān),那么如何控制進(jìn)程資源的使用呢?回到我們之前創(chuàng)建在container_test目錄下
[root@k8s-master container_test]# cat cpu.cfs_quota_us -1 [root@k8s-master container_test]# cat cpu.cfs_period_us 100000
默認(rèn)創(chuàng)建的目錄下cfs_quota_us 若為-1,則表示還未啟用quota,即還未實(shí)行資源限制,cfs_period_us默認(rèn)為100000us=100ms=0.1s(秒),接下來(lái)我們向cpu.cfs_quota_us 輸入30ms=30000us,cfs_period_us值維持不變還是為100ms,在前面關(guān)于這2個(gè)概念有介紹,cpu.cfs_quota_us表示的是cfs_period_us的周期內(nèi),分配30/100的時(shí)間,即30%,接下來(lái)驗(yàn)證下
[root@k8s-master container_test]# echo 30000 》 /sys/fs/cgroup/cpu/container_test/cpu.cfs_quota_us
[root@k8s-master container_test]# cat cpu.cfs_quota_us
30000
設(shè)置已完成,但是此時(shí)還不會(huì)立即生效,還需要將進(jìn)程ID輸入到資源限制地task里
[root@k8s-master container_test]# echo 14975 》 /sys/fs/cgroup/cpu/container_test/tasks
接下來(lái)我們?cè)谕ㄟ^(guò)top查看下資源使用情況,如下圖所示,可以看到CPU的資源使用上限由原來(lái)的96.3%已經(jīng)降到29.9%了,表明此while進(jìn)程的CPU的資源使用上限已經(jīng)設(shè)置成功。
以上整個(gè)過(guò)程為手動(dòng)設(shè)置模擬容器創(chuàng)建的過(guò)程中CPU份額控制的過(guò)程,實(shí)際上在容器創(chuàng)建的過(guò)程中,并不需要上面這般步驟,我們只需要在run容器的時(shí)候指定指標(biāo)參數(shù)即可,如下所示
[root@k8s-master container_test]# docker run -it -d --cpu-period=100000 --cpu-quota=30000 nginx /bin/bash
上面的命令是后臺(tái)守護(hù)進(jìn)程的方式運(yùn)行了1個(gè)nginx的容器,且指定CPU的每隔100000us=100ms做一次分配,且每次分配給容器的時(shí)間為30ms,可以看到這個(gè)分配和前面手動(dòng)分配是一致的,值得注意的是這里需要加上-d來(lái)創(chuàng)建容器,若不加上的話會(huì)進(jìn)入到終端交互界面,一旦提出終端交互界面后,容器這個(gè)進(jìn)程也將會(huì)退出,而我們希望容器進(jìn)程保持后臺(tái)運(yùn)行,因此需要加上-d,容器運(yùn)行成功后,將會(huì)在docker目錄下新建一個(gè)以容器ID命名的目錄,這個(gè)目錄和前面手動(dòng)創(chuàng)建的目錄以上,系統(tǒng)會(huì)默認(rèn)配置資源限制的參數(shù),我們可以如下看下:
[root@k8s-master container_test]# docker run -it -d --cpu-period=100000 --cpu-quota=30000 nginx /bin/bash 16f51f6780685be9c83b1684515005f30aed91916fdd6573b28eaf56be201e4a
[](javascript:void(0); “復(fù)制代碼”)
[root@k8s-master docker]# ls 01a0fd62d2110e54b0c3635b2897e7c18e6b78f026fa57b4214d7662dd3b38ba cpuacct.usage_sys 16f51f6780685be9c83b1684515005f30aed91916fdd6573b28eaf56be201e4a cpuacct.usage_user cgroup.clone_children cpu.cfs_period_us cgroup.procs cpu.cfs_quota_us cpuacct.stat cpu.rt_period_us cpuacct.usage cpu.rt_runtime_us cpuacct.usage_all cpu.shares cpuacct.usage_percpu cpu.stat cpuacct.usage_percpu_sys notify_on_release cpuacct.usage_percpu_user tasks
[](javascript:void(0); “復(fù)制代碼”)
如上紅色部分為docker目錄下依據(jù)容器的名稱默認(rèn)創(chuàng)建的目錄,我們進(jìn)入到這個(gè)目錄,然后輸出下之前我們?cè)趧?chuàng)建的時(shí)候指定的cpu.cfs_quota_us和cfs_period_us值
[root@k8s-master 16f51f6780685be9c83b1684515005f30aed91916fdd6573b28eaf56be201e4a]# cat cpu.cfs_period_us 100000
[root@k8s-master 16f51f6780685be9c83b1684515005f30aed91916fdd6573b28eaf56be201e4a]# cat cpu.cfs_quota_us 30000
可以看到我們之前設(shè)置的值已經(jīng)生效了,也就是說(shuō)這個(gè)nginx的容器最多可以支持使用到30%左右的CPU帶寬。
相類似的我們可以對(duì)容器獲取CPU的資源的優(yōu)先級(jí)進(jìn)行設(shè)置,通過(guò)--cpu-share這個(gè)參數(shù),其指定的值并非是給容器具體的份額,其實(shí)是個(gè)權(quán)重,在需要對(duì)容器資源進(jìn)行限制時(shí)才會(huì)生效,權(quán)重大的,可以優(yōu)先得到CPU的資源;另外還可以對(duì)使用的核數(shù)進(jìn)行限制,針對(duì)多核的服務(wù)器,可以控制容器運(yùn)行限定使用哪些CPU內(nèi)核和內(nèi)存節(jié)點(diǎn),即使用-cpuset-cpus和-cpuset-mens參數(shù),比如:我們可以指定創(chuàng)建的容器只能用0、1、2三核。
三、總結(jié)
本文以CPU中周期控制限制某進(jìn)程的CPU資源使用為例子,介紹了其手動(dòng)設(shè)置參數(shù)和容器自動(dòng)設(shè)置參數(shù),每新建1個(gè)容器,在/sys/fs/cgroup/cpu/docker目錄下都會(huì)自動(dòng)以容器的ID為名字創(chuàng)建1個(gè)目錄,且在此目錄下支持對(duì)CPU、內(nèi)存、網(wǎng)絡(luò)帶寬、磁盤(pán)的資源使用進(jìn)行限制,而其限制地處理與CPU的周期控制是類似的,這里就未做過(guò)多介紹
編輯:hfy
-
cpu
+關(guān)注
關(guān)注
68文章
11033瀏覽量
215995 -
Linux
+關(guān)注
關(guān)注
87文章
11459瀏覽量
212790 -
容器
+關(guān)注
關(guān)注
0文章
507瀏覽量
22365
發(fā)布評(píng)論請(qǐng)先 登錄
手把手教你如何調(diào)優(yōu)Linux網(wǎng)絡(luò)參數(shù)
Linux中的用戶與創(chuàng)建

探究三相電阻焊控制器在現(xiàn)代焊接工藝中的關(guān)鍵技術(shù)應(yīng)用與實(shí)踐
盤(pán)點(diǎn)Linux系統(tǒng)中的常見(jiàn)命令

精確溫控技術(shù)在焊接電源中的應(yīng)用與實(shí)踐探析

高頻點(diǎn)焊電源技術(shù)在現(xiàn)代工業(yè)制造中的應(yīng)用探索與實(shí)踐

單北斗智能終端:高精度定位技術(shù)在行業(yè)應(yīng)用中的革新實(shí)踐

Linux開(kāi)發(fā)怎么學(xué)?
名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.45】RISC-V體系結(jié)構(gòu)編程與實(shí)踐(第二版)
UWB定位系統(tǒng)在智能制造中的應(yīng)用實(shí)踐

MSP430 FRAM技術(shù)–使用方法和最佳實(shí)踐

Linux內(nèi)核測(cè)試技術(shù)

Linux內(nèi)核中的頁(yè)面分配機(jī)制

在Linux中查看IP地址的方法

評(píng)論