kubernetes部署的Pod长时处于ContainerCreating状态

本文地址：https://www.cnblogs.com/wannengachao/p/13821469.html

1、执行 kubectl get pod --all-namespaces|grep -Ev '1/1|2/2|3/3|Com

查看到Pod长时处于ContainerCreating状态，见下图：

2、kubectl describe pod $Pod名

输出结果见下：

Events:

Type Reason Age From Message

---- ------ ---- ---- -------

Warning FailedMount 15m (x33 over 66m) kubelet MountVolume.SetUp failed for volume "volumn-eds-certs" : mount failed: fork/exec /usr/bin/systemd-run: cannot allocate memory

Mounting command: systemd-run

Mounting arguments: --description=Kubernetes transient mount for /var/lib/kubelet/pods/fee6bf33-0a03-11eb-95b5-00163e0115c9/volumes/kubernetes.io~secret/volumn-eds-certs --scope -- mount -t tmpfs tmpfs /var/lib/kubelet/pods/fee6bf33-0a03-11eb-95b5-00163e0115c9/volumes/kubernetes.io~secret/volumn-eds-certs

Output:

Warning FailedMount 11m (x35 over 66m) kubelet MountVolume.SetUp failed for volume "default-token-bdxkl" : mount failed: fork/exec /usr/bin/systemd-run: cannot allocate memory

Mounting command: systemd-run

Mounting arguments: --description=Kubernetes transient mount for /var/lib/kubelet/pods/fee6bf33-0a03-11eb-95b5-00163e0115c9/volumes/kubernetes.io~secret/default-token-bdxkl --scope -- mount -t tmpfs tmpfs /var/lib/kubelet/pods/fee6bf33-0a03-11eb-95b5-00163e0115c9/volumes/kubernetes.io~secret/default-token-bdxkl

Output:

Warning FailedMount 5m41s (x27 over 64m) kubelet Unable to mount volumes for pod "test-trade-3-pre-b9471abd-4318-4210-9334-d01c5b2d01a3-7c7569pls8_default(fee6bf33-0a03-11eb-95b5-00163e0115c9)": timeout expired waiting for volumes to attach or mount for pod "default"/"test-trade-3-pre-b9471abd-4318-4210-9334-d01c5b2d01a3-7c7569pls8". list of unmounted volumes=[volumn-eds-certs default-token-bdxkl]. list of unattached volumes=[volumn-eds-certs default-token-bdxkl]

3、查看每个node的CPU与内存资源情况，结果查看到node的资源规格是32C、64g并且使用率才50％左右，于是想是否Pod的requests设置的超过了node资源，通过kubectl get rs $异常Pod的rs名 -oyaml 发现设置的limits与requests值是4c、8g没有超过node的自身资源，因为每个Pod的limits与requests不是我本人设置的，怀疑是否有其它的Pod设置的requests过大，导致node被Pod请求资源时没有富余的内存给此Pod。排查发现所有Pod的limits与requests都是4c、8g，最后导致如我猜测的一样node被Pod请求资源时没有富余的内存给此Pod。

4、解决方案：将Pod的limits与requests调小即可。为Pod设置limits与requests谨记设成实际够用的资源即可，如果确实Pod会使用到过大的资源，那就将node扩容下，避免出现Pod向node请求资源时出现资源不足的情况。

5、下面内容是在网上看到的讲解reques、limits比较不错的，在此贴出来分享下：

requests

requests用于schedule阶段，在调度pod保证所有pod的requests总和小于node能提供的计算能力

requests.cpu被转成docker的--cpu-shares参数，与cgroup cpu.shares功能相同

设置容器的cpu的相对权重

该参数在CPU资源不足时生效，根据容器requests.cpu的比例来分配cpu资源

CPU资源充足时，requests.cpu不会限制container占用的最大值，container可以独占CPU

requests.memory没有对应的docker参数，作为k8s调度依据

使用requests来设置各容器需要的最小资源

limits

limits限制运行时容器占用的资源

limits.cpu会被转换成docker的–cpu-quota参数。与cgroup cpu.cfs_quota_us功能相同

限制容器的最大CPU使用率。

cpu.cfs_quota_us参数与cpu.cfs_period_us结合使用，后者设置时间周期

k8s将docker的–cpu-period参数设置100毫秒。对应着cgroup的cpu.cfs_period_us

limits.cpu的单位使用m，千分之一核

limits.memory会被转换成docker的–memory参数。用来限制容器使用的最大内存

当容器申请内存超过limits时会被终止