Kubernetes QoS入门指南 – wiki大全

Kubernetes QoS 入門指南：確保應用程式的穩定與性能

在 Kubernetes 中部署應用程式時，我們不僅希望它們能夠運行，更希望它們能夠穩定、高效地運行。這就涉及到資源管理的核心概念——服務質量 (Quality of Service, QoS)。Kubernetes QoS 是一種機制，用於根據 Pod 的資源需求和使用情況，在節點資源緊張時對 Pod 進行優先級排序和管理，從而有效避免資源爭用，確保關鍵應用程式的穩定性。

理解 Kubernetes QoS 對於構建健壯、可預測的容器化應用程式至關重要。它定義了 Pod 在資源不足情況下的行為，特別是在節點記憶體或 CPU 壓力較大時的驅逐策略。

為什麼需要 QoS？

想像一下，一個 Kubernetes 節點上運行著多個 Pod，其中一些可能是處理關鍵業務的應用，另一些則可能是非關鍵的開發或測試服務。如果節點的資源（如 CPU 或記憶體）開始耗盡，Kubernetes 需要一個策略來決定：
1. 哪些 Pod 可以繼續運行？
2. 哪些 Pod 應該被限制資源？
3. 哪些 Pod 應該被驅逐以釋放資源？

QoS 正是為了解決這些問題而設計的。它通過為 Pod 分配不同的服務質量等級，來指導 Kubelet 在資源壓力下的行為。

Kubernetes QoS 的三種等級

Kubernetes 定義了三種 QoS 等級，Pod 會根據其容器的資源請求（requests）和限制（limits）的配置自動歸類到其中一種：

1. Guaranteed (保證型)

這是最高級別的 QoS，為 Pod 提供最穩定的運行環境。

定義條件: Pod 中的所有容器都必須為 CPU 和記憶體設定 requests 和 limits，並且兩者必須相等。
- 例如：cpu: "100m", memory: "128Mi" 的 requests 和 limits 都必須相同。
特性:
- 此類 Pod 會被分配所請求的所有資源，並且在資源短缺時，它們是最不可能被驅逐的。
- 提供高度可預測的性能和可用性，適用於對穩定性要求極高的關鍵應用程式。
驅逐優先級: 最低。Guaranteed Pod 只有在系統進程需要關鍵資源，且沒有其他 Pod 可驅逐時，才會被考慮驅逐。
範例:

yaml apiVersion: v1 kind: Pod metadata: name: guaranteed-pod spec: containers: - name: my-container image: my-app:latest resources: requests: memory: "256Mi" cpu: "200m" limits: memory: "256Mi" cpu: "200m"

2. Burstable (突發型)

這是中等級別的 QoS，允許 Pod 在請求的基礎上突發使用更多資源，直到達到其限制。

定義條件:
- Pod 中至少有一個容器設定了 requests。
- requests 和 limits 不相等（例如，limits 高於 requests）。
- 或者，只設定了 limits 而沒有設定 requests（此時 requests 會預設為 limits 的值，但仍然被視為 Burstable，因為存在不相等的隱含情況）。
特性:
- 此類 Pod 可以利用節點上未使用的資源，其資源使用量可以超出 requests，但不能超過 limits。
- 當節點資源緊張時，它們的優先級高於 BestEffort Pod。
驅逐優先級: 中等。當節點記憶體壓力大時，如果 Burstable Pod 的記憶體使用量超出其 requests，它們會根據超出部分的多少被選擇驅逐。
範例:

yaml apiVersion: v1 kind: Pod metadata: name: burstable-pod spec: containers: - name: my-container image: my-app:latest resources: requests: memory: "128Mi" cpu: "100m" limits: memory: "512Mi" cpu: "500m"
在這個例子中，Pod 最少會獲得 128Mi 記憶體和 100m CPU，但在有可用資源時，最多可以使用 512Mi 記憶體和 500m CPU。

3. BestEffort (盡力而為型)

這是最低級別的 QoS，表示 Pod 不保證任何資源，會盡力而為地運行。

定義條件: Pod 中的所有容器都沒有指定任何 requests 或 limits。
特性:
- 此類 Pod 獲得最低的排程優先級，並且在資源短缺時是最先被驅逐的。
- 它們適用於非關鍵性的、可以容忍中斷或不需要穩定性能的工作負載，例如批處理任務、開發環境中的臨時工具等。
驅逐優先級: 最高。當節點資源不足時，BestEffort Pod 將最先被驅逐以釋放資源。
範例:

yaml apiVersion: v1 kind: Pod metadata: name: besteffort-pod spec: containers: - name: my-container image: my-app:latest # 未指定 requests 和 limits

QoS 與 Pod 驅逐順序

當 Kubernetes 節點面臨記憶體壓力時，Kubelet 會按照一個明確的順序來決定驅逐哪些 Pod：

BestEffort Pods: 會被最優先驅逐。
Burstable Pods: 如果其記憶體使用量已經超出其 requests，則會根據超出 requests 的程度，從超出最多的 Pod 開始驅逐。
Guaranteed Pods: 只有在以上所有類型的 Pod 都被驅逐後，且節點仍然面臨嚴重資源不足（通常是系統關鍵進程需要資源）的情況下，Guaranteed Pod 才有可能被驅逐，但這極為罕見。

最佳實踐

為了充分利用 Kubernetes QoS 並確保應用程式的健康運行，請遵循以下最佳實踐：

為所有容器定義資源請求和限制: 這是最重要的建議。即使是開發或測試環境中的 Pod，也應該為其容器定義合理的 requests 和 limits。這不僅讓您的 Pod 能被歸類到適當的 QoS 等級，也有助於 Kubernetes 更有效地進行排程和資源管理。
區分關鍵與非關鍵應用程式:
- 對於業務關鍵、對性能和可用性要求極高的應用程式，應配置為 Guaranteed QoS。
- 對於可以接受一定程度資源波動，但仍需穩定運行的應用程式，配置為 Burstable QoS。
- 對於非關鍵、批處理或臨時性任務，可以考慮配置為 BestEffort QoS，但要意識到它們最容易被驅逐。
監控資源使用情況: 使用 Prometheus、Grafana 等監控工具持續追蹤 Pod 的實際 CPU 和記憶體使用情況。這將幫助您評估當前的 requests 和 limits 是否合理，並進行必要的調整。
避免資源過度請求或請求不足:
- requests 設定過高會導致資源浪費，因為這些資源會被預留，即使 Pod 不使用。
- requests 設定過低會導致 Pod 頻繁被驅逐（如果是 Burstable 或 BestEffort），或在資源爭用時性能下降。
- limits 設定過低可能導致應用程式因達到上限而被 OOMKill (Out Of Memory Kill) 或 CPU 節流。
測試驅逐策略: 在非生產環境中模擬資源壓力，觀察不同 QoS 等級的 Pod 如何被驅逐，以驗證您的配置是否符合預期。

結論

Kubernetes QoS 是保證集群穩定性和應用程式性能的基石。通過正確理解和配置 Pod 的資源請求與限制，您可以精確控制應用程式的服務質量，確保關鍵服務在各種資源條件下都能可靠運行。花時間規劃和調整您的 QoS 配置，將為您的 Kubernetes 環境帶來顯著的穩定性和效率提升。

I have generated the article in Chinese as requested.