第12课: 自动扩缩容

HPA、VPA、CA的配置与最佳实践

学习目标

理解Kubernetes自动扩缩容的概念和作用
掌握Horizontal Pod Autoscaler (HPA)的配置方法
了解Vertical Pod Autoscaler (VPA)和Cluster Autoscaler (CA)
学习如何基于不同指标进行扩缩容
了解自动扩缩容的最佳实践

自动扩缩容的基本概念

自动扩缩容是Kubernetes中根据应用负载自动调整资源的机制。Kubernetes提供了三种主要的自动扩缩容方式：

Horizontal Pod Autoscaler (HPA)：水平扩缩容，通过增加或减少Pod数量来适应负载变化
Vertical Pod Autoscaler (VPA)：垂直扩缩容，通过调整Pod的CPU和内存资源请求和限制来适应负载变化
Cluster Autoscaler (CA)：集群扩缩容，通过增加或减少集群中的节点数量来适应负载变化

自动扩缩容工作流程

监控指标 → 评估负载 → 计算所需资源 → 执行扩缩容操作

Horizontal Pod Autoscaler (HPA)

HPA的工作原理

HPA通过监控Pod的CPU、内存使用率或自定义指标，根据预设的目标值自动调整Pod副本数量。

HPA配置示例

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: nginx-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx-deployment
  minReplicas: 2
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 50
  - type: Resource
    resource:
      name: memory
      target:
        type: Utilization
        averageUtilization: 70

基于自定义指标的HPA

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: app-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: app-deployment
  minReplicas: 2
  maxReplicas: 10
  metrics:
  - type: Pods
    pods:
      metric:
        name: requests-per-second
      target:
        type: AverageValue
        averageValue: 100m

Vertical Pod Autoscaler (VPA)

VPA的工作原理

VPA通过分析Pod的资源使用情况，自动调整Pod的CPU和内存资源请求和限制，以优化资源利用率。

VPA配置示例

apiVersion: autoscaling.k8s.io/v1
kind: VerticalPodAutoscaler
metadata:
  name: nginx-vpa
spec:
  targetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx-deployment
  updatePolicy:
    updateMode: "Auto"  # 可选: "Off", "Initial", "Recreate", "Auto"
  resourcePolicy:
    containerPolicies:
    - containerName: nginx
      minAllowed:
        cpu: 100m
        memory: 256Mi
      maxAllowed:
        cpu: 1
        memory: 2Gi
      controlledResources: ["cpu", "memory"]

Cluster Autoscaler (CA)

CA的工作原理

CA通过监控集群中的Pod调度情况，当发现有Pod因资源不足而无法调度时，自动向集群中添加新节点；当发现节点资源利用率过低时，自动从集群中移除节点。

CA配置示例

Cluster Autoscaler通常在集群创建时配置，或通过云提供商的管理控制台进行配置。以下是在AWS EKS中启用Cluster Autoscaler的示例：

# 部署Cluster Autoscaler
kubectl apply -f https://raw.githubusercontent.com/kubernetes/autoscaler/master/cluster-autoscaler/cloudprovider/aws/examples/cluster-autoscaler-autodiscover.yaml

# 修改Cluster Autoscaler部署，添加集群名称
eksca=$(kubectl get deploy -n kube-system cluster-autoscaler -o name)
kubectl patch $eksca -n kube-system --type=strategic --patch '{"spec":{"template":{"spec":{"containers":[{"name":"cluster-autoscaler","args":["--v=4","--stderrthreshold=info","--cloud-provider=aws","--skip-nodes-with-local-storage=false","--expander=least-waste","--node-group-auto-discovery=asg:tag=k8s.io/cluster-autoscaler/enabled,k8s.io/cluster-autoscaler/"]}]}}}'

命令行操作

# 查看HPA
kubectl get hpa
kubectl get hpa -n <namespace>

# 查看HPA详情
kubectl describe hpa <hpa-name>

# 创建HPA
kubectl autoscale deployment <deployment-name> --cpu-percent=50 --min=2 --max=10

# 通过YAML创建HPA
kubectl apply -f hpa.yaml

# 删除HPA
kubectl delete hpa <hpa-name>

# 查看VPA
kubectl get vpa
kubectl describe vpa <vpa-name>

# 查看CA状态
kubectl get deploy cluster-autoscaler -n kube-system
kubectl logs deploy/cluster-autoscaler -n kube-system

基于自定义指标的扩缩容

除了CPU和内存使用率外，HPA还支持基于自定义指标进行扩缩容，如请求数、队列长度等。要使用自定义指标，需要部署Metrics Server或Prometheus Adapter。

# 部署Metrics Server
kubectl apply -f https://github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml

# 验证Metrics Server是否正常运行
kubectl get apiservices | grep metrics
kubectl top nodes
kubectl top pods

最佳实践：

合理设置扩缩容范围：根据应用的实际需求设置最小和最大副本数
选择合适的扩缩容指标：
- CPU/内存使用率：适用于计算密集型应用
- 请求数：适用于Web服务
- 队列长度：适用于消息处理应用
设置适当的扩缩容阈值：避免频繁扩缩容，建议CPU使用率目标设置在50-70%之间
考虑扩缩容的冷却期：避免短时间内频繁扩缩容
结合使用多种扩缩容方式：如HPA用于处理短期负载波动，CA用于处理长期负载增长
为Pod设置资源请求和限制：这是HPA和VPA正常工作的前提
监控扩缩容事件：及时发现和解决扩缩容问题

常见问题与解决方案

问题1：HPA不触发扩缩容

可能原因：

Metrics Server未部署或未正常运行
Pod未设置资源请求
指标数据未正确收集
扩缩容阈值设置不合理

解决方案：检查Metrics Server状态，确保Pod设置了资源请求，验证指标数据是否正确收集

问题2：扩缩容过于频繁

可能原因：负载波动较大，扩缩容阈值设置过于敏感

解决方案：调整扩缩容阈值，增加扩缩容的冷却期，考虑使用更稳定的指标

问题3：Pod无法成功扩缩容

可能原因：集群资源不足，Pod调度失败

解决方案：使用Cluster Autoscaler自动扩容集群，或手动添加节点

实践练习

练习任务：

基础练习：为一个Deployment创建HPA，基于CPU使用率进行扩缩容
进阶练习：配置基于内存使用率和自定义指标的HPA
挑战练习：部署和配置VPA，观察其对Pod资源配置的调整
综合练习：设计并实现一个完整的自动扩缩容方案，包括HPA、VPA和CA的配置

总结

自动扩缩容是Kubernetes中实现应用高可用性和资源优化的重要机制，通过合理配置自动扩缩容策略，可以：

提高应用的可用性，确保在负载高峰期有足够的资源
优化资源利用率，避免资源浪费
减少人工干预，实现自动化运维
降低运营成本

在实际应用中，需要根据应用的特性和需求，选择合适的自动扩缩容方式，并进行合理的配置。自动扩缩容策略的设计应该考虑应用的负载特性、资源需求、响应时间要求等因素。

上一课下一课