Перезапустите под Kubernetes, если существует строка журнала.

Question 1

Существует ли встроенный или элегантный способ автоматически перезапускать под Kubernetes, если в логах появляется определенная строка лога?

Question 2

Нет встроенного контроля работоспособности, который напрямую проверяет вывод kubectl logs или то, что процесс внутри вашего контейнера записывает в stdout.

Однако, если процесс вашего контейнера записывает свои сообщения в файл или если вы можете перенаправить вывод процесса в файл внутри контейнера (например, с использованием tee, но будьте осторожны, чтобы правильно вращать файл), вы можете использовать контроль работоспособности.

Предположим, что логи записываются в /var/log/my-service.log, и каждый раз, когда мы наблюдаем time to say good bye, нам нужно перезапустить контейнер.

Мы можем добиться такого поведения, используя следующий шаблон пода:

spec:
  containers:
  - image: busybox
    name: sf-1102768
    command: ["/bin/sh", "-c", "mkdir -p /var/log && echo hello && sleep 60 && echo time to say good bye > /var/log/my-service.log && sleep 3600 && echo hm... still here"]
    livenessProbe:
      exec:
        command: ["/bin/sh", "-c", "! grep -q 'time to say good bye' /var/log/my-service.log"]
      initialDelaySeconds: 5
      periodSeconds: 5

Question 3

Таким образом, альтернативой может быть создание cronjob, который потенциально вызывает перезапуск, в этом примере мой развертывание home-assistant:

apiVersion: batch/v1
kind: CronJob
metadata:
  annotations: {}
  labels:
    cronjob: ha-restart-checker
  name: ha-restart-checker
  namespace: ha
spec:
  concurrencyPolicy: Replace
  failedJobsHistoryLimit: 3
  jobTemplate:
    spec:
      template:
        metadata:
          labels:
            cronjob: ha-restart-checker
        spec:
          tolerations:
            - key: node-role.kubernetes.io/control-plane
              effect: NoSchedule
          containers:
            - args:
                - |-
                  set -euo pipefail
                  echodate() { echo "$(date) $@"; }
                  echodate "Проверка HA ошибки для вызова перезапуска"
                  echo ---------------------------
                  grep -i 'Ошибка во время резервного копирования. Не удалось освободить блокировку записи базы данных' /config/home-assistant.log && \
                    kubectl -n ha rollout restart deployment home-assistant
                  echo ---------------------------
              command:
                - /bin/bash
                - -c
              #image: quay.io/kubermatic/util:2.5.0 #AMD64
              image: quay.io/toschneck/kubermatic-util:2024-10-23 #ARM
              imagePullPolicy: IfNotPresent
              name: ha-restart-checker
              resources: {}
              volumeMounts:
                - name: config
                  mountPath: /config
                  readOnly: true
          dnsPolicy: ClusterFirst
          restartPolicy: Never
          schedulerName: default-scheduler
          securityContext: {}
          serviceAccountName: ha-restart-checker
          terminationGracePeriodSeconds: 30
          volumes:
            - name: config
              persistentVolumeClaim:
                claimName: home-assistant-config
                readOnly: true
  timeZone: Europe/Berlin
  schedule: '20 * * * *'
  startingDeadlineSeconds: 30
  successfulJobsHistoryLimit: 1
  suspend: false
---
apiVersion: v1
kind: ServiceAccount
metadata:
  annotations: {}
  name: ha-restart-checker
  namespace: ha
---
apiVersion: rbac.authorization.k8s.io/v1
kind: RoleBinding
metadata:
  annotations: {}
  name: toschneck:ha:restart
  namespace: ha
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: Role
  name: toschneck:ha:restart
subjects:
  - kind: ServiceAccount
    name: ha-restart-checker
    namespace: ha
---
apiVersion: rbac.authorization.k8s.io/v1
kind: Role
metadata:
  annotations: {}
  name: toschneck:ha:restart
  namespace: ha
rules:
  - apiGroups:
      - 'apps'
    resources:
      - deployments
    verbs:
      - list
      - get
      - patch

Перезапустите под Kubernetes, если существует строка журнала.

Вопрос или проблема

Ответ или решение

Автоматический перезапуск подов Kubernetes при наличии определенной строки в логах

1. Использование живых проб (Liveness Probes)

Пример:

2. Использование CronJob для проверки логов

Пример CronJob:

Заключение