LVM2 Raid 1 “требует обновления”, но не обновляется и не восстанавливается.

Question 1

Я использую LVM RAID 1 на двух дисках. Вот что lvs сообщает мне о моем VG:

root@picard:~# lvs -a -o +devices,lv_health_status,raid_sync_action,raid_mismatch_count 
  /run/lvm/lvmetad.socket: подключение не удалось: Нет такого файла или каталога
  WARNING: Не удалось подключиться к lvmetad. Переход на внутреннее сканирование.
  LV                 VG      Attr       LSize Pool Origin Data%  Meta%  Move Log Cpy%Sync Convert Devices                                 Health          SyncAction Mismatches
  lv-data            vg-data rwi-aor-r- 2.70t                                    100.00           lv-data_rimage_0(0),lv-data_rimage_1(0) refresh needed  idle                0
  [lv-data_rimage_0] vg-data iwi-aor-r- 2.70t                                                     /dev/sda(0)                             refresh needed                       
  [lv-data_rimage_1] vg-data iwi-aor--- 2.70t                                                     /dev/sdb(1)                                                                  
  [lv-data_rmeta_0]  vg-data ewi-aor-r- 4.00m                                                     /dev/sda(708235)                        refresh needed                       
  [lv-data_rmeta_1]  vg-data ewi-aor--- 4.00m                                                     /dev/sdb(0)

Похоже, что-то пошло не так на /dev/sda. SMART-журнал этого диска выглядит хорошо, поэтому я надеюсь, что это просто временная проблема, и я хотел бы обновить / ресинхронизировать мой RAID. Вот что я делаю:

root@picard:~# lvchange --refresh vg-data/lv-data
  /run/lvm/lvmetad.socket: подключение не удалось: Нет такого файла или каталога
  WARNING: Не удалось подключиться к lvmetad. Переход на внутреннее сканирование.

(…ждем несколько минут…)

root@picard:~# lvs -a -o +devices,lv_health_status,raid_sync_action,raid_mismatch_count
  /run/lvm/lvmetad.socket: подключение не удалось: Нет такого файла или каталога
  WARNING: Не удалось подключиться к lvmetad. Переход на внутреннее сканирование.
  LV                 VG      Attr       LSize Pool Origin Data%  Meta%  Move Log Cpy%Sync Convert Devices                                 Health          SyncAction Mismatches
  lv-data            vg-data rwi-aor-r- 2.70t                                    100.00           lv-data_rimage_0(0),lv-data_rimage_1(0) refresh needed  idle                0
  [lv-data_rimage_0] vg-data iwi-aor-r- 2.70t                                                     /dev/sda(0)                             refresh needed                       
  [lv-data_rimage_1] vg-data iwi-aor--- 2.70t                                                     /dev/sdb(1)                                                                  
  [lv-data_rmeta_0]  vg-data ewi-aor-r- 4.00m                                                     /dev/sda(708235)                        refresh needed                       
  [lv-data_rmeta_1]  vg-data ewi-aor--- 4.00m                                                     /dev/sdb(0)

Итак, ничего не произошло? Мой dmesg показывает, что он пытался восстановить RAID:

[150522.459416] device-mapper: raid: Неисправное устройство raid1 #0 имеет читаемый суперблок. Пытаемся оживить его.

Ну, хорошо, может быть, проверка данных (scrubbing) поможет? Давайте попробуем это:

root@picard:~# lvchange --syncaction repair vg-data/lv-data
  /run/lvm/lvmetad.socket: подключение не удалось: Нет такого файла или каталога
  WARNING: Не удалось подключиться к lvmetad. Переход на внутреннее сканирование.
root@picard:~# lvs -a -o +devices,lv_health_status,raid_sync_action,raid_mismatch_count
  /run/lvm/lvmetad.socket: подключение не удалось: Нет такого файла или каталога
  WARNING: Не удалось подключиться к lvmetad. Переход на внутреннее сканирование.
  LV                 VG      Attr       LSize Pool Origin Data%  Meta%  Move Log Cpy%Sync Convert Devices                                 Health          SyncAction Mismatches
  lv-data            vg-data rwi-aor-r- 2.70t                                    100.00           lv-data_rimage_0(0),lv-data_rimage_1(0) refresh needed  idle                0
  [lv-data_rimage_0] vg-data iwi-aor-r- 2.70t                                                     /dev/sda(0)                             refresh needed                       
  [lv-data_rimage_1] vg-data iwi-aor--- 2.70t                                                     /dev/sdb(1)                                                                  
  [lv-data_rmeta_0]  vg-data ewi-aor-r- 4.00m                                                     /dev/sda(708235)                        refresh needed                       
  [lv-data_rmeta_1]  vg-data ewi-aor--- 4.00m                                                     /dev/sdb(0)

Здесь несколько странных моментов:

SyncAction равен idle, то есть, похоже, что проверка данных завершилась мгновенно?
Если проверка данных завершена, и массив все еще нуждается в обновлении, как может считаться, что несовпадения равны 0? Разве проверка данных не должна обнаруживать несовпадения и либо исправлять их (то есть очищать статус “необходима перезагрузка”) либо увеличивать счетчик несовпадений?

dmesg говорит:

[150695.091180] md: выполнена повторная синхронизация массива RAID mdX
[150695.092285] md: mdX: выполнена повторная синхронизация.

Это также выглядит так, как будто проверка данных ничего не сделала.

Вопросы

Как вызвать реальную проверку данных?
Предположим, что диск не неисправен – как обновить массив?
Если диск был неисправен (т.е. обновление наткнулось на ошибку сразу) – как бы я это заметил? Я предполагаю, dmesg должен показать некоторые ошибки ввода-вывода? (Я их не вижу…)

Информация о системе

Я использую Armbian на основе Ubuntu 16.04.4 LTS. Версия LVM:

root@picard:~# lvm version
  Версия LVM:     2.02.133(2) (2015-10-30)
  Версия библиотеки: 1.02.110 (2015-10-30)
  Название драйвера:  4.37.0

Question 2

Вот несколько полезных команд:

lvchange --refresh VG/lvol0
lvconvert --repair VG/lvol0
lvs --all --options +devices,seg_size_pe,seg_size,copy_percent --segments

PS: Я знаю, что это довольно старый вопрос, но он оказался первым, когда я искал информацию, чтобы освежить память…

LVM2 Raid 1 “требует обновления”, но не обновляется и не восстанавливается.

Вопрос или проблема

Вопросы

Информация о системе

Ответ или решение

Теория

Пример

Применение