Восстановление массива Raid5 после отключения TPM

Вопрос или проблема

Я только что закончил копировать 8ТБ данных на новый массив raid5. Я только что отключил TPM в BIOS, и этот массив больше не читался. Мне хотелось бы исправить это, а не начинать все заново. Я попробовал пересобрать его и получил эту ошибку.

$ sudo mdadm --assemble /dev/md0 /dev/sda /dev/sdb /dev/sdd /dev/sde -f
mdadm: No super block found on /dev/sdd (Expected magic a92b4efc, got 00000000)
mdadm: no RAID superblock on /dev/sdd
mdadm: /dev/sdd has no superblock - assembly aborted

Вот что получилось, когда я проверил /sdd.

$sudo mdadm -E /dev/sdd
/dev/sdd:
   MBR Magic : aa55
Partition[0] :   4294967295 sectors at            1 (type ee)

Вот еще немного диагностики:

sudo mdadm --examine /dev/sd*
/dev/sda:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x1
     Array UUID : 7844a579:00996056:06c4e1dd:0e70ebcb
           Name : scott-LinuxMint:0  (local to host scott-LinuxMint)
  Creation Time : Thu Jan  2 12:50:26 2025
     Raid Level : raid5
   Raid Devices : 4

 Avail Dev Size : 7813772976 sectors (3.64 TiB 4.00 TB)
     Array Size : 11720659392 KiB (10.92 TiB 12.00 TB)
  Used Dev Size : 7813772928 sectors (3.64 TiB 4.00 TB)
    Data Offset : 264192 sectors
   Super Offset : 8 sectors
   Unused Space : before=264112 sectors, after=48 sectors
          State : clean
    Device UUID : 0febcd7e:7581f3c8:7b5962c5:cbddee7c

Internal Bitmap : 8 sectors from superblock
    Update Time : Fri Jan  3 22:05:37 2025
  Bad Block Log : 512 entries available at offset 24 sectors
       Checksum : 852d7efe - correct
         Events : 6116

         Layout : left-symmetric
     Chunk Size : 64K

   Device Role : Active device 0
   Array State : AAAA ('A' == active, '.' == missing, 'R' == replacing)
/dev/sdb:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x1
     Array UUID : 7844a579:00996056:06c4e1dd:0e70ebcb
           Name : scott-LinuxMint:0  (local to host scott-LinuxMint)
  Creation Time : Thu Jan  2 12:50:26 2025
     Raid Level : raid5
   Raid Devices : 4

 Avail Dev Size : 7813772976 sectors (3.64 TiB 4.00 TB)
     Array Size : 11720659392 KiB (10.92 TiB 12.00 TB)
  Used Dev Size : 7813772928 sectors (3.64 TiB 4.00 TB)
    Data Offset : 264192 sectors
   Super Offset : 8 sectors
   Unused Space : before=264112 sectors, after=48 sectors
          State : clean
    Device UUID : d2280c55:cf16ae93:aaa5e4a0:71e30dbb

Internal Bitmap : 8 sectors from superblock
    Update Time : Fri Jan  3 22:05:37 2025
  Bad Block Log : 512 entries available at offset 24 sectors
       Checksum : 3fc7a3f1 - correct
         Events : 6116

         Layout : left-symmetric
     Chunk Size : 64K

   Device Role : Active device 1
   Array State : AAAA ('A' == active, '.' == missing, 'R' == replacing)
/dev/sdc:
   MBR Magic : aa55
Partition[0] :   4294967295 sectors at            1 (type ee)
/dev/sdc1:
   MBR Magic : aa55
Partition[0] :   1836016416 sectors at   1936269394 (type 4f)
Partition[1] :    544437093 sectors at   1917848077 (type 73)
Partition[2] :    544175136 sectors at   1818575915 (type 2b)
Partition[3] :        54974 sectors at   2844524554 (type 61)
/dev/sdd:
   MBR Magic : aa55
Partition[0] :   4294967295 sectors at            1 (type ee)
mdadm: No md superblock detected on /dev/sdd1.
/dev/sde:
   MBR Magic : aa55
Partition[0] :   4294967295 sectors at            1 (type ee)
mdadm: No md superblock detected on /dev/sde1.

А диск, кажется, в порядке.

$sudo smartctl -d ata -a /dev/sdd
smartctl 7.4 2023-08-01 r5530 [x86_64-linux-6.8.0-51-generic] (local build)
Copyright (C) 2002-23, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Skyhawk
Device Model:     ST4000VX007-2DT166
Serial Number:    ZDH61N4Z
LU WWN Device Id: 5 000c50 0b4cf0507
Firmware Version: CV11
User Capacity:    4,000,787,030,016 bytes [4.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5980 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database 7.3/5528
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Fri Jan  3 23:01:40 2025 EST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                    was completed without error.
                    Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                    without error or no self-test has ever 
                    been run.
Total time to complete Offline 
data collection:        (  591) seconds.
Offline data collection
capabilities:            (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:    (   1) minutes.
Extended self-test routine
recommended polling time:    ( 633) minutes.
Conveyance self-test routine
recommended polling time:    (   2) minutes.
SCT capabilities:          (0x50bd) SCT Status supported.
                    SCT Error Recovery Control supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   075   064   044    Pre-fail  Always       -       30305794
  3 Spin_Up_Time            0x0003   094   093   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       276
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   095   060   045    Pre-fail  Always       -       3166340513
  9 Power_On_Hours          0x0032   069   069   000    Old_age   Always       -       27536h+49m+43.964s
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       104
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   099   000    Old_age   Always       -       7864440
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   081   047   040    Old_age   Always       -       19 (Min/Max 19/19)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       117
193 Load_Cycle_Count        0x0032   099   099   000    Old_age   Always       -       2608
194 Temperature_Celsius     0x0022   019   053   000    Old_age   Always       -       19 (0 6 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       27376h+00m+21.311s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       247975821685
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       124682775664

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

The above only provides legacy SMART information - try 'smartctl -x' for more

Дайте знать, если сможете помочь. Я очень новичок в этом деле.

Ответ или решение

Для восстановления массива RAID5 после отключения TPM в BIOS, важно понимать, что произошло и какие шаги предпринять для решения проблемы.

Проблема

Вы отключили TPM в BIOS, что привело к тому, что RAID5 массив стал нечитаемым. Пытаясь вручную собрать массив с помощью команды mdadm, вы получили ошибку: не найден суперблок на /dev/sdd, и запуск процедуры сборки был прерван.

Диагностика

  1. Отсутствие суперблока: При использовании команды mdadm --assemble, у вас возникла ошибка, связанная с отсутствием суперблока на диске /dev/sdd. Это указывает на то, что данные на этом диске недоступны для включения в массив RAID5.

  2. Анализ устройства /dev/sdd: Результаты команды mdadm -E /dev/sdd указывают на наличие MBR с типом ee, но RAID суперблок отсутствует.

Возможные причины

  1. Отключение TPM: В некоторых системах BIOS включает безопасность при помощи TPM, что может влиять на доступность аппаратных ресурсов, в том числе и дисков.

  2. Повреждение суперблока: Ваша проблема может быть связана как с отключением TPM, так и с потенциальным повреждением суперблока на одном из дисков.

Решение

  1. Проверка дисков: Убедитесь, что все диски физически исправны и корректно подключены. Используйте SMART-тесты для обеспечения здоровья всех накопителей. Ваши данные уже говорят о том, что диск /dev/sdd исправен.

  2. Попробуйте восстановить суперблок: Если диск был случайно переписан или суперблок был разрушен, попробуйте восстановить его. Для этого можно использовать команду mdadm с ключом --create с параметром --assume-clean, чтобы указать Linux, что данные на дисках сохраняются:

    sudo mdadm --create /dev/md0 --level=5 --raid-devices=4 --assume-clean /dev/sda /dev/sdb missing /dev/sde

    Замените "missing" на /dev/sdd, если уверены в его целостности.

  3. Проверка конфигурации BIOS: Убедитесь, что изменения в BIOS не мешают работе дисков и что RAID контроллер включен, если это актуально для вашей системы.

  4. Обратить внимание на fdisk/gdisk: Проверьте таблицы разделов на /dev/sdd, чтобы убедиться, что они соответствуют тем, которые ожидаются в структуре RAID.

  5. Резервное копирование: Прежде чем предпринимать дальнейшие шаги, важно создать резервную копию всех данных, которые возможно извлечь из целых дисков.

Заключение

Ваша проблема требует сложной диагностики и внимательного подхода, особенно если нет опыта работы с массивами RAID. Восстановление массива потенциально может требовать использования специфичных команд и инструментов. При необходимости, обратитесь к профессионалам или компаниям, специализирующимся на восстановлении данных из RAID массивов.

Если необходима дальнейшая помощь, можете детализировать проблему с указанием любых новых ошибок.

Оцените материал
Добавить комментарий

Капча загружается...