У меня оба жестких диска坏? Это не имеет смысла.

Question 1

история…
я взял свои два диска seagate 32000641AS из старого дискового массива dns-323…
я установил их в свой dell Precision T5600, так как dns-323 был старым и стал утомительным в управлении.
затем я создал две отдельные XFS fs на них и смонтировал их.
диски, которые я заменил, были меньшими 500G… я скопировал данные с них на 300G зашифрованный USB-накопитель.
после того как я установил seagates, я скопировал данные обратно…
я использую один для локального резервного копирования, а другой для запуска виртуальной машины в virtualbox,
но оба диска имели одинаковые данные с USB.

я заметил это сегодня в системном журнале для обоих дисков.

smartd[809]: Устройство: /dev/sda [SAT], 19 В настоящее время нечитаемых (ожидающих) секторов
smartd[809]: Устройство: /dev/sda [SAT], 19 Оффлайн некорректируемых секторов
smartd[809]: Устройство: /dev/sda [SAT], 19 В настоящее время нечитаемых (ожидающих) секторов
smartd[809]: Устройство: /dev/sda [SAT], 19 Оффлайн некорректируемых секторов

тем не менее, никаких проблем с производительностью.

также, когда я копировал данные обратно с USB-накопителя, одна директория не копировалась… она всё время давала мне ошибку ввода-вывода… мне она не была нужна, поэтому я просто не копировал её обратно.

является ли это причиной, по которой я получаю одни и те же ошибки на обоих дисках? или это совпадение?

итак, я выполнил mkfs.ext4 на /dev/sdb1

и сейчас я запускаю
badblocks -s -v -n -f /dev/sda

Проверка на наличие битых блоков в режиме чтения-записи без разрушения
От блока 0 до 1953514583
Проверка на наличие битых блоков (тест чтения-записи без разрушения)
Тестирование с помощью случайного шаблона:   1.43% завершено, 36:36 прошло. (0/0/0 ошибок)

и до сих пор нет ошибок с badblocks, но затем я получил это в системном журнале

smartd[809]: Устройство: /dev/sda [SAT], 19 В настоящее время нечитаемых (ожидающих) секторов
smartd[809]: Устройство: /dev/sda [SAT], 19 Оффлайн некорректируемых секторов
smartd[809]: Устройство: /dev/sda [SAT], Атрибут резервирования SMART: 1 Уровень_ошибки_чтения_вырос с 116 до 117
smartd[809]: Устройство: /dev/sda [SAT], Атрибут использования SMART: 190 Температура_воздуха_Цельсий изменилась с 68 до 67
smartd[809]: Устройство: /dev/sda [SAT], Атрибут использования SMART: 194 Температура_Цельсий изменилась с 32 до 33
smartd[809]: Устройство: /dev/sdb [SAT], 35 В настоящее время нечитаемых (ожидающих) секторов
smartd[809]: Устройство: /dev/sdb [SAT], 35 Оффлайн некорректируемых секторов
smartd[809]: Устройство: /dev/sdb [SAT], Атрибут резервирования SMART: 1 Уровень_ошибки_чтения_вырос с 116 до 113
smartd[809]: Устройство: /dev/sdb [SAT], Атрибут использования SMART: 195 Исправленных_ошибок_аппаратного_обеспечения изменился с 35 до 49

Question 2

Да!

Данные SMART генерируются самим прошивкой жесткого диска; на самом деле невозможно получить ложные срабатывания. Если данные SMART говорят, что у вас есть битые блоки на обоих дисках, то у вас действительно есть битые блоки. Некоторые небольшие участки механического диска испортились, и их невозможно восстановить. Это медленный процесс; это произошло в процессе старения в их предыдущем месте. Тот факт, что числа были идентичны в начале, интересен, но не шокирующий; диски, вероятно, происходят из одной производственной партии и, следовательно, имеют очень похожие характеристики. Если вы хотите убедиться, вы можете попробовать посмотреть обновления прошивки; возможно, что плохая прошивка может привести к тому, что устройство будет неверно определять ошибки. Тем не менее, вероятное объяснение простое; битые блоки на обоих дисках.

Теперь, это не конец света; вы потеряли некоторые данные (на диске), и диски, вероятно, потеряют больше или полностью выйдут из строя. Но вы можете продолжать их использовать, при условии, что эти данные также будут сохраняться на другом, вероятно, рабочем диске. В зависимости от вашей конфигурации RAID, должно поддерживаться две копии всякий раз, когда блок оказывается битым. Не объединяйте два старых диска в один RAID, так как при выходе из строя они выйдут вместе. И бегайте xfs_scrub (или что-то подобное в вашей файловой системе) по данным RAID на регулярной основе, чтобы обнаруживать больше битых блоков.

У меня оба жестких диска坏? Это не имеет смысла.

Вопрос или проблема

Ответ или решение

Плохие ли оба ваших диска? Профессиональный анализ

1. Анализ состояния дисков

2. SMART-данные

3. Ошибки ввода-вывода (I/O ошибки)

4. Тестирование с использованием badblocks

5. Почему все это происходит?

6. Рекомендации

Заключение