У меня оба жестких диска坏? Это не имеет смысла.

Вопрос или проблема

история…
я взял свои два диска seagate 32000641AS из старого дискового массива dns-323…
я установил их в свой dell Precision T5600, так как dns-323 был старым и стал утомительным в управлении.
затем я создал две отдельные XFS fs на них и смонтировал их.
диски, которые я заменил, были меньшими 500G… я скопировал данные с них на 300G зашифрованный USB-накопитель.
после того как я установил seagates, я скопировал данные обратно…
я использую один для локального резервного копирования, а другой для запуска виртуальной машины в virtualbox,
но оба диска имели одинаковые данные с USB.

я заметил это сегодня в системном журнале для обоих дисков.

smartd[809]: Устройство: /dev/sda [SAT], 19 В настоящее время нечитаемых (ожидающих) секторов
smartd[809]: Устройство: /dev/sda [SAT], 19 Оффлайн некорректируемых секторов
smartd[809]: Устройство: /dev/sda [SAT], 19 В настоящее время нечитаемых (ожидающих) секторов
smartd[809]: Устройство: /dev/sda [SAT], 19 Оффлайн некорректируемых секторов

тем не менее, никаких проблем с производительностью.

также, когда я копировал данные обратно с USB-накопителя, одна директория не копировалась… она всё время давала мне ошибку ввода-вывода… мне она не была нужна, поэтому я просто не копировал её обратно.

является ли это причиной, по которой я получаю одни и те же ошибки на обоих дисках? или это совпадение?

итак, я выполнил mkfs.ext4 на /dev/sdb1

и сейчас я запускаю
badblocks -s -v -n -f /dev/sda

Проверка на наличие битых блоков в режиме чтения-записи без разрушения
От блока 0 до 1953514583
Проверка на наличие битых блоков (тест чтения-записи без разрушения)
Тестирование с помощью случайного шаблона:   1.43% завершено, 36:36 прошло. (0/0/0 ошибок)

и до сих пор нет ошибок с badblocks, но затем я получил это в системном журнале

smartd[809]: Устройство: /dev/sda [SAT], 19 В настоящее время нечитаемых (ожидающих) секторов
smartd[809]: Устройство: /dev/sda [SAT], 19 Оффлайн некорректируемых секторов
smartd[809]: Устройство: /dev/sda [SAT], Атрибут резервирования SMART: 1 Уровень_ошибки_чтения_вырос с 116 до 117
smartd[809]: Устройство: /dev/sda [SAT], Атрибут использования SMART: 190 Температура_воздуха_Цельсий изменилась с 68 до 67
smartd[809]: Устройство: /dev/sda [SAT], Атрибут использования SMART: 194 Температура_Цельсий изменилась с 32 до 33
smartd[809]: Устройство: /dev/sdb [SAT], 35 В настоящее время нечитаемых (ожидающих) секторов
smartd[809]: Устройство: /dev/sdb [SAT], 35 Оффлайн некорректируемых секторов
smartd[809]: Устройство: /dev/sdb [SAT], Атрибут резервирования SMART: 1 Уровень_ошибки_чтения_вырос с 116 до 113
smartd[809]: Устройство: /dev/sdb [SAT], Атрибут использования SMART: 195 Исправленных_ошибок_аппаратного_обеспечения изменился с 35 до 49

Да!

Данные SMART генерируются самим прошивкой жесткого диска; на самом деле невозможно получить ложные срабатывания. Если данные SMART говорят, что у вас есть битые блоки на обоих дисках, то у вас действительно есть битые блоки. Некоторые небольшие участки механического диска испортились, и их невозможно восстановить. Это медленный процесс; это произошло в процессе старения в их предыдущем месте. Тот факт, что числа были идентичны в начале, интересен, но не шокирующий; диски, вероятно, происходят из одной производственной партии и, следовательно, имеют очень похожие характеристики. Если вы хотите убедиться, вы можете попробовать посмотреть обновления прошивки; возможно, что плохая прошивка может привести к тому, что устройство будет неверно определять ошибки. Тем не менее, вероятное объяснение простое; битые блоки на обоих дисках.

Теперь, это не конец света; вы потеряли некоторые данные (на диске), и диски, вероятно, потеряют больше или полностью выйдут из строя. Но вы можете продолжать их использовать, при условии, что эти данные также будут сохраняться на другом, вероятно, рабочем диске. В зависимости от вашей конфигурации RAID, должно поддерживаться две копии всякий раз, когда блок оказывается битым. Не объединяйте два старых диска в один RAID, так как при выходе из строя они выйдут вместе. И бегайте xfs_scrub (или что-то подобное в вашей файловой системе) по данным RAID на регулярной основе, чтобы обнаруживать больше битых блоков.

Ответ или решение

Плохие ли оба ваших диска? Профессиональный анализ

Судя по предоставленной информации, оба ваших диска действительно могут иметь проблемы. Давайте разберём ситуацию более детально.

1. Анализ состояния дисков

Из ваших логов видно, что оба диска, /dev/sda и /dev/sdb, выдают сообщения о недоступных секторах. Конкретно, вы наблюдаете:

  • 19 недоступных (ожидающих) секторов на /dev/sda,
  • 35 недоступных (ожидающих) секторов на /dev/sdb.

Эти ошибки указывают на то, что диск не может прочитать определенные сектора, и это значит, что диски могут быть повреждены.

2. SMART-данные

Данные SMART (Self-Monitoring, Analysis, and Reporting Technology) являются надёжным индикатором состояния жестких дисков. Тем более, что вы получаете повторяющиеся сообщения о неудачных попытках чтения и исправления на обоих устройствах. Это, скорее всего, не совпадение. Статистика SMART не может быть фальшивой, так как она собирается непосредственно с помощью встроенного программного обеспечения диска.

3. Ошибки ввода-вывода (I/O ошибки)

Вы упомянули о том, что возникла ошибка I/O при попытке создания копии одной директории. Это также указывает на неисправность диска. Даже если другие операции копирования проходили гладко, одно такое событие — это тревожный сигнал.

4. Тестирование с использованием badblocks

Результаты вашего тестирования badblocks существенны. Вы не получили ошибок в процессе теста. Однако стоит помнить, что наличие недоступных секторов уже говорит о существующих проблемах. Даже если текущая проверка не показывает ошибок, это не исключает возможности дальнейших проблем в будущем.

5. Почему все это происходит?

Причины проблемы могут быть разными:

  • Старение дисков. Если диски были использованы длительное время в старой системе, это могло привести к их физическому износу.
  • Происхождение. Если оба диска были произведены в одной партии, они могут иметь схожие слабые места, что объясняет одинаковые ошибки.
  • Объёмные операции чтения-записи. При копировании данных могут возникать неполадки диска, которые проявляются только под нагрузкой.

6. Рекомендации

  • Резервное копирование данных. Убедитесь, что ваша важная информация сохраняется на надежном носителе. Используйте другой диск для резервного копирования, если ваши текущие диски продолжают вызывать сомнения.
  • Замените диски. Не стоит рисковать, продолжая использование старых HDD, особенно для критически важных задач, таких как работа с виртуальными машинами.
  • Мониторинг состояния. Установите инструменты для периодического мониторинга состояния дисков. Используйте команды smartctl для сбора статистики и уведомлений о возможных сбоях.
  • Произведите диагностику. Рассмотрите возможность выполнить тестирование с использованием специализированных программ (например, GSmartControl или аналогичных).

Заключение

На основании анализа SMART-данных и поведения ваших дисков можно с большой долей уверенности утверждать, что оба диска могут иметь недостатки, и рекомендуется проявлять осторожность при их использовании. Ваша защита данных — приоритет, и любые подозрительные сигналы должны восприниматься серьезно.

Оцените материал
Добавить комментарий

Капча загружается...