Какое периодическое обслуживание я должен проводить на резервной копии HDD?

Вопрос или проблема

У меня есть множество директорий, сохраненных на внешнем жестком диске – не SSD, а магнитном диске.

Резервная копия сделана только на одном диске (да, я знаю, что дополнительный жесткий диск с копией был бы хорошей идеей; но сейчас это не так). Кроме того, на диске нет дублирующих копий файлов.

У жесткого диска (вариант 1) намного больше места, чем занимают мои файлы (вариант 2) меньше свободного места, чем занимают мои файлы (но все равно достаточно).

Я храню диск в его оригинальной упаковке: пластиковый пакет, в обертке, похожей на “яичную коробку”, в пластиковом ящике. Он хранится в комнате моего дома, где ящик никогда не подвергается солнечному свету или дождю и т. д.

Мой вопрос: следует ли что-то делать с диском периодически, чтобы максимизировать долговечность данных? Например, прочитать все на другое место, или прочитать и записать обратно, или как-то перемешать физические позиции данных на диске, или даже трясти диск, меняя его физическое положение, включать его, ничего не делая и т. д. Я хотел бы получить ответ для обоих описанных мной вариантов.

Примечания:

  • Я предпочел бы не делать этот вопрос конкретным для одного бренда жестких дисков, но если вам нужно знать – это Toshiba STOR.E basics 750 GB. Не мой выбор, мне просто нужно работать с этим.
  • В руководстве жесткого диска ничего не сказано по этому вопросу.
  • Резервная копия представляет собой состояние этих папок в какой-то момент в прошлом. Предположим, важно сохранить это состояние таким, каким оно есть, и что нет “мастер-копии” тех же данных.
  • Хотя это, вероятно, не имеет отношения к вопросу, не катастрофически плохо, если эти файлы будут утеряны, я просто хотел бы увеличить ожидаемую долговечность.
  • даже если у меня было бы две копии на двух жестких дисках, вопрос был бы так же актуален: какие операции по обслуживанию я должен проводить на каждом из них отдельно?

Поскольку это, похоже, было упущено большинством авторов здесь, это мой рекомендуемый ответ на конкретные ваши вопросы, используя этот отличный пост, Какой носитель следует использовать для долгосрочного, объемного хранения данных (архивирования)? в качестве руководства. Я не буду повторно цитировать ссылки и исследования оттуда, так как он сделал отличную работу, и чтение всего поста лучше, чем краткое изложение в этом случае.

Ограничивая себя одним жестким диском в холодном хранилище (офлайн), при двух предложенных вариантах вам следует подключать диск каждые пару лет или около того и включать его. Главная причина для этого – сохранить смазку в шпинделе от затвердевания и заклинивания. Смазка в шпинделе затвердеет со временем, и периодическое вращение диска может значительно затянуть этот процесс. Если вы хотите получить представление о важности смазки для жесткого диска, посмотрите, сколько усилий Minebea, производителя моторов для жестких дисков, вкладывает в свои исследования по этому поводу в этом отчете.

Пока диск подключен, вы также можете выполнить несколько диагностик SMART для поиска признаков надвигающегося сбоя как в электронике, так и в аппаратном обеспечении или в пластинах. Хотя, из исследований, представленных на FAST’07 от Google и Университета Карнеги-Меллона {приз получившего ‘Лучшую работу’ в том году}, тест SMART может быть показателем сбоя, но ‘прохождение’ теста может не быть показателем хорошего состояния. Тем не менее, проверка не повредит. Да, это старое исследование, но никто не заменил его на что-то новее.

Работа диска в течение некоторого времени и доступ к данным также обновят силу магнитных полей, удерживающих данные. Некоторые могут утверждать, что это не нужно на основании множества анекдотических свидетельств, но исследования показывают, что ослабление магнитных полей возможно. Я представляю три статьи из Университета Висконсин-Мэдисон: Паритетное загрязнение, Повреждение данных и Повреждение указателя диска.
После прочтения этих статей вы можете решить, насколько их выводы угрожают вашим данным и сколько усилий стоит приложить для защиты от этого.

Предлагаемая процедура обслуживания

Я не знаю, какую ОС вы используете, какие инструменты у вас есть или предпочитаете, или какую файловую систему вы выбираете. Поэтому мои предложения будут только общими, позволяющими вам выбрать инструменты, которые наилучшим образом соответствуют вашей конфигурации и предпочтениям.

Первое – это настройка для хранения. Прежде чем сохранять файлы на жестком диске, создайте их архивы. Это не подразумевает сжатия и не избегает его. Выберите формат архива, который обеспечит вам восстановление ошибок или ‘самовосстанавливающиеся’ возможности. Не создавайте один огромный архив, скорее архивируйте вещи, которые принадлежат друг к другу, создавая библиотеку архивов. Если вы выбираете сжатие, убедитесь, что оно не мешает возможности восстановления ошибок. Для большинства форматов музыки, видео, фильмов и изображений нет смысла делать сжатие. Такие форматы файлов уже сжаты, и попытки сжать их редко дают прирост пространства, иногда создавая большее количество файлов, и тратит ваше время и вычислительную мощность. Тем не менее, архивируйте их для вышеуказанного восстановления ошибок. Затем создайте контрольную сумму для каждого архивного файла, используя алгоритм дайджеста на ваш выбор. Безопасность здесь не является проблемой, просто проверка целостности файла, поэтому MD5 должно быть достаточно, но подойдет и что-то другое. Сохраните копию контрольных сумм с архивными файлами, и в другом месте на том же жестком диске – возможно, в отдельной директории для общей коллекции контрольных сумм. Вся эта информация сохраняется на диске. Далее, и это довольно важно, также сохраните на этом жестком диске инструменты, которые вы использовали для создания контрольных сумм и восстановления архивов (и для их распаковки, если вы использовали сжатие). В зависимости от вашей системы это могут быть сами программы, или возможно понадобятся их установщики. Теперь вы можете хранить жесткий диск, как вам угодно.

Второе – это хранение. Современные жесткие диски относительно защищены от физических ударов (тряски и ударов), но нет смысла и усиливать это. Храните его практически так, как вы упомянули в своем вопросе. Я бы добавил избегать зон, где он может подвергнуться электромагнитным воздействиям. Не храните его в одной комнате с вашим распределительным щитом или над радио, например. Ураган за несколько миль – это то, от чего вы не можете уйти, но пылесос и электрические устройства – это избежать можно. Если вы хотите получить крайние меры, получите экран Фарадея или мешок Фарадея для него. Из предложенных вами два подлинных совета бессмысленны или плохи. Изменение его физического положения во время хранения не повлияет на что-то значительное, а тряска может повредить, не должна, т.к. большинство дисков имеют хорошую защиту от ударов, но это возможно.

Последние меры – это периодические проверки. В соответствии с тем графиком, который вы выберете, ежегодно или раз в полгода, например, доставайте его из хранения и снова подключайте к компьютеру. Выполните тест SMART и действительно прочитайте результаты. Будьте готовы заменить диск, когда результаты SMART покажут вам, что это необходимо, не “в следующий раз”, а “в этот раз”. Пока он подключен, проверьте все архивные файлы по сравнению с их контрольными суммами. Если что-то не проходит проверку, попробуйте использовать возможности восстановления ошибок формата архива, чтобы восстановить этот файл, воссоздайте архив и его контрольную сумму и сохраните его снова. Поскольку вы также указали вариант 2, как имеющий “достаточное количество” свободного места, скопируйте архивы в новые директории, а затем удалите оригиналы. Просто “перемещение” их может не переместить их вообще. На многих новых файловых системах перемещение файла изменит, в каком каталоге он будет перечислен, но содержимое файла останется там же. Копируя файл, вы заставляете его записываться в другое место, затем можете освободить пространство, удалив оригинал. Если у вас много архивных файлов, ни один из них не должен быть настолько велик, чтобы заполнить свободное место на жестком диске. После того как вы проверили или восстановили все файлы и переместили любые из них, восстановите упаковку и положите обратно в хранилище до следующего раза.

Дополнительные вещи, на которые стоит обратить внимание. Когда вы обновляете свою систему или, что еще хуже, переходите на другую ОС, убедитесь, что у вас по-прежнему есть возможность читать этот жесткий диск в новой конфигурации. Если у вас есть что-то, кроме обычного текста, убедитесь, что вы не потеряете возможность прочитать файл так, как он был сохранен. Например: документы MS-Word могут содержать уравнения, созданные в одном формате, новейшие версии не могут их считать. Смотрите эту проблему. Однако Word не единственный возможный источник проблем, и даже форматы Open Source не гарантируют, что ваши данные будут защищены от будущих изменений. Для серьезного промаха в этой области прочитайте о провальном проекте Digital Domesday Book project. Поскольку появляются новые технологии, подумайте о том, чтобы обновить свою коллекцию. Если у вас есть фильмы, сохраненные в виде файлов AVI, а вам больше нравятся MKV, конвертируйте их. Если у вас есть документы для обработки текста и вы обновили свою программу, пересохраните архивные в новом формате.

С профессиональной точки зрения ваши варианты следующие:

  1. Молитесь.
  2. Создайте несколько копий на нескольких устройствах.

В вашем “варианте 1” (намного больше места) вы могли бы лишь несколько увеличить свои шансы, создав несколько копий на одном и том же оборудовании, но факт в том, что оборудование ломается, и довольно часто это делает весь диск нечитаемым. Одна копия не является жизнеспособной стратегией резервного копирования.

Мне неясно, является ли это фактической резервной копией (файлов на основном устройстве) или архивом (файлов, удаленных с основного устройства). Дополнительная копия более важна, если вам интересен архивный случай – в случае с резервной копией теоретически имеется первичная копия, поэтому вам необходимо иметь как минимум два сбоя, прежде чем вам совсем не повезет.

Если у вас есть больше свободного места, чем использует резервная копия данных – ваш вариант 1 в вопросе – или если у вас есть несколько копий данных, у меня есть идея, которая “что-то сделает”; если вы думаете, что SpinRite действительно помогает с “обслуживанием” жестких дисков и/или хотите полностью перезаписать и затем снова записать каждый бит ваших данных, это позволит сделать.

Должны ли вы что-либо делать или нет, я не слишком уверен… битовая ржавчина или порча данных действительно существует, и такие вопросы, как это здесь на superuser и это на serverfault кажутся советующими резервные копии или, может быть, коррекцию ошибок или безотказный RAID (но для единственного жесткого диска я бы выбрал несколько резервных копий и проверки хешей/CRC и не волновался бы о том, что делать, если RAID выйдет из строя).

Я наклоняюсь к более простому и ленивому “ничего не делать” подходу, но следующее по крайней мере является хорошей “идей, чтобы убедиться, что я все еще могу прочитать свои данные раз в год, и неплохо бы их перезаписать тоже”.

Эмуляция некоторых функций обслуживания SpinRite в Linux

Множество людей, кажется, уверены, что SpinRite действительно работает, но это не бесплатно, и я использую Linux, поэтому я прослушал видео Стива Гибсона КАК работает SpinRite? и он говорит, что одна из вещей, которые делает SpinRite, это:

  • Читает весь диск
  • Переворачивает биты и записывает их
  • Снова читает их
  • Переворачивает биты обратно и записывает их
  • Снова читает их

Если диск обнаруживает какие-либо (небольшие) проблемы, это должно “вынудить сам диск заменить плохие сектора на хорошие.”

Как часто вы должны это делать? Стив говорит “никто не знает, как часто это нужно делать, но каждые несколько месяцев должно быть достаточно часто”. Я просто предположу, что это каждые 6 месяцев или каждый год.

badblocks

Процесс чтения/переворачивания/чтения/переворачивания звучит почти идентично тому, что badblocks делает, когда использует свой режим тестирования записи (-w опция), только он на самом деле не “переворачивает” ваши данные, а делает деструктивную запись, чтение и переворот всех битов на разделе:

С этой опцией badblocks сканирует на наличие поврежденных
блоков, записывая некоторые шаблоны (0xaa, 0x55, 0xff, 0x00) на
каждый блок устройства, читая каждый блок и сравнивая
содержимое.

Совпадение не случайно, эти шаблоны в двоичном: 10101010, 01010101, 11111111, 00000000.

Итак, badblocks записывает, читает и переворачивает биты довольно тщательно, и он тоже бесплатный. Если у вас есть mke2fs, запустите badblocks (с badblocks -cc), это сохранит список поврежденных блоков, чтобы ext2/3/4 избегали их, если таковые будут найдены.

Недостаток в том, что тестирование записи badblocks является деструктивным, поэтому вам потребуется по крайней мере два раздела для этого, чтобы сохранить и записать ваши данные снова.

  • Храните две копии ваших данных на жестком диске, каждая на РАЗНЫХ РАЗДЕЛАХ!.
    Это позволяет перезаписывать каждый бит на одном разделе с 10, 01, 11, 00, что удваивает ваши шансы на восстановление, если возникнут проблемные области. И ведите список контрольных сумм/хешей для своих файлов данных, таких как CRC32 или MD5 (хотя MD5/SHA значительно медленнее, чем CRC, и случайные ошибки не должны быть упущены CRC)
  • Каждые несколько месяцев:
    1. Читать свои резервные копии и проверять, что они все еще соответствуют контрольным суммам/хешам.
    2. “Псевдо”-перевернуть один раздел с badblocks -w или mke2fs -cc (Только ОДИН раздел, не перезаписывайте все ваши данные, просто одну копию!)
    3. Скопируйте ваши данные обратно на свежеперевернутый раздел
    4. “Псевдо”-перевернуть другой раздел (тот, который еще не был перевернут)
    5. Скопируйте ваши данные обратно на этот свежеперевернутый раздел

Это похоже на форматирование и копирование ваших данных обратно, но быстрое/стандартное форматирование обычно не записывает на каждый сектор, так что вы можете не изменить/перевернуть многие биты.


Лучшее решение всегда несколько копий на нескольких устройствах.
Я читал, что оптические носители могут быть читабельны в течение 10, 20, возможно даже 50+ лет, и две идентичные диски/ISO будут совместимы с gddrescue (ниже).
Облачное хранилище часто бесплатно для нескольких Гб, хранение файлов там (опционально зашифрованных) может быть хорошей идеей, особенно если объемы продолжают расти.

Кроме того, сохранение ваших файлов в архиве с коррекцией ошибок может помочь, если возникнут какие-либо ошибки, но потеря одного файла из миллиона может не быть такой большой проблемой, как потеря целого архива из миллиона файлов. Если существует какое-то отдельное программное обеспечение для коррекции ошибок, как ECC-CRC, это может помочь, но я не знаю о таком, и дополнительная копия данных была бы еще лучшей.


Косвенно это связано, SpinRite также “очень старается” читать данные из плохого сектора жесткого диска, читая с разных направлений и скоростей, что также звучит очень похоже на gddrescue, на случай (или когда) вы столкнетесь с проблемами при чтении ваших данных. gddrescue также может читать из двух копий данных с ошибками и, надеюсь, собрать одну полную хорошую копию, и я собираюсь сделать две (или более) идентичные копии вашего раздела данных с dd, но затем, если badblocks найдет какие-либо плохие сектора, вы не сможете их избежать, так как это изменит идентичные копии.

Магнитные носители могут ухудшаться со временем, и это приводит к появлению плохого бита или сектора.
Одним из решений может быть обновление магнитной части раз в несколько лет.

Самый простой способ – скопировать и переписать весь жесткий диск, хотя это может не обновить адрес сектора, который является “заголовком” сектора, который позволяет встроенному программному обеспечению позиционировать головку к нему. Обновление адреса сектора может потребовать повторного форматирования диска (глубокое форматирование – не быстрое).

Альтернативным решением является использование продуктов для регенерации дисков.
Эти продукты сканируют диск на физическом уровне, считывая каждый сектор и его адрес и переписывая оба, чтобы обновить магнитные данные.

Дополнительный бонус в том, что в случае ошибки чтения эти продукты попытаются несколько методов чтения, чтобы сохранить данные, отметят сектор как плохой и переназначат его на запасной сектор (у большинства жестких дисков есть запасные сектора), чтобы данные были сохранены.

Вот несколько таких продуктов :

  • DiskFresh (бесплатно для частного и некоммерческого использования или $25) – часть Puran Utilities, которая получает хорошие отзывы.
    Он только информирует вас, если есть поврежденные/плохие сектора и не делает расширенного восстановления.

  • SpinRite ($89 с гарантией возврата денег) – он не обновлялся несколько лет, хотя несколько лет назад он спас мой диск.
    Я бы не доверял гарантии возврата денег, так как продукт довольно старый.

  • HDD Regenerator ($89.99 с гарантией возврата денег) – более новый продукт с хорошими отзывами.

Для полноты картины для читателей, ищущих безопасное долговременное хранение, я бы отметил, что существуют продукты “запиши однажды, читай вечно”, известные как M-DISC или Archival Disc.

Никакое обслуживание не должно проводиться вовсе. Повторное подключение диска и его включение представляет собой больший риск, чем его постоянная работа, и намного больший, чем если бы он спал в коробке. Поэтому слишком частая проверка действительно увеличивает вероятность повреждения.

Как вы храните его отлично, но не забывайте о температуре. Не допускайте экстремальных значений. Что именно вы используете в качестве резервного диска? Некоторые намного более надежны, чем другие.

Что-то вы можете сделать, поскольку вы заявили, что у вас достаточно места, сделайте две копии одних и тех же данных на жестком диске. В случае поврежденных секторов вы будете в безопасности. Насколько я заметил, большинство дисков сегодня страдают от повреждений секторов в начале диска (первые несколько Гб), но это в основном из-за операционной системы (это не ваш случай). Обычно поврежденные сектора возникают в большинстве случаев, сгруппированных вместе, поэтому наличие двух копий данных на одном диске действительно помогает.

Если у вас есть всего несколько критически важных файлов, было бы разумно сохранить их и в другом месте для надежности. Создайте зашифрованный архив и положите его на флешку или передайте кому-то, кому вы доверяете.

Я всегда считал, что хитрость состоит в том, чтобы предположить, что ваш диск сломается. Есть некоторые способы повреждения, которые случайны. Для не случайных повреждений – здесь два аспекта – диск и файловая система.

Хотя это немного необычный источник – этот reddit-тред предполагает, что один данный бит может перевернуться примерно через 10 лет или около того, хотя я подозреваю, что один перевернутый бит будет тихо обрабатываться ECC – либо в файловой системе, либо на самом диске.

Вы обычно можете найти возрастные “масштабные” проблемы с периодическими тестами SMART – рассматривая такие вещи, как ожидающие перераспределенные сектора. При относительно коротких условиях эксплуатации вы не должны видеть много проблем, но мы здесь немного параноидальны. Еще раз, пока дела не станут действительно плохими, ваш диск, скорее всего, тихо справится с этим в ECC.

Наконец, есть риск внезапной смерти диска или контроллера. Теоретически, вы можете нежно относиться к диску, работая при контролируемых, холодных температурах, которые известны тем, что максимизируют срок жизни диска, но я никогда действительно не заботился о своих дисках.

Диски должны иметь определенное количество включений и выключений (здесь это не проблема), и я подозреваю, что правильное извлечение диска позволит данным быть сброшенными на диск, и есть инструменты для выключения дисков. Я думаю, что hdparm бы это сделал, но мне нужно немного больше протестировать.

Наконец, я выбираю диски, которые известно долговечны. Я также вращаю внешние диски каждые несколько лет, перемещая более старые диски вниз по иерархии.

В теории файловые системы, такие как ReFS и zfs, предназначены для снижения риска потери данных благодаря интегральным контрольным суммам. По крайней мере, у вас не будет файлов, тихо поврежденных. Выбор их вместо более обычных файловых систем вероятно снизит шанс потери данных, но пока нет ‘простого’ способа их развернуть на настольной ОС. ZFS имеет довольно неплохую поддержку в Linux и никакой на Windows, и ReFS еще не дошел до настольной Windows. Эти системы разрабатывались с расчетом на наличие нескольких копий на одном или нескольких дисках для фактического восстановления, так что здесь они не подойдут.

Как мы видим из рекомендаций других, один источник резервного копирования не является надежным решением, ЕСЛИ резервная копия имеет какое-либо значение. Опыт с электронными устройствами научил многих из нас (не самым простым образом), что речь идет не о том, ЕСЛИ, а о том, КОГДА устройство резервного копирования выйдет из строя.

Жесткие диски, по своей сути, предназначены для относительно краткосрочного хранения данных. Две отличные статьи, https://serverfault.com/questions/51851/does-an-unplugged-hard-drive-used-for-data-archival-deteriorate и Каково время, пока неиспользуемый жесткий диск потеряет свои данные? обсуждают срок службы данных, хранящихся на жестком диске. Как и всегда, ваши результаты могут варьироваться.

Решение резервного копирования, которое вы описываете, лучше, чем отсутствие резервной копии, но у вас все равно есть единственная точка отказа. С вашей резервной копией на одном устройстве вы рискуете потерять ЕДИНСТВЕННУЮ копию ваших данных из-за пожара, наводнения, кражи, взрыва, сбоя устройства и т. д. Итак, вопрос: стоят ли ваши усилия по сохранению резервной копии трат времени?

Чтобы достичь своей цели, т.е. надежной резервной копии, требуется больше одной резервной копии. Если вы собираетесь хранить данные на жестком диске, ваша резервная копия требует периодического “обновления”, чтобы противодействовать долгосрочному разложению данных, присущему жестким дискам. Если бы я был на вашем месте, я бы купил второй резервный диск, аналогичный первому, и раз в год копировал данные с основного диска на второй. В конце каждого года переверните процесс и скопируйте данные со второго диска обратно на первичный. Полоскать и повторять каждый год. Один из дисков должен оставаться вне вашего места, вдали от вашего расположения, чтобы избежать потерь вашей единственной копии данных из-за природного бедствия.

Я не смог найти никаких достоверных, научно обоснованных данных по этому вопросу. В общем, есть два аспекта этой проблемы:

  1. Битовая ржавчина: различные физические эффекты могут перевернуть биты, хранящиеся в магнитных доменах, записанных на пластинах HDD, тем самым повреждая данные на HDD. (диск по-прежнему полностью функционален)
  2. Механические проблемы: включение и выключение диска, поддержание пластин в движении или стационарном состоянии, условия хранения и естественное старение могут сделать диск непригодным через некоторое время. (данные могут оставаться целыми и восстановимыми)

Битовая ржавчина обсуждается в этом треде от 2008 года. Пользователь arnaudk написал:

Сколько я могу узнать, похоже, что при термически-обусловленном демагнетизации вам потребуется около 22 лет (детали ниже), чтобы потерять свои данные, если жесткий диск просто сидит в неподвижном состоянии при комнатной температуре в темном углу. На самом деле это время будет немного короче из-за механических вибраций и внешних магнитных полей, возникающих из-за всего, начиная от мотора самого жесткого диска и заканчивая грозами на расстоянии 50 км.

Приемлемые уровни потери сигнала варьируются в зависимости от проектирования системы, но обычно составляют от 10% до 20% [ref4], поэтому потребуется (-1/326000)*ln(0.8) = около 22 лет, чтобы весь битовый домен ослабел на 20%, что могло бы привести к возможной потере данных исключительно из-за термических эффектов демагнетизации.

(прямой ссылкой на сообщение)

Это единственная оценка, которую я смог найти. Если это правильно, тогда вы могли бы безопасно перезаписывать весь диск каждые 5 лет, чтобы “обновить” данные.

Механические проблемы – это еще большая загадка. Backblaze – это компания, использующая тысячи жестких дисков потребительского класса в своем дата-центре и регулярно публикующая обновления о их состоянии. Согласно их оценкам, после 4 лет непрерывной работы 24/7 20% жестких дисков вышли из строя, и если тренд продолжится, то через 6 лет половина из них будет потеряна. Это более или менее в соответствии с цифрами из это белая бумага Google. Однако это не стандартный случай использования жесткого диска, и мы едва ли можем сравнивать его с диском, который сидит оффлайн в коробке. Я не осведомлен о каких-либо исследованиях, которые бы касались этого случая.

Все в целом, если вам действительно важны эти данные, вы должны хранить две копии данных и переносить их на новый, протестированный на нагрузку жесткий диск каждые 5 лет или около того. Это должно сохранить магнитные домены и аппаратное обеспечение в разумной свежести, но ваши результаты могут варьироваться.

Увеличение срока службы жесткого диска – это одно из дел, в котором вы получаете лучший результат, делая наименьшее. Разупакуйте его, разместите на прочной платформе вдали от интенсивного тепла, влаги, пыли или радиации, где достаточно воздушной циркуляции и наименьшая вероятность того, что ребенок случайно его разобьет. Вы можете ожидать длительного срока службы вашего жесткого диска до момента, когда вам придется обновить его.

Возможно, трудно принять, что, будучи потребителем, вы можете сделать очень немного (даже ничего), чтобы увеличить долговечность жесткого диска. Но, безусловно, есть способы улучшить шансы на выживание ваших данных: ReFS, RAID и резервное копирование.

Поверьте мне, индустрия работает над улучшением долговечности самих данных, а не жестких дисков.

HD Sentinel добавил новую функцию, которая, похоже, воспроизводит задачу перезаписи, о которой говорится по этой теме, всего за 30 долларов вместо 90 долларов, которые сейчас есть на этом рынке (если я не могу использовать Puran Disk Refresh Utility)

Хотя некоторые говорят, что нет необходимости в этом, если мы периодически используем диск, и именно это я делаю, долгосрочное хранение, подключая диски раз в месяц, чтобы добавлять новые данные, это достаточно?

На моем опыте частое переключение между стартом/остановкой (бездействие/работа) плохо сказывается на жестких дисках, лучше держать их всегда крутящимся, если вам не жалко, что это будет потреблять больше электричества. (Я тестировал это на нескольких системах с теми же жесткими дисками из одного магазина, где некоторые жесткие диски всегда работали, а другие – нет)

На всех серверах мы регулярно проводим “краткий” тест SMART один раз в день и “долгий тест” на выходных, который, по крайней мере, может дать представление о том, когда жесткий диск выйдет из строя. Если вы используете ZFS, то выполнение регулярной “проверки” раз в месяц для корпоративных жестких дисков достаточно, а раз в две недели для потребительских жестких дисков.

Хороший, приличный источник питания – это тоже один из факторов для здорового жесткого диска, плюс ИБП, который предотвращает случайные электрические неожиданности для жесткого диска. (Внешние жесткие диски получают питание от компьютера, так что это относится к ним тоже)

Вибрация/тряска, пока жесткий диск работает, также не полезна для него. (Особенно важно для портативных жестких дисков – не двигайте их, пока они работают)

Кроме того, выбор правильной модели для конкретных задач жестких дисков (видеонаблюдение, NAS, настольный…) – это способ продлить их жизнь

В общем, если это система Linux, то никакое обслуживание вообще не требуется. Системы Windows, кажется, теряют кластеры гораздо чаще, чем Linux. По этой причине разумно выполнять chkdsk каждые 3-6 месяцев на системе Windows.

Все детали жесткого диска с втулками и подшипниками в конечном итоге будут иметь некоторые смещения из-за износа после 5 или более лет постоянного использования. Лучший способ, который я нашел, чтобы не проснуться однажды с поврежденным разделом – повторно форматировать как минимум каждые 5 лет.

В общем, у меня есть что-то, что требует серьезного обновления моей системы каждые пару лет, поэтому я форматирую в это время (обязательно используйте полное форматирование с проверкой ошибок). Моя память достаточно хороша, чтобы заметить снижение объема жесткого диска после форматирования; это указывает на то, что диск выходит из строя. Если кто-то не знаком со своей системой, он может вести записи о точном количестве байтов после форматирования.

В какой-то момент “дополнительные” сектора будут использованы (специально для этой цели), и система начнет отмечать “нормальные” области на диске как непригодные – количество байтов будет сокращаться. На этом этапе диск следует утилизировать – вероятно, уже будут потери данных. Это нормально для жесткого диска, который держится включенным 24/7 в течение 5-10 лет.

Единственный способ продлить срок службы диска – это настроить систему так, чтобы она выключила его через несколько минут бездействия. У меня есть диск на 2 Тб, который я использую как основной резервный, и он настроен на отключение через 10 минут бездействия. Я могу проходить 30 дней, не обращая на него внимания, и он остается отключенным. Ему требуется 20 секунд, чтобы включиться и стать читаемым, если это необходимо.


Таким образом, если обсуждение ограничивается сроком службы, а не периодическим включением; тогда есть хорошо освещенные экологические проблемы, затронутые в ссылке выше “Сколько времени до того, как неиспользуемый жесткий диск потеряет свои данные?” Единственным вопросом, который я не видел в этом обсуждении о не включенных электронных устройствах, является срок службы конденсаторов. Они длятся дольше при периодическом использовании; иначе они высыхают; такая структура конденсаторов (и батарей) является электролитической.

Правило хорошего тона для срока службы конденсаторов составляет 20 лет. Это называется правилом 20/20. Вероятность выхода конденсаторов из строя будет наивысшей в течение первых 20 минут использования, затем статистическая вероятность значительно возрастет после 20 лет использования. Но они выходят из строя гораздо раньше, чем через 20 лет, если не используются.

Самой распространенной (в общем) причиной выхода из строя в электронных компонентах являются конденсаторы. Конденсаторы (электрохимические), затем индукторы и трансформаторы (электромеханические) выходят из строя, независимо от того, использованы они или нет.


Компания под названием Backblaze собрала данные о сбоях жестких дисков. Она опубликовала эти данные в блогах компании, подчеркивая, какие диски от каких производителей выходят из строя чаще, чем другие.

В недавнем блоге она опубликовала данные, указывающие на то, какие 5 характеристик SMART указывают на надвигающийся сбой диска:

Из опыта, следующие 5 характеристик SMART указывают на предстоящий сбой жесткого диска:

    SMART 5 – Reallocated_Sector_Count.
    SMART 187 – Reported_Uncorrectable_Errors.
    SMART 188 – Command_Timeout.
    SMART 197 – Current_Pending_Sector_Count.
    SMART 198 – Offline_Uncorrectable.

Вы можете выбрать подмножество, например, эти 5 статистик, так как они последовательны среди производителей и хорошо предсказывают сбой.

Статья продолжается рекомендовать:

SMART 5: Reallocated_Sector_Count
1-4 следите за этим, более 4 – замените

SMART 187: Reported_Uncorrect
1 или более – замените

SMART 188: Command_Timeout
1-13 следите за этим, более 13 – замените

SMART 197: Current_Pending_Sector_Count
1 или более – замените

SMART 198: Offline_Uncorrectable
1 или более – замените

Ответ или решение

Регулярное обслуживание жестких дисков (HDD) для максимизации долговечности резервного копирования

Жесткие диски (HDD), обеспечивающие физическое хранение данных, имеют свои уникальные потребности в обслуживании, особенно когда речь идет о резервных копиях. Данную информацию следует учитывать для поиска оптимальных методов продления срока службы ваших данных, особенно если у вас только одна резервная копия. В данном ответе мы рассмотрим различные аспекты обслуживания HDD и предложим подходы, соответствующие вашим условиям хранения и использованию.

Аспекты, способствующие долговечности данных на HDD

  1. Общее состояние хранения:

    • Убедитесь, что HDD хранится в чистом и сухом месте, подальше от источников тепла и прямых солнечных лучей. Оптимальная температура для хранения диска составляет 15-25 градусов Цельсия.
    • Избегайте хранения HDD в местах с высокой электромагнитной активностью и сильной вибрацией – такие условия могут привести к повреждению данных.
  2. Периодическое использование:

    • Рекомендуется извлекать HDD из хранения и подключать его к компьютеру, примерно, раз в два года. Это поможет «размять» внутренние механизмы диска и предотвратить затвердевание смазки на шпинделе. Использование устройства также позволить перезаписать магнитные поля, что может помочь в поддержании данных «здоровыми».
  3. Проверка состояния диска:

    • Во время подключения диска, выполните проверку с использованием алгоритма SMART для обнаружения потенциальных проблем с диском. Обратите внимание на ключевые параметры, такие как количество перераспределенных секторов (Reallocated Sector Count) и количество текущих ожидающих секторов (Current Pending Sector Count). Значительное увеличение этих значений может быть признаком отказа диска.
  4. Сравнение и верификация данных:

    • Во время подключения HDD проверьте целостность файлов. Используйте контрольные суммы (например, MD5) для проверки данных. Сравнение контрольных сумм позволит вам убедиться, что данные не повреждены. В случае обнаружения поврежденных файлов используйте инструменты восстановление данных, если такие имеются.

Специфические действия для продления срока службы и надежности данных

  • Копирование и перезапись данных:

    • Чтобы «обновить» данные на диске, вы можете перекинуть данные в другую папку в пределах того же HDD, а затем вернуть их обратно. Это действие необходимо для того, чтобы заставить привод записать информацию по другим физическим адресам на диске.
    • Если в наличии есть свободное пространство, создайте дополнительную резервную копию внутри того же HDD или на другом носителе.
  • Использование специализированных программ для обслуживания:

    • Программы, такие как SpinRite или HDD Regenerator, могут предложить дополнительные функции по считыванию и записи данных для ремонта потенциально проблемных секторов.
  • Обновление формата и структур данных:

    • При смене операционной системы убедитесь, что у вас есть возможность читать данные на новом SO. При необходимости обновления формата файлов в новых версиях программ, сделайте это для избежания проблем в будущем.
  • Резервные копии на дополнительных носителях:

    • В случае, если вы можете себе это позволить, создание дополнительных копий данных на нескольких HDD (несколько резервных копий и на других типах носителей, таких как SSD или облачное хранилище) значительно увеличит надежность.

Заключение

Итак, для максимизации долговечности ваших резервных копий на HDD важно не забывать о периодическом обслуживании и проверках. Рекомендуется, как минимум, раз в два года запускать HDD для проверки, использования и обновления данных, а также выполнять контрольные проверки с помощью Smart-тестов. Важно помнить, что отсутствие дополнительных резервных копий на других устройствах может создать риск потери данных. Надлежащая подготовка и регулярное обслуживание помогут вам минимизировать эти риски и продлить срок службы вашего жесткого диска.

Оцените материал
Добавить комментарий

Капча загружается...