49% состояния устройства от “#233 Индикатор износа медиапамяти” для Intel SSD DC S5400 Series 1.92 TB SSD плохо для потребителей, и возможно ли использование RAID на Linux?

Вопрос или проблема

Я использовал HDSentinel для Unix (Ubuntu 24.10), чтобы протестировать диск Intel SSD DC S4500 Series 1.92TB следующим образом:

root@stephen-All-Series:~# HDSentinel 
Hard Disk Sentinel для LINUX консоли 0.20c-x64.10851 (c) 2024 [email protected]
Начните с -r [reportfile], чтобы сохранить данные в отчет, -h для справки

Изучение конфигурации жесткого диска...

HDD Устройство  0: /dev/sda             
HDD Модель ID : INTEL SSDSC2KB019T7
HDD Серийный номер: PHYS737500DM1P9DGN
HDD Ревизия : SCV10121
HDD Размер     : 1831420 MB
Интерфейс    : S-ATA Gen3, 6 Gbps
Температура  : 21 °C
Максимальная Темп.: 21 °C
Состояние    : 49 %
Производительность  : 100 %
Время включения: 1355 дней, 22 часа
Оценочный срок службы: 112 дней
Всего записано: 5,206.45 TB
  Состояние твердотельного диска - ИДЕАЛЬНО. Проблемных или слабых секторов не найдено. 
  Состояние определяется конкретным атрибутом S.M.A.R.T. SSD:  #233 Индикатор износа носителя
    Рекомендуется часто создавать резервные копии для предотвращения потери данных.

Состояние было 49%, что было связано с “#233 Индикатор износа носителя”.

В продолжение этого, я выполнил следующее:

stephen@stephen-All-Series:~$ sudo smartctl -A /dev/sda
smartctl 7.4 2023-08-01 r5530 [x86_64-linux-6.11.0-9-generic] (локальная сборка)
Copyright (C) 2002-23, Брюс Аллен, Кристиан Франке, www.smartmontools.org

=== НАЧАЛО СЕКЦИИ ЧТЕНИЯ ДАННЫХ SMART ===
Структура данных атрибутов SMART, номер версии: 1
Специфические для поставщика атрибуты SMART с порогами:
ID# ИМЯ_АТРИБУТА          ФЛАГ     ЗНАЧЕНИЕ ХУЖШИЙ ПОР.D. ТИП      ОБНОВЛЕН  КОГДА_ПРОВАЛИЛСЯ СЫРОЕ_ЗНАЧЕНИЕ
  5 Перераспределенное_количество_секторов   0x0032   100   100   000    Старый_возраст   Всегда       -       0
  9 Часы_включения          0x0032   100   100   000    Старый_возраст   Всегда       -       32542
 12 Количество_перезапусков       0x0032   100   100   000    Старый_возраст   Всегда       -       33
170 Доступно_резервное_место 0x0033   100   100   010    Предаварийный  Всегда       -       0
171 Количество_неудач_программы      0x0032   100   100   000    Старый_возраст   Всегда       -       0
172 Количество_неудач_удаления        0x0032   100   100   000    Старый_возраст   Всегда       -       0
174 Количество_небезопасного_выключения   0x0032   100   100   000    Старый_возраст   Всегда       -       31
175 Тест_ёмкости_потери_питания     0x0033   100   100   010    Предаварийный  Всегда       -       2709 (225 7757)
183 Счетчик_снижения_SATA    0x0032   100   100   000    Старый_возраст   Всегда       -       0
184 Счетчик_ошибки_от_конца_до_конца  0x0033   100   100   090    Предаварийный  Всегда       -       0
187 Непоправимое_число_ошибок 0x0032   100   100   000    Старый_возраст   Всегда       -       0
190 Температура_диска       0x0022   079   079   000    Старый_возраст   Всегда       -       21 (Мин/Макс 17/21)
192 Количество_небезопасного_выключения   0x0032   100   100   000    Старый_возраст   Всегда       -       31
194 Температура_по_Цельсию     0x0022   100   100   000    Старый_возраст   Всегда       -       21
197 Количество_ожидающих_секторов    0x0012   100   100   000    Старый_возраст   Всегда       -       36
199 Количество_ошибок_CRC         0x003e   100   100   000    Старый_возраст   Всегда       -       0
225 Записи_хоста_32MiB       0x0032   100   100   000    Старый_возраст   Всегда       -       170604988
226 Индикатор_износа_рабочей_памяти 0x0032   100   100   000    Старый_возраст   Всегда       -       52961
227 Проценты_чтений_хоста  0x0032   100   100   000    Старый_возраст   Всегда       -       59
228 Минуты_нагрузки        0x0032   100   100   000    Старый_возраст   Всегда       -       1952266
232 Доступно_резервное_место 0x0033   100   100   010    Предаварийный  Всегда       -       0
233 Индикатор_износа_носителя 0x0032   049   049   000    Старый_возраст   Всегда       -       0
234 Статус_терм throttling 0x0032   100   100   000    Старый_возраст   Всегда       -       0/0
241 Записи_хоста_32MiB       0x0032   100   100   000    Старый_возраст   Всегда       -       170604988
242 Чтения_хоста_32MiB        0x0032   100   100   000    Старый_возраст   Всегда       -       246119347
243 Записи_NAND_32MiB       0x0032   100   100   000    Старый_возраст   Всегда       -       186350039

В продолжение этого, я обратился к статье Википедии Самообследование, Анализ и Технология Отчетности, в которой писалось:

Точность

Полевое исследование в Google[9], охватывающее более 100,000 потребительских дисков с декабря 2005 года по август 2006 года, обнаружило корреляции между определенной информацией S.M.A.R.T. и годовыми ставками отказа:

В 60 дней, следующие за первой некорректируемой ошибкой на диске
(атрибут S.M.A.R.T. 0xC6 или 198), обнаруженной в результате оффлайн-сканирования, диск, в среднем, был в 39 раз более склонен к отказу, чем аналогичный диск, на котором такой ошибки не произошло. Первые ошибки в перераспределениях, оффлайн перераспределениях (атрибуты S.M.A.R.T. 0xC4 и 0x05 или 196 и 5) и пробные подсчеты (атрибут S.M.A.R.T. 0xC5 или 197) также имели сильную корреляцию с более высокими вероятностями отказа. Напротив, была найдена небольшая корреляция для повышенной температуры и никакой корреляции для уровня использования. Однако исследование показало, что большая часть (56%) отказавших дисков отказала, не запомнив ни один счет в “четырех сильных предупреждениях S.M.A.R.T.”, определенных как ошибки сканирования, количество перераспределений, оффлайн перераспределений и пробный счет. Кроме того, 36% отказавших дисков сделали это, не записав ни одной ошибки S.M.A.R.T., кроме температуры, что означает, что данные S.M.A.R.T. были ограниченно полезны для предсказания отказов.[10]

И также:

233 0xE9 Индикатор износа носителя (SSD) или Часы включения Intel SSD
отчет о нормализованном значении от 100, новый диск, до минимального 1. Он
уменьшается по мере увеличения циклов стирания NAND от 0 до
максимально допустимых циклов. Ранее (до 2010 года) иногда использовался для
Часов включения (чаще отчет о 0x09).

Этот твердотельный диск всего четыре года (с декабря 2024 года), так что Часы включения не являются частью этого параметра, который составляет 49, что точно соответствует рейтинговому состоянию диска в Linux HDSentinel в 49%.

Я предполагаю, что этот диск подвергался интенсивному использованию в серверной конфигурации и в конечном итоге был заменен, чтобы снизить вероятность отказа конфигурации сервера из-за нового диска. В конце концов:

Всего записано: 5,206.45 TB

из первой цитаты. Это очень большое количество записанных данных. Но, кажется, этот диск должен быть приемлем для потребительских приложений, которые не пишут так много данных в будущем. Этот диск очень большой, так что если небольшие записи применяются по очень большой области (как в концепции не только RAID 0 распределения, но и других уровней RAID, которые дают не только преимущество скорости – и распределены по диску, но также преимущество встроенной резервной копии), кажется, что существует очень небольшая вероятность того, что этот диск фактически выйдет из строя в потребительском приложении. Особенно с регулярным резервным копированием на другой диск перед каждым отключением питания, кажется, что это очень надежная конфигурация.

Я еще не видел RAID распределения на одном диске для SSD в Ubuntu.

Возможно ли принудительно распределить данные между SSD-диском (RAID или иным образом), так чтобы минимизировать проблемы перезаписи одной и той же области NAND памяти SSD? (Это автоматизировано с этим диском)?

Является ли этот рейтинг действительно проблемой для потребителей с минимальным использованием диска (мегабайты использования в месяц, максимум), или это больше трудность для промышленных клиентов с высокоскоростными промышленными серверами (что приводит к отмеченным 5,206.45 TB уже записанных)?

Релевантные ссылки

Интересно: Возможно ли избыточное предоставление SSD с двойной загрузкой?

Статья Ubuntu OS на SSD и RAID-5 для файлов данных кажется многообещающей, но до сих пор неясно, как это сделать с одним SSD под управлением Ubuntu.

Ответ или решение

Вопрос: Плох ли 49% состояния устройства по индикатору износа медиаподобия #233 для SSD Intel DC S5400 Series 1,92 ТБ и возможен ли Linux RAID?

Введение

При оценке состояния SSD, особенно таких, как Intel DC S5400 Series, важно учитывать различные факторы, включая показатели здоровья устройства. В данном случае, цифра 49% по индикатору износа медиаподобия #233, полученная с помощью HDSentinel, требует детального анализа.

Понимание индикатора износа медиаподобия

Индикатор #233 (Media Wearout Indicator) оценивает общее количество циклов записи, которое SSD способен выдержать, и отображает текущее состояние устройства относительно этой характеристике. Нормализованное значение колеблется от 100 (новый диск) до 1 (предельный износ). Значение в 49% указывает на то, что диск не является новым и уже износился, однако это не обязательно является критическим состоянием.

Анализ состояния диска

В предоставленных данных видно, что диск проработал 1355 дней и записал статус "ПЕРФЕКТ". Это говорит о том, что несмотря на низкое значение по индикатору износа, нет замеченных физических повреждений или проблем с секторами. Тем не менее, такой объем записанных данных – 5206.45 ТБ – подтвердил высокую интенсивность использования, что характерно для серверных конфигураций.

Рекомендации для потребителей

Для обычного пользователя, который не производит значительных объемов записи, 49% состояния устройства не должны быть причиной для паники. При низкой нагрузке и регулярном резервном копировании данных, диск может прослужить еще долго без серьезных проблем. Тем не менее, повышенные риски исходят от потенциального износа, поэтому резервное копирование критически важно для защиты данных.

Возможность RAID в Linux

Теперь перейдем к вопросу о RAID.

RAID на одном SSD

На один SSD можно создать RAID 0 (стриминг) с использованием логических разделов, однако реальная выгода от RAID будет ограниченной. RAID 0 действительно улучшает скорость чтения и записи, однако это не обязательно будет надежным решением, если диск подвержен атмосферным условиям, связанным с износом. Если RAID на самом деле сведен к "разделению" на уровне логики, он не уменьшит вероятность перезаписи одних и тех же ячеек памяти SSD.

Тем не менее, применение множества логических дисков не уменьшит риск износа в долгосрочной перспективе. Лучше рассмотреть альтернативные решения, такие как использование нескольких SSD для RAID, если выгодно.

Заключение

В конечном счете, состояние 49% по индикатору медиаподобия говорит о необходимости более внимательного подхода к управлению данными. Для потребителей, которые могут использовать диск с низким уровнем записи, этого достаточно для удовлетворительного функционирования. Однако, сохранность данных должна быть приоритетом, для этого следует применять регулярные резервные копии и, возможно, использовать несколько раундов SSD для продления их сроков службы.

Применение RAID на одном диске требует внимательного подхода и субъектов, прежде всего, нуждающихся в резервировании данных и минимизации риска потерь. Рациональное использование SSD может обеспечить долгосрочную эффективность, если будут соблюдены все нормативы хранения, резервного копирования и обслуживания устройства.

Оцените материал
Добавить комментарий

Капча загружается...