49% состояния устройства от “#233 Индикатор износа медиапамяти” для Intel SSD DC S5400 Series 1.92 TB SSD плохо для потребителей, и возможно ли использование RAID на Linux?

Question

Я использовал HDSentinel для Unix (Ubuntu 24.10), чтобы протестировать диск Intel SSD DC S4500 Series 1.92TB следующим образом:

root@stephen-All-Series:~# HDSentinel 
Hard Disk Sentinel для LINUX консоли 0.20c-x64.10851 (c) 2024 [email protected]
Начните с -r [reportfile], чтобы сохранить данные в отчет, -h для справки

Изучение конфигурации жесткого диска...

HDD Устройство  0: /dev/sda             
HDD Модель ID : INTEL SSDSC2KB019T7
HDD Серийный номер: PHYS737500DM1P9DGN
HDD Ревизия : SCV10121
HDD Размер     : 1831420 MB
Интерфейс    : S-ATA Gen3, 6 Gbps
Температура  : 21 °C
Максимальная Темп.: 21 °C
Состояние    : 49 %
Производительность  : 100 %
Время включения: 1355 дней, 22 часа
Оценочный срок службы: 112 дней
Всего записано: 5,206.45 TB
  Состояние твердотельного диска - ИДЕАЛЬНО. Проблемных или слабых секторов не найдено. 
  Состояние определяется конкретным атрибутом S.M.A.R.T. SSD:  #233 Индикатор износа носителя
    Рекомендуется часто создавать резервные копии для предотвращения потери данных.

Состояние было 49%, что было связано с “#233 Индикатор износа носителя”.

В продолжение этого, я выполнил следующее:

stephen@stephen-All-Series:~$ sudo smartctl -A /dev/sda
smartctl 7.4 2023-08-01 r5530 [x86_64-linux-6.11.0-9-generic] (локальная сборка)
Copyright (C) 2002-23, Брюс Аллен, Кристиан Франке, www.smartmontools.org

=== НАЧАЛО СЕКЦИИ ЧТЕНИЯ ДАННЫХ SMART ===
Структура данных атрибутов SMART, номер версии: 1
Специфические для поставщика атрибуты SMART с порогами:
ID# ИМЯ_АТРИБУТА          ФЛАГ     ЗНАЧЕНИЕ ХУЖШИЙ ПОР.D. ТИП      ОБНОВЛЕН  КОГДА_ПРОВАЛИЛСЯ СЫРОЕ_ЗНАЧЕНИЕ
  5 Перераспределенное_количество_секторов   0x0032   100   100   000    Старый_возраст   Всегда       -       0
  9 Часы_включения          0x0032   100   100   000    Старый_возраст   Всегда       -       32542
 12 Количество_перезапусков       0x0032   100   100   000    Старый_возраст   Всегда       -       33
170 Доступно_резервное_место 0x0033   100   100   010    Предаварийный  Всегда       -       0
171 Количество_неудач_программы      0x0032   100   100   000    Старый_возраст   Всегда       -       0
172 Количество_неудач_удаления        0x0032   100   100   000    Старый_возраст   Всегда       -       0
174 Количество_небезопасного_выключения   0x0032   100   100   000    Старый_возраст   Всегда       -       31
175 Тест_ёмкости_потери_питания     0x0033   100   100   010    Предаварийный  Всегда       -       2709 (225 7757)
183 Счетчик_снижения_SATA    0x0032   100   100   000    Старый_возраст   Всегда       -       0
184 Счетчик_ошибки_от_конца_до_конца  0x0033   100   100   090    Предаварийный  Всегда       -       0
187 Непоправимое_число_ошибок 0x0032   100   100   000    Старый_возраст   Всегда       -       0
190 Температура_диска       0x0022   079   079   000    Старый_возраст   Всегда       -       21 (Мин/Макс 17/21)
192 Количество_небезопасного_выключения   0x0032   100   100   000    Старый_возраст   Всегда       -       31
194 Температура_по_Цельсию     0x0022   100   100   000    Старый_возраст   Всегда       -       21
197 Количество_ожидающих_секторов    0x0012   100   100   000    Старый_возраст   Всегда       -       36
199 Количество_ошибок_CRC         0x003e   100   100   000    Старый_возраст   Всегда       -       0
225 Записи_хоста_32MiB       0x0032   100   100   000    Старый_возраст   Всегда       -       170604988
226 Индикатор_износа_рабочей_памяти 0x0032   100   100   000    Старый_возраст   Всегда       -       52961
227 Проценты_чтений_хоста  0x0032   100   100   000    Старый_возраст   Всегда       -       59
228 Минуты_нагрузки        0x0032   100   100   000    Старый_возраст   Всегда       -       1952266
232 Доступно_резервное_место 0x0033   100   100   010    Предаварийный  Всегда       -       0
233 Индикатор_износа_носителя 0x0032   049   049   000    Старый_возраст   Всегда       -       0
234 Статус_терм throttling 0x0032   100   100   000    Старый_возраст   Всегда       -       0/0
241 Записи_хоста_32MiB       0x0032   100   100   000    Старый_возраст   Всегда       -       170604988
242 Чтения_хоста_32MiB        0x0032   100   100   000    Старый_возраст   Всегда       -       246119347
243 Записи_NAND_32MiB       0x0032   100   100   000    Старый_возраст   Всегда       -       186350039

В продолжение этого, я обратился к статье Википедии Самообследование, Анализ и Технология Отчетности, в которой писалось:

Точность

Полевое исследование в Google[9], охватывающее более 100,000 потребительских дисков с декабря 2005 года по август 2006 года, обнаружило корреляции между определенной информацией S.M.A.R.T. и годовыми ставками отказа:

В 60 дней, следующие за первой некорректируемой ошибкой на диске
(атрибут S.M.A.R.T. 0xC6 или 198), обнаруженной в результате оффлайн-сканирования, диск, в среднем, был в 39 раз более склонен к отказу, чем аналогичный диск, на котором такой ошибки не произошло. Первые ошибки в перераспределениях, оффлайн перераспределениях (атрибуты S.M.A.R.T. 0xC4 и 0x05 или 196 и 5) и пробные подсчеты (атрибут S.M.A.R.T. 0xC5 или 197) также имели сильную корреляцию с более высокими вероятностями отказа. Напротив, была найдена небольшая корреляция для повышенной температуры и никакой корреляции для уровня использования. Однако исследование показало, что большая часть (56%) отказавших дисков отказала, не запомнив ни один счет в “четырех сильных предупреждениях S.M.A.R.T.”, определенных как ошибки сканирования, количество перераспределений, оффлайн перераспределений и пробный счет. Кроме того, 36% отказавших дисков сделали это, не записав ни одной ошибки S.M.A.R.T., кроме температуры, что означает, что данные S.M.A.R.T. были ограниченно полезны для предсказания отказов.[10]

И также:

233 0xE9 Индикатор износа носителя (SSD) или Часы включения Intel SSD
отчет о нормализованном значении от 100, новый диск, до минимального 1. Он
уменьшается по мере увеличения циклов стирания NAND от 0 до
максимально допустимых циклов. Ранее (до 2010 года) иногда использовался для
Часов включения (чаще отчет о 0x09).

Этот твердотельный диск всего четыре года (с декабря 2024 года), так что Часы включения не являются частью этого параметра, который составляет 49, что точно соответствует рейтинговому состоянию диска в Linux HDSentinel в 49%.

Я предполагаю, что этот диск подвергался интенсивному использованию в серверной конфигурации и в конечном итоге был заменен, чтобы снизить вероятность отказа конфигурации сервера из-за нового диска. В конце концов:

Всего записано: 5,206.45 TB

из первой цитаты. Это очень большое количество записанных данных. Но, кажется, этот диск должен быть приемлем для потребительских приложений, которые не пишут так много данных в будущем. Этот диск очень большой, так что если небольшие записи применяются по очень большой области (как в концепции не только RAID 0 распределения, но и других уровней RAID, которые дают не только преимущество скорости – и распределены по диску, но также преимущество встроенной резервной копии), кажется, что существует очень небольшая вероятность того, что этот диск фактически выйдет из строя в потребительском приложении. Особенно с регулярным резервным копированием на другой диск перед каждым отключением питания, кажется, что это очень надежная конфигурация.

Я еще не видел RAID распределения на одном диске для SSD в Ubuntu.

Возможно ли принудительно распределить данные между SSD-диском (RAID или иным образом), так чтобы минимизировать проблемы перезаписи одной и той же области NAND памяти SSD? (Это автоматизировано с этим диском)?

Является ли этот рейтинг действительно проблемой для потребителей с минимальным использованием диска (мегабайты использования в месяц, максимум), или это больше трудность для промышленных клиентов с высокоскоростными промышленными серверами (что приводит к отмеченным 5,206.45 TB уже записанных)?

Релевантные ссылки

Интересно: Возможно ли избыточное предоставление SSD с двойной загрузкой?

Статья Ubuntu OS на SSD и RAID-5 для файлов данных кажется многообещающей, но до сих пор неясно, как это сделать с одним SSD под управлением Ubuntu.

49% состояния устройства от “#233 Индикатор износа медиапамяти” для Intel SSD DC S5400 Series 1.92 TB SSD плохо для потребителей, и возможно ли использование RAID на Linux?

Вопрос или проблема

Ответ или решение

Вопрос: Плох ли 49% состояния устройства по индикатору износа медиаподобия #233 для SSD Intel DC S5400 Series 1,92 ТБ и возможен ли Linux RAID?

Введение

Понимание индикатора износа медиаподобия

Анализ состояния диска

Рекомендации для потребителей

Возможность RAID в Linux

RAID на одном SSD

Заключение