- Вопрос или проблема
- Ответ или решение
- Вопрос: Плох ли 49% состояния устройства по индикатору износа медиаподобия #233 для SSD Intel DC S5400 Series 1,92 ТБ и возможен ли Linux RAID?
- Введение
- Понимание индикатора износа медиаподобия
- Анализ состояния диска
- Рекомендации для потребителей
- Возможность RAID в Linux
- RAID на одном SSD
- Заключение
Вопрос или проблема
Я использовал HDSentinel для Unix (Ubuntu 24.10), чтобы протестировать диск Intel SSD DC S4500 Series 1.92TB следующим образом:
root@stephen-All-Series:~# HDSentinel
Hard Disk Sentinel для LINUX консоли 0.20c-x64.10851 (c) 2024 [email protected]
Начните с -r [reportfile], чтобы сохранить данные в отчет, -h для справки
Изучение конфигурации жесткого диска...
HDD Устройство 0: /dev/sda
HDD Модель ID : INTEL SSDSC2KB019T7
HDD Серийный номер: PHYS737500DM1P9DGN
HDD Ревизия : SCV10121
HDD Размер : 1831420 MB
Интерфейс : S-ATA Gen3, 6 Gbps
Температура : 21 °C
Максимальная Темп.: 21 °C
Состояние : 49 %
Производительность : 100 %
Время включения: 1355 дней, 22 часа
Оценочный срок службы: 112 дней
Всего записано: 5,206.45 TB
Состояние твердотельного диска - ИДЕАЛЬНО. Проблемных или слабых секторов не найдено.
Состояние определяется конкретным атрибутом S.M.A.R.T. SSD: #233 Индикатор износа носителя
Рекомендуется часто создавать резервные копии для предотвращения потери данных.
Состояние было 49%, что было связано с “#233 Индикатор износа носителя”.
В продолжение этого, я выполнил следующее:
stephen@stephen-All-Series:~$ sudo smartctl -A /dev/sda
smartctl 7.4 2023-08-01 r5530 [x86_64-linux-6.11.0-9-generic] (локальная сборка)
Copyright (C) 2002-23, Брюс Аллен, Кристиан Франке, www.smartmontools.org
=== НАЧАЛО СЕКЦИИ ЧТЕНИЯ ДАННЫХ SMART ===
Структура данных атрибутов SMART, номер версии: 1
Специфические для поставщика атрибуты SMART с порогами:
ID# ИМЯ_АТРИБУТА ФЛАГ ЗНАЧЕНИЕ ХУЖШИЙ ПОР.D. ТИП ОБНОВЛЕН КОГДА_ПРОВАЛИЛСЯ СЫРОЕ_ЗНАЧЕНИЕ
5 Перераспределенное_количество_секторов 0x0032 100 100 000 Старый_возраст Всегда - 0
9 Часы_включения 0x0032 100 100 000 Старый_возраст Всегда - 32542
12 Количество_перезапусков 0x0032 100 100 000 Старый_возраст Всегда - 33
170 Доступно_резервное_место 0x0033 100 100 010 Предаварийный Всегда - 0
171 Количество_неудач_программы 0x0032 100 100 000 Старый_возраст Всегда - 0
172 Количество_неудач_удаления 0x0032 100 100 000 Старый_возраст Всегда - 0
174 Количество_небезопасного_выключения 0x0032 100 100 000 Старый_возраст Всегда - 31
175 Тест_ёмкости_потери_питания 0x0033 100 100 010 Предаварийный Всегда - 2709 (225 7757)
183 Счетчик_снижения_SATA 0x0032 100 100 000 Старый_возраст Всегда - 0
184 Счетчик_ошибки_от_конца_до_конца 0x0033 100 100 090 Предаварийный Всегда - 0
187 Непоправимое_число_ошибок 0x0032 100 100 000 Старый_возраст Всегда - 0
190 Температура_диска 0x0022 079 079 000 Старый_возраст Всегда - 21 (Мин/Макс 17/21)
192 Количество_небезопасного_выключения 0x0032 100 100 000 Старый_возраст Всегда - 31
194 Температура_по_Цельсию 0x0022 100 100 000 Старый_возраст Всегда - 21
197 Количество_ожидающих_секторов 0x0012 100 100 000 Старый_возраст Всегда - 36
199 Количество_ошибок_CRC 0x003e 100 100 000 Старый_возраст Всегда - 0
225 Записи_хоста_32MiB 0x0032 100 100 000 Старый_возраст Всегда - 170604988
226 Индикатор_износа_рабочей_памяти 0x0032 100 100 000 Старый_возраст Всегда - 52961
227 Проценты_чтений_хоста 0x0032 100 100 000 Старый_возраст Всегда - 59
228 Минуты_нагрузки 0x0032 100 100 000 Старый_возраст Всегда - 1952266
232 Доступно_резервное_место 0x0033 100 100 010 Предаварийный Всегда - 0
233 Индикатор_износа_носителя 0x0032 049 049 000 Старый_возраст Всегда - 0
234 Статус_терм throttling 0x0032 100 100 000 Старый_возраст Всегда - 0/0
241 Записи_хоста_32MiB 0x0032 100 100 000 Старый_возраст Всегда - 170604988
242 Чтения_хоста_32MiB 0x0032 100 100 000 Старый_возраст Всегда - 246119347
243 Записи_NAND_32MiB 0x0032 100 100 000 Старый_возраст Всегда - 186350039
В продолжение этого, я обратился к статье Википедии Самообследование, Анализ и Технология Отчетности, в которой писалось:
Точность
Полевое исследование в Google[9], охватывающее более 100,000 потребительских дисков с декабря 2005 года по август 2006 года, обнаружило корреляции между определенной информацией S.M.A.R.T. и годовыми ставками отказа:
В 60 дней, следующие за первой некорректируемой ошибкой на диске
(атрибут S.M.A.R.T. 0xC6 или 198), обнаруженной в результате оффлайн-сканирования, диск, в среднем, был в 39 раз более склонен к отказу, чем аналогичный диск, на котором такой ошибки не произошло. Первые ошибки в перераспределениях, оффлайн перераспределениях (атрибуты S.M.A.R.T. 0xC4 и 0x05 или 196 и 5) и пробные подсчеты (атрибут S.M.A.R.T. 0xC5 или 197) также имели сильную корреляцию с более высокими вероятностями отказа. Напротив, была найдена небольшая корреляция для повышенной температуры и никакой корреляции для уровня использования. Однако исследование показало, что большая часть (56%) отказавших дисков отказала, не запомнив ни один счет в “четырех сильных предупреждениях S.M.A.R.T.”, определенных как ошибки сканирования, количество перераспределений, оффлайн перераспределений и пробный счет. Кроме того, 36% отказавших дисков сделали это, не записав ни одной ошибки S.M.A.R.T., кроме температуры, что означает, что данные S.M.A.R.T. были ограниченно полезны для предсказания отказов.[10]
И также:
233 0xE9 Индикатор износа носителя (SSD) или Часы включения Intel SSD
отчет о нормализованном значении от 100, новый диск, до минимального 1. Он
уменьшается по мере увеличения циклов стирания NAND от 0 до
максимально допустимых циклов. Ранее (до 2010 года) иногда использовался для
Часов включения (чаще отчет о 0x09).
Этот твердотельный диск всего четыре года (с декабря 2024 года), так что Часы включения не являются частью этого параметра, который составляет 49, что точно соответствует рейтинговому состоянию диска в Linux HDSentinel в 49%.
Я предполагаю, что этот диск подвергался интенсивному использованию в серверной конфигурации и в конечном итоге был заменен, чтобы снизить вероятность отказа конфигурации сервера из-за нового диска. В конце концов:
Всего записано: 5,206.45 TB
из первой цитаты. Это очень большое количество записанных данных. Но, кажется, этот диск должен быть приемлем для потребительских приложений, которые не пишут так много данных в будущем. Этот диск очень большой, так что если небольшие записи применяются по очень большой области (как в концепции не только RAID 0 распределения, но и других уровней RAID, которые дают не только преимущество скорости – и распределены по диску, но также преимущество встроенной резервной копии), кажется, что существует очень небольшая вероятность того, что этот диск фактически выйдет из строя в потребительском приложении. Особенно с регулярным резервным копированием на другой диск перед каждым отключением питания, кажется, что это очень надежная конфигурация.
Я еще не видел RAID распределения на одном диске для SSD в Ubuntu.
Возможно ли принудительно распределить данные между SSD-диском (RAID или иным образом), так чтобы минимизировать проблемы перезаписи одной и той же области NAND памяти SSD? (Это автоматизировано с этим диском)?
Является ли этот рейтинг действительно проблемой для потребителей с минимальным использованием диска (мегабайты использования в месяц, максимум), или это больше трудность для промышленных клиентов с высокоскоростными промышленными серверами (что приводит к отмеченным 5,206.45 TB уже записанных)?
Релевантные ссылки
Интересно: Возможно ли избыточное предоставление SSD с двойной загрузкой?
Статья Ubuntu OS на SSD и RAID-5 для файлов данных кажется многообещающей, но до сих пор неясно, как это сделать с одним SSD под управлением Ubuntu.
Ответ или решение
Вопрос: Плох ли 49% состояния устройства по индикатору износа медиаподобия #233 для SSD Intel DC S5400 Series 1,92 ТБ и возможен ли Linux RAID?
Введение
При оценке состояния SSD, особенно таких, как Intel DC S5400 Series, важно учитывать различные факторы, включая показатели здоровья устройства. В данном случае, цифра 49% по индикатору износа медиаподобия #233, полученная с помощью HDSentinel, требует детального анализа.
Понимание индикатора износа медиаподобия
Индикатор #233 (Media Wearout Indicator) оценивает общее количество циклов записи, которое SSD способен выдержать, и отображает текущее состояние устройства относительно этой характеристике. Нормализованное значение колеблется от 100 (новый диск) до 1 (предельный износ). Значение в 49% указывает на то, что диск не является новым и уже износился, однако это не обязательно является критическим состоянием.
Анализ состояния диска
В предоставленных данных видно, что диск проработал 1355 дней и записал статус "ПЕРФЕКТ". Это говорит о том, что несмотря на низкое значение по индикатору износа, нет замеченных физических повреждений или проблем с секторами. Тем не менее, такой объем записанных данных – 5206.45 ТБ – подтвердил высокую интенсивность использования, что характерно для серверных конфигураций.
Рекомендации для потребителей
Для обычного пользователя, который не производит значительных объемов записи, 49% состояния устройства не должны быть причиной для паники. При низкой нагрузке и регулярном резервном копировании данных, диск может прослужить еще долго без серьезных проблем. Тем не менее, повышенные риски исходят от потенциального износа, поэтому резервное копирование критически важно для защиты данных.
Возможность RAID в Linux
Теперь перейдем к вопросу о RAID.
RAID на одном SSD
На один SSD можно создать RAID 0 (стриминг) с использованием логических разделов, однако реальная выгода от RAID будет ограниченной. RAID 0 действительно улучшает скорость чтения и записи, однако это не обязательно будет надежным решением, если диск подвержен атмосферным условиям, связанным с износом. Если RAID на самом деле сведен к "разделению" на уровне логики, он не уменьшит вероятность перезаписи одних и тех же ячеек памяти SSD.
Тем не менее, применение множества логических дисков не уменьшит риск износа в долгосрочной перспективе. Лучше рассмотреть альтернативные решения, такие как использование нескольких SSD для RAID, если выгодно.
Заключение
В конечном счете, состояние 49% по индикатору медиаподобия говорит о необходимости более внимательного подхода к управлению данными. Для потребителей, которые могут использовать диск с низким уровнем записи, этого достаточно для удовлетворительного функционирования. Однако, сохранность данных должна быть приоритетом, для этого следует применять регулярные резервные копии и, возможно, использовать несколько раундов SSD для продления их сроков службы.
Применение RAID на одном диске требует внимательного подхода и субъектов, прежде всего, нуждающихся в резервировании данных и минимизации риска потерь. Рациональное использование SSD может обеспечить долгосрочную эффективность, если будут соблюдены все нормативы хранения, резервного копирования и обслуживания устройства.