Как мне предотвратить небезопасные завершения работы, о которых сообщает smartclt?

Вопрос или проблема

Согласно предложению eblock, я несколько раз запускал smartctl в течение последних нескольких дней, чтобы проверить наличие проблем. Ниже, в качестве примера, приведен вывод sudo smartctl -a /dev/nvme0n1p2:

smartctl 7.0 2019-05-21 r4917 [x86_64-linux-5.5.7-1-default] (SUSE RPM)
Авторские права (C) 2002-18, Брюс Аллен, Кристиан Франке, www.smartmontools.org

=== НАЧАЛО РАЗДЕЛА ИНФОРМАЦИИ ===
Номер модели:                       Samsung SSD 970 EVO Plus 500GB
Серийный номер:                     S4EVNZFN503427W
Версия прошивки:                   2B2QEXM7
Идентификатор поставщика PCI/подсистемы: 0x144d
Идентификатор IEEE OUI:            0x002538
Общая ёмкость NVM:                 500,107,862,016 [500 ГБ]
Нераспределённая ёмкость NVM:      0
Идентификатор контроллера:          4
Количество пространств имён:        1
Размер/Ёмкость пространства имён 1: 500,107,862,016 [500 ГБ]
Использование пространства имён 1:   94,943,219,712 [94.9 ГБ]
Размер отформатированного LBA пространства имён 1: 512
IEEE EUI-64 пространства имён 1:     002538 5501ad2a18
Местное время:                      Ср, 2 Дек 2020 11:19:04 CET
Обновления прошивки (0x16):        3 слота, сброс не требуется
Дополнительные команды администратора (0x0017):    Безопасный формат Frmw_DL Тестирование
Дополнительные команды NVM (0x005f):  Комп Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Максимальный размер передачи данных: 512 страниц
Предупреждение о температуре компонентов:  85 Цельсия
Критический порог температуры компонентов:  85 Цельсия

Поддерживаемые состояния питания
Ст Op     Max   Активное   Ожидание   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     7.80W       -        -    0  0  0  0        0       0
 1 +     6.00W       -        -    1  1  1  1        0       0
 2 +     3.40W       -        -    2  2  2  2        0       0
 3 -   0.0700W       -        -    3  3  3  3      210    1200
 4 -   0.0100W       -        -    4  4  4  4     2000    8000

Поддерживаемые размеры LBA (NSID 0x1)
Id Fmt  Данные  Метаданные  Отн. Производительность
 0 +     512       0         0

=== НАЧАЛО РАЗДЕЛА ДАННЫХ SMART ===
Результат теста самооценки общего состояния SMART: УСПЕШНО

Информация о состоянии SMART (NVMe Journal 0x02)
Критическое предупреждение:                   0x00
Температура:                        38 Цельсия
Доступный резерв:                    100%
Порог доступного резерва:          10%
Процент использования:                    0%
Единицы данных прочитаны:                    382,321 [195 ГБ]
Единицы данных записаны:                 695,579 [356 ГБ]
Команды чтения хоста:                 4,525,857
Команды записи хоста:                9,680,786
Время занятости контроллера:               30
Циклы питания:                       205
Часы включения:                     75
Небезопасные выключения:                   73
Ошибки целостности данных и медиа:    0
Записи журналов ошибок:      209
Предупреждение  Время температуры компонентов:    0
Критическое время температуры компонентов:    0
Датчик температуры 1:               38 Цельсия
Датчик температуры 2:               41 Цельсия

Информация об ошибках (NVMe Journal 0x01, макс. 64 записи)
Нет зарегистрированных ошибок

Строки “Результат теста самооценки общего состояния SMART: УСПЕШНО” и “Нет зарегистрированных ошибок” выглядят обнадёживающе, но следующая строка не :

Небезопасные выключения:                   73

Согласно использованию командных инструментов NVMe для проверки состояния флеш-памяти NVMe Петра Зайтсева (февраль 2017), Небезопасные выключения означают

Количество случаев, когда отключение питания произошло без отправки уведомления об отключении. В зависимости от используемого вами устройства NVMe, небезопасное отключение может повредить пользовательские данные.

На моем ноутбуке Tuxedo произошло несколько неожиданных отключений (см. Есть ли способ найти причину неожиданных отключений питания, проверяя журналы?), но не 73 раза.

Согласно этому сообщению на форуме Tom’s Hardware (апрель 2019), отключение быстрой загрузки может помочь. Это верно или нужно что-то другое?

По некоторым причинам я не верю, что этот параметр SMART правильный. Например, для моего собственного SSD я вижу:

174 Unexpect_Power_Loss_Ct  0x0032   100   100   000    Old_age   Always       -       75

что явно неправильно, потому что я нажимал кнопку сброса или был отключён от питания менее 20 раз за срок службы этого SSD.

Причина, по которой вам должно быть относительно безопасно, заключается в том, что перед выключением systemd говорит ядру сбросить буферы, поэтому все «грязные» кэши фактически сбрасываются на устройство.

Просто никогда не забывайте о регулярном правильном резервном копировании – это самое важное.

Ответ или решение

Как предотвратить несанкционированные отключения, обнаруженные с помощью smartctl

Неожиданные отключения питания могут привести к различным проблемам, включая повреждение данных и сокращение срока службы жесткого диска. Если вы заметили, что ваш SSD показывает высокое количество несанкционированных отключений, как в вашем случае с Samsung SSD 970 EVO Plus, этот вопрос требует особого внимания. Рассмотрим, как можно снизить риск возникновения этой проблемы.

1. Понимание проблемы

Вывод команды smartctl показывает, что число несанкционированных отключений составляет 73. Это может напрягать, даже если другие параметры здоровья диска выглядят нормально. Согласно предоставленной информации, несанкционированные отключения означают, что устройство теряло питание без уведомления операционной системы, что потенциально может привести к повреждению данных.

2. Проверка аппаратного обеспечения

  • Питание и подключение: Убедитесь, что блок питания вашего ноутбука функционирует должным образом и соединение кабелей надежно. Плохие соединения могут привести к отключению питания.
  • Перегрев: Если устройство перегревается, это может привести к отключению системы. Проверьте, работают ли вентиляторы должным образом, и убедитесь, что ноутбук не перегревается.

3. Отключение функции быстрого запуска

Одной из рекомендаций, упомянутой вами, является отключение функции быстрого запуска. Эта функция позволяет операционной системе быстро загружаться, но иногда приводит к проблемам с записывающей частью устройства. Чтобы отключить ее:

  • Перейдите в настройки BIOS/UEFI вашего устройства и найдите параметр, связанный с быстрым запуском.
  • Отключите эту функцию, чтобы система всегда выполняла полное завершение работы, что может помочь предотвратить отключения.

4. Обновление программного обеспечения

  • Фирменное обеспечение SSD: Проверьте наличие обновлений прошивки для вашего SSD. Производители часто выпускают обновления, которые улучшают стабильность и производительность устройства.
  • Обновления операционной системы: Убедитесь, что ваша операционная система и все драйверы обновлены. Это уменьшает вероятность программных ошибок, которые могут вызывать нежелательные перезагрузки и отключения.

5. Мониторинг и диагностика

Для регулярного контроля состояния устройства используйте такие инструменты, как smartctl. Выполняйте команды мониторинга, как это делает smartctl -a /dev/nvme0n1p2, чтобы отслеживать изменения в показателях SMART. Вы можете установить автоматическое выполнение этой команды, чтобы получать уведомления, если параметры выходят за пределы нормы.

6. Регулярное создание резервных копий

Постоянные резервные копии критически важны для защиты данных от потери. Используйте облачные хранилища и внешние устройства для создания копий документов, фотографий и других важных файлов. Даже если проблемы с питанием не могут быть полностью устранены, регулярные резервные копии обеспечат безопасность ваших данных.

7. Заключение

Несанкционированные отключения способны вызвать множество проблем, но с проактивным подходом вы можете значительно снизить их частоту. Проверьте аппаратное обеспечение, отключите ненужные функции, держите программное обеспечение в актуальном состоянии, следите за состоянием SSD и не забывайте о резервных копиях. Это позволит сохранить целостность ваших данных и обеспечить стабильную работу вашего устройства.

Оцените материал
Добавить комментарий

Капча загружается...