- Вопрос или проблема
- Ответ или решение
- Как предотвратить несанкционированные отключения, обнаруженные с помощью smartctl
- 1. Понимание проблемы
- 2. Проверка аппаратного обеспечения
- 3. Отключение функции быстрого запуска
- 4. Обновление программного обеспечения
- 5. Мониторинг и диагностика
- 6. Регулярное создание резервных копий
- 7. Заключение
Вопрос или проблема
Согласно предложению eblock, я несколько раз запускал smartctl
в течение последних нескольких дней, чтобы проверить наличие проблем. Ниже, в качестве примера, приведен вывод sudo smartctl -a /dev/nvme0n1p2
:
smartctl 7.0 2019-05-21 r4917 [x86_64-linux-5.5.7-1-default] (SUSE RPM)
Авторские права (C) 2002-18, Брюс Аллен, Кристиан Франке, www.smartmontools.org
=== НАЧАЛО РАЗДЕЛА ИНФОРМАЦИИ ===
Номер модели: Samsung SSD 970 EVO Plus 500GB
Серийный номер: S4EVNZFN503427W
Версия прошивки: 2B2QEXM7
Идентификатор поставщика PCI/подсистемы: 0x144d
Идентификатор IEEE OUI: 0x002538
Общая ёмкость NVM: 500,107,862,016 [500 ГБ]
Нераспределённая ёмкость NVM: 0
Идентификатор контроллера: 4
Количество пространств имён: 1
Размер/Ёмкость пространства имён 1: 500,107,862,016 [500 ГБ]
Использование пространства имён 1: 94,943,219,712 [94.9 ГБ]
Размер отформатированного LBA пространства имён 1: 512
IEEE EUI-64 пространства имён 1: 002538 5501ad2a18
Местное время: Ср, 2 Дек 2020 11:19:04 CET
Обновления прошивки (0x16): 3 слота, сброс не требуется
Дополнительные команды администратора (0x0017): Безопасный формат Frmw_DL Тестирование
Дополнительные команды NVM (0x005f): Комп Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Максимальный размер передачи данных: 512 страниц
Предупреждение о температуре компонентов: 85 Цельсия
Критический порог температуры компонентов: 85 Цельсия
Поддерживаемые состояния питания
Ст Op Max Активное Ожидание RL RT WL WT Ent_Lat Ex_Lat
0 + 7.80W - - 0 0 0 0 0 0
1 + 6.00W - - 1 1 1 1 0 0
2 + 3.40W - - 2 2 2 2 0 0
3 - 0.0700W - - 3 3 3 3 210 1200
4 - 0.0100W - - 4 4 4 4 2000 8000
Поддерживаемые размеры LBA (NSID 0x1)
Id Fmt Данные Метаданные Отн. Производительность
0 + 512 0 0
=== НАЧАЛО РАЗДЕЛА ДАННЫХ SMART ===
Результат теста самооценки общего состояния SMART: УСПЕШНО
Информация о состоянии SMART (NVMe Journal 0x02)
Критическое предупреждение: 0x00
Температура: 38 Цельсия
Доступный резерв: 100%
Порог доступного резерва: 10%
Процент использования: 0%
Единицы данных прочитаны: 382,321 [195 ГБ]
Единицы данных записаны: 695,579 [356 ГБ]
Команды чтения хоста: 4,525,857
Команды записи хоста: 9,680,786
Время занятости контроллера: 30
Циклы питания: 205
Часы включения: 75
Небезопасные выключения: 73
Ошибки целостности данных и медиа: 0
Записи журналов ошибок: 209
Предупреждение Время температуры компонентов: 0
Критическое время температуры компонентов: 0
Датчик температуры 1: 38 Цельсия
Датчик температуры 2: 41 Цельсия
Информация об ошибках (NVMe Journal 0x01, макс. 64 записи)
Нет зарегистрированных ошибок
Строки “Результат теста самооценки общего состояния SMART: УСПЕШНО” и “Нет зарегистрированных ошибок” выглядят обнадёживающе, но следующая строка не :
Небезопасные выключения: 73
Согласно использованию командных инструментов NVMe для проверки состояния флеш-памяти NVMe Петра Зайтсева (февраль 2017), Небезопасные выключения означают
Количество случаев, когда отключение питания произошло без отправки уведомления об отключении. В зависимости от используемого вами устройства NVMe, небезопасное отключение может повредить пользовательские данные.
На моем ноутбуке Tuxedo произошло несколько неожиданных отключений (см. Есть ли способ найти причину неожиданных отключений питания, проверяя журналы?), но не 73 раза.
Согласно этому сообщению на форуме Tom’s Hardware (апрель 2019), отключение быстрой загрузки может помочь. Это верно или нужно что-то другое?