Вопрос или проблема
У меня есть Windows сервер (2022) с двумя SSD Samsung 990 Pro объемом 2 ТБ. У меня возникли странные проблемы с одним из них, который время от времени исчезает. Что происходит: примерно каждые 2 месяца диск перестает существовать: команды diskpart
или Get-PhysicalDisk
(в PS) попросту не отображают диск. Единственное, что можно сделать в это время, – это полное отключение питания и перезапуск, простой перезапуск в ОС не помогает.
Сначала я подумал, что это проблема с материнской платой, поэтому я связался с производителем, и – сюрприз! – они сказали мне убедиться, что это не проблема с диском. После некоторого обмена мнениями я решил исследовать потенциальную проблему с дисками, просто чтобы избежать замены материнской платы и затем все еще иметь проблему.
Исследование состояния дисков было не так просто, потому что это установка Server Core, без графического интерфейса, но мне удалось провести некоторый анализ, который выявил шокирующую новость: работа программы MS diskspd показала совершенно ужасную производительность для обоих дисков. Обе скорости чтения и записи составляли всего около 50 МиБ/с, что значительно ниже спецификаций 990 Pro.
Итак, у меня сейчас несколько вопросов:
- Связаны ли две проблемы (диск периодически исчезает)?
- Может ли проблема со скоростью быть вызвана материнской платой (это ASRock X570S PG Riptide)?
- Могут ли SSD быть поддельными? И как я могу это проверить?
- Есть ли предложения по дальнейшему анализу этой проблемы?
Уточнение:
- Журналы сервера: в событии зрителя ничего не появляется
- Возраст дисков: им год, и они не были интенсивно использованы
- Сведения SMART:
Это выход, который я получил от Samsung DC Toolkit:
Номер диска: 1:c | Модель: Samsung SSD 990 PRO с радиатором 2TB | Версия прошивки: 0B2QJXG7
Байты | Описание | Значение |
---|---|---|
0 | Критическое предупреждение | 0x00 |
2:1 | Композитная температура | 0x0142 |
3 | Доступный резерв | 0x64 |
4 | Порог доступного резерва | 0x0A |
5 | Процент использования | 0x02 |
47:32 | Прочитанные данные | 0x000000000000000000000000011BD521 |
63:48 | Записанные данные | 0x000000000000000000000000010D94FB |
79:64 | Команды чтения хоста | 0x0000000000000000000000000DD8604F |
95:80 | Команды записи хоста | 0x0000000000000000000000001282EACA |
111:96 | Время занятости контроллера | 0x00000000000000000000000000009963 |
127:112 | Цикл питания | 0x00000000000000000000000000000020 |
143:128 | Часы включения | 0x00000000000000000000000000001F93 |
159:144 | Небезопасные отключения | 0x00000000000000000000000000000014 |
175:160 | Ошибки целостности носителя и данных | 0x00000000000000000000000000000000 |
191:176 | Количество записей журнала ошибок | 0x00000000000000000000000000000000 |
195:192 | Время предупреждения композитной температуры | 0x00040880 |
199:196 | Время критической композитной температуры | 0x00000000 |
201:200 | Датчик температуры 1 | 0x0142 |
203:202 | Датчик температуры 2 | 0x0149 |
205:204 | Датчик температуры 3 | 0x0000 |
207:206 | Датчик температуры 4 | 0x0000 |
209:208 | Датчик температуры 5 | 0x0000 |
211:210 | Датчик температуры 6 | 0x0000 |
213:212 | Датчик температуры 7 | 0x0000 |
215:214 | Датчик температуры 8 | 0x0000 |
.
Ответ или решение
Имея опыт работы в сфере ИТ, разберемся с проблемами, которые вы испытываете с SSD-дисками Samsung 990 PRO с радиатором. Судя по описанию вашей проблемы, вы столкнулись с двумя основными трудностями: медленной производительностью SSD и периодическим исчезновением одного из дисков из системы.
Теоретическая часть (Theory)
Для начала, разберемся с возможными причинами вашей проблемы. Обычно такие неисправности могут быть вызваны несколькими факторами:
-
Аппаратные проблемы: Это включает в себя дефекты в самих SSD или на материнской плате, которые могут вызвать как потерю связи с диском, так и низкую скорость передачи данных.
-
Термическое воздействие: При перегреве SSD могут проявляться нестабильности, включая неожиданные отключения и сниженные скорости. Однако, учитывая, что ваши диски оснащены радиатором и температура в пределах нормы согласно SMART-данным, это маловероятно.
-
Проблемы с микропрограммным обеспечением (firmware): Устаревшая или дефектная микропрограмма может вызывать низкую производительность или несоответствующее поведение.
-
Электропитание: Периодическое отключение устройства может быть связано с нестабильностью питания, что может быть обусловлено материнской платой или блоком питания.
-
Контрафактные устройства: Никогда не исключено, что устройства могут оказаться поддельными. Однако это реже встречается с приобретениями у надежных реселлеров.
Пример (Example)
Ваши описания указывают на использование команды diskspd
для оценки производительности дисков, которая показала результаты значительно ниже ожидаемых. Это свидетельствует о возможных проблемах на более глубоком уровне, чем просто программные сбои системы.
Кроме того, информация из SMART-данных указывает на нулевые ошибки интегритета данных и отсутствие критических зафиксированных сбоев, что говорит о том, что, вероятно, проблема может заключаться в другом.
Применение (Application)
Что делать дальше:
-
Проверка прошивки: Убедитесь, что на SSD установлена последняя версия прошивки. Иногда обновления содержат исправления для известных проблем.
-
Проверка соединений и питания: Проверьте качество подключения дисков к материнской плате. Возможно, проблема в разъеме или кабеле. Также следует убедиться, что электропитание стабильное и соответствует спецификациям.
-
Замена слота: Попробуйте подключить диск к другому M.2 слоту на материнской плате. Это поможет исключить дефект конкретного слота.
-
Тестирование на другом оборудовании: Если возможно, установите диск на другом совместимом компьютере, чтобы проверить, сохраняется ли проблема. Это позволит исключить возможность неисправности на уровне сервера.
-
Проверка на контрафактность: Используйте приложение Samsung Magician или другое официальное ПО для проверки аутентичности устройств.
-
Мониторинг температуры: Несмотря на нормальные readings из SMART-отчета, настоятельно рекомендуется продолжать мониторинг температуры при высокой нагрузке, чтобы предотвратить возможные термические проблемы.
-
Обратитесь в поддержку Samsung: Если после всех вышеперечисленных действий проблема не будет решена, разумным шагом будет обращение в техническую поддержку Samsung для более детальной диагностики и вероятной замены устройства по гарантии.
Эти шаги помогут вам установить более точную причину проблемы и принять соответствующие меры для её исправления. Всегда полезно иметь под рукой технологическую и гарантийную поддержку производителя, которая может предоставить специализированные решения, адаптированные к их продукции.