Data Science
Как оправдать логарифмически масштабированную частоту для tf в tf-idf?
00
Вопрос или проблема Я изучаю tf-idf (частота термина – обратная частота документа). Исходная логика для tf была простой: количество термина t / общее количество терминов в документе. Однако я столкнулся с логарифмически шкалированной частотой: log(1
Data Science
Эффект логарифмических шансов на искаженные данные
00
Вопрос или проблема Приведение логарифма шансов устанавливает линейность между шансами зависимой переменной и независимыми переменными, устраняя асимметрию в данных? Является ли это одной из причин, по которой мы используем логарифм шансов в логистической регрессии?
Data Science
Стандартная нормализация после логарифмического преобразования
00
Вопрос или проблема У меня есть быстрый вопрос о том, нужно ли стандартизировать признаки после логарифмического преобразования. У меня есть один признак, который сильно скошен и требует логарифмического преобразования, для остальных признаков я применяю
Data Science
Как определить выбросы на основе регрессии с логарифмическим масштабом?
00
Вопрос или проблема Я сталкиваюсь с проблемой, когда мне нужно обнаружить выбросы в сборе данных. Цель состоит в том, чтобы выявлять выбросы по переменной Y на основе ее связи с переменной X. Для этого я сделал следующее: Построил график в логарифмическом