transformation
Data Science
Вопрос или проблема Я предварительно обрабатываю свои данные для использования в модели линейной регрессии. Мои признаки сильно искажены, и я хотел бы применить трансформацию Йео-Джонсона к некоторым из моих признаков, а логарифмическую трансформацию к другим.
Вопросы и ответы
Вопрос или проблема У меня есть датафрейм, в котором я хочу вернуть количество (долю) пациентов, которые прошли последующий осмотр после диагноза заболевания. Исходный ДФ (пример 1 пациента) | patient_id | app_date | diag_date | cancer_yn | |------------|------------|------------|-----------|
Вопросы и ответы
Вопрос или проблема Предположим, есть набор данных с дублированными PersonID и несколькими датами. PersonID Дата 1 2024-01-01 1 2024-01-02 1 2024-01-09 1 2024-01-15 2 2024-08-05 2 2024-08-06 3 2024-01-07 3 2024-01-08 3 2024-01-15 Я хочу оставить только
Data Science
Вопрос или проблема Я хочу преобразовать некоторые значения признаков в своей модели, используя кубический корень, чтобы уменьшить некоторую асимметрию в своих данных. Однако я заметил, что после того, как я применяю кубический корень к определенным признакам
Data Science
Вопрос или проблема У меня есть набор данных, в котором я ненужно дублировал переменные столбцов, и я хочу его сократить. Я бы хотел, чтобы выходные данные не были такими громоздкими, и мне уже пришлось выполнить некоторую работу, чтобы преобразовать
Data Science
Вопрос или проблема У меня есть набор данных, где переменные имеют высокую асимметрию (> ±1) и куртозис (> ±5). Я попытался удалить выбросы и выполнить логарифмическое преобразование с основанием 10, но асимметрия и куртозис по-прежнему высоки.
Data Science
Вопрос или проблема У меня есть быстрый вопрос о том, нужно ли стандартизировать признаки после логарифмического преобразования. У меня есть один признак, который сильно скошен и требует логарифмического преобразования, для остальных признаков я применяю