model-selection - ответы на вопросы

Data Science

Как выбрать «лучший» алгоритм обучения без учителя для кластеризации моего конкретного набора данных?

00

Вопрос или проблема Я хочу кластеризовать набор данных без предварительного знания о правильном количестве кластеров. Для разных алгоритмов (например, k-means, GMM и т.д.) я могу перебирать различные значения и пытаться найти лучшее решение для любого

Data Science

Должны ли отбор признаков и отбор модели иметь одинаковое соотношение между набором для разработки и тестовым набором?

00

Вопрос или проблема Как указано в заголовке, после того как я провел отбор признаков, обязательно ли соблюдать то же самое соотношение (между набором для разработки и тестовым набором) в отборе модели? Если я правильно понимаю, вы отобрали определенный

Data Science

Машинное обучение: Сравнение моделей классификации

00

Вопрос или проблема Дан набор данных, который мне нужно использовать для классификации, и я хочу сравнить эффективность различных моделей классификации. Предположим, я хочу рассмотреть логистическую регрессию (с разными точками отсечения) и KNN.

Data Science

Нейронная сеть – Разреженность коллаборативной фильтрации и моделирование задачи прогноза

00

Вопрос или проблема Я довольно новичок в машинном обучении и, кстати, в нейронных сетях, но последние несколько дней решил попробовать решить довольно классическую и практическую задачу нейронных сетей/машинного обучения, такую как рекомендательные системы.

Data Science

Одинаковая точность валидации, разная точность обучения для двух моделей нейронных сетей

00

Вопрос или проблема Я выполняю классификацию эмоций на наборе данных FER2013. Я пытаюсь измерить производительность различных моделей, и когда я проверил ImageDataGenerator с моделью, которую уже использовал, я столкнулся со следующей ситуацией: Модель

Data Science

Как я могу подойти к этой проблеме?

00

Вопрос или проблема Предположим, у меня есть набор данных с информацией о ценах на один и тот же рейс за прошлый год. Таким образом, для рейса, вылетающего в день D, у меня есть доступная цена от D-130 до D (день вылета). Затем то же самое для рейсов

Data Science

Регрессионная модель для непрерывной зависимой переменной и количественных независимых переменных

00

Вопрос или проблема В данный момент я изучаю R и относительно новичок в этой области. Надеюсь, что смогу получить от вас советы! Я работаю над проектом, в котором мне необходимо оценить среднее время обработки различных рабочих заданий (задач).

Data Science

Советы по моделированию/симуляции распространения энергии в США от изогнутой поверхности через три среды?

00

Вопрос или проблема Я работаю над проблемой, связанной с цилиндрическим ультразвуковым преобразователем, предназначенным для радиального излучения. Установленный вертикально (осевая длина перпендикулярна земле), преобразователь излучает энергию по окружности

Data Science

Является ли k-means с расстоянием Махаланобиса действительным вариантом для кластеризации?

00

Вопрос или проблема Я хочу получить больше информации о том, является ли k-means с расстоянием Махаланобиса математически/методологически корректным вариантом для наборов данных с различной дисперсией кластеров. Шаги следующие: Создайте агрегированные

Data Science

Является ли хорошей практикой оценивать эффективность модели, сравнивая метрики пересчитанных (обратным образом преобразованных) предсказаний и истинных целевых значений?

00

Вопрос или проблема Я сейчас работаю с линейной регрессией для задачи регрессии временных рядов (извините, но я не могу рассказать слишком много о проблеме и векторе признаков из-за соглашения о неразглашении). Я масштабировал как входные значения, так

Data Science

Вопрос переноса обучения: Расширение функциональности модели машинного обучения для многопозиценной оценки?

00

Вопрос или проблема Я экспериментировал с рядом различных моделей машинного обучения, используемых для оценки позы. Большинство из них выдают тепловую карту и смещения для обнаруженных человек(ов) на изображении. Мне действительно нравится производительность

Data Science

Выбор модели в активном обучении

00

Вопрос или проблема Я занимаюсь активным обучением и мне интересно, как сочетать это с поиском лучшей архитектуры для сети. На мой взгляд, активное обучение использует эвристику для выбора лучших экземпляров для аннотирования, чтобы учиться как можно быстрее.

Data Science

Модель для предсказания продолжительности на основе категориальных данных

00

Вопрос или проблема Я работаю над моделью, которая позволит мне предсказать, сколько времени потребуется для завершения “работы”, основываясь на исторических данных. Каждая работа имеет несколько категориальных характеристик (все независимы)

Data Science

Рейтинг банкоматов на основе использования и экономических данных (Модель оценки/рейтинга)

00

Вопрос или проблема У меня есть образец данных о расположении около 10 банкоматов, а также их количестве использования (внесения наличных, снятия наличных и других операций) за последние 3 месяца. Я планирую собрать дополнительные данные, такие как ближайшие

Data Science

Как я могу сравнить точность моделей импутации, если в файле уже есть пропущенные данные?

00

Вопрос или проблема Предположим, у меня есть набор данных из 50 000 записей, из которых примерно 2% отсутствовали изначально. Из того, что я узнал, нам нужно использовать индикаторы для сравнения модели импутации с истинным значением, чтобы проверить

Data Science

Нахождение уравнения для модели множественной и нелинейной регрессии?

00

Вопрос или проблема Что касается нелинейной и многомерной регрессии, я использую R или Matlab. В случае, когда у меня есть регрессия только с двумя переменными, я просто рисую график Y относительно X и ищу уравнение модели, которое наилучшим образом соответствует

Data Science

Проблема: Производительность логистической регрессии и моделей на основе деревьев на малом несбалансированном наборе данных

00

Вопрос или проблема У меня есть небольшой набор данных с 300 строками и несбалансированным распределением классов (35% положительных). Когда я обучаю модель логистической регрессии, она постоянно показывает результаты хуже случайного выбора.

Data Science

Могу ли я сравнить средние абсолютные значения SHAP для разных моделей?

00

Вопрос или проблема Я сравниваю 3 различные классификатора: ANN, XG Boost и Random Forest для прогнозирования. Я также использовал SHAP для оценки важности признаков. Меня интересуют только 10 лучших признаков на основе SHAP. 3 классификатора имеют только

Data Science

Как сравнить производительность моделей SVM и Keras

00

Вопрос или проблема Я применил как SVM, так и CNN (используя Keras) на одном наборе данных. Теперь я хочу сравнить производительность обеих моделей. Функция Keras model.evaluate предсказывает выходные данные для данного ввода, а затем вычисляет заданную в model.

Data Science

Откуда взялось правило “глубокое обучение требует больших данных”?

00

Вопрос или проблема Читая о глубоких нейронных сетях, я часто сталкиваюсь с утверждением, что глубокое обучение эффективно только тогда, когда у вас есть большие объемы данных. Эти утверждения обычно сопровождаются таким рисунком: Пример (взятый из https://hackernoon.com/%EF%B8%8F-big-challenge-in-deep-learning-training-data-31a88b97b282) приписывается “