model-selection
Data Science
Вопрос или проблема Я хочу кластеризовать набор данных без предварительного знания о правильном количестве кластеров. Для разных алгоритмов (например, k-means, GMM и т.д.) я могу перебирать различные значения и пытаться найти лучшее решение для любого
Data Science
Вопрос или проблема Как указано в заголовке, после того как я провел отбор признаков, обязательно ли соблюдать то же самое соотношение (между набором для разработки и тестовым набором) в отборе модели? Если я правильно понимаю, вы отобрали определенный
Data Science
Вопрос или проблема Дан набор данных, который мне нужно использовать для классификации, и я хочу сравнить эффективность различных моделей классификации. Предположим, я хочу рассмотреть логистическую регрессию (с разными точками отсечения) и KNN.
Data Science
Вопрос или проблема Я довольно новичок в машинном обучении и, кстати, в нейронных сетях, но последние несколько дней решил попробовать решить довольно классическую и практическую задачу нейронных сетей/машинного обучения, такую как рекомендательные системы.
Data Science
Вопрос или проблема Я выполняю классификацию эмоций на наборе данных FER2013. Я пытаюсь измерить производительность различных моделей, и когда я проверил ImageDataGenerator с моделью, которую уже использовал, я столкнулся со следующей ситуацией: Модель
Data Science
Вопрос или проблема Предположим, у меня есть набор данных с информацией о ценах на один и тот же рейс за прошлый год. Таким образом, для рейса, вылетающего в день D, у меня есть доступная цена от D-130 до D (день вылета). Затем то же самое для рейсов
Data Science
Вопрос или проблема В данный момент я изучаю R и относительно новичок в этой области. Надеюсь, что смогу получить от вас советы! Я работаю над проектом, в котором мне необходимо оценить среднее время обработки различных рабочих заданий (задач).
Data Science
Вопрос или проблема Я работаю над проблемой, связанной с цилиндрическим ультразвуковым преобразователем, предназначенным для радиального излучения. Установленный вертикально (осевая длина перпендикулярна земле), преобразователь излучает энергию по окружности
Data Science
Вопрос или проблема Я хочу получить больше информации о том, является ли k-means с расстоянием Махаланобиса математически/методологически корректным вариантом для наборов данных с различной дисперсией кластеров. Шаги следующие: Создайте агрегированные
Data Science
Вопрос или проблема Я сейчас работаю с линейной регрессией для задачи регрессии временных рядов (извините, но я не могу рассказать слишком много о проблеме и векторе признаков из-за соглашения о неразглашении). Я масштабировал как входные значения, так
Data Science
Вопрос или проблема Я экспериментировал с рядом различных моделей машинного обучения, используемых для оценки позы. Большинство из них выдают тепловую карту и смещения для обнаруженных человек(ов) на изображении. Мне действительно нравится производительность
Data Science
Вопрос или проблема Я занимаюсь активным обучением и мне интересно, как сочетать это с поиском лучшей архитектуры для сети. На мой взгляд, активное обучение использует эвристику для выбора лучших экземпляров для аннотирования, чтобы учиться как можно быстрее.
Data Science
Вопрос или проблема Я работаю над моделью, которая позволит мне предсказать, сколько времени потребуется для завершения “работы”, основываясь на исторических данных. Каждая работа имеет несколько категориальных характеристик (все независимы)
Data Science
Вопрос или проблема У меня есть образец данных о расположении около 10 банкоматов, а также их количестве использования (внесения наличных, снятия наличных и других операций) за последние 3 месяца. Я планирую собрать дополнительные данные, такие как ближайшие
Data Science
Вопрос или проблема Предположим, у меня есть набор данных из 50 000 записей, из которых примерно 2% отсутствовали изначально. Из того, что я узнал, нам нужно использовать индикаторы для сравнения модели импутации с истинным значением, чтобы проверить
Data Science
Вопрос или проблема Что касается нелинейной и многомерной регрессии, я использую R или Matlab. В случае, когда у меня есть регрессия только с двумя переменными, я просто рисую график Y относительно X и ищу уравнение модели, которое наилучшим образом соответствует
Data Science
Вопрос или проблема У меня есть небольшой набор данных с 300 строками и несбалансированным распределением классов (35% положительных). Когда я обучаю модель логистической регрессии, она постоянно показывает результаты хуже случайного выбора.
Data Science
Вопрос или проблема Я сравниваю 3 различные классификатора: ANN, XG Boost и Random Forest для прогнозирования. Я также использовал SHAP для оценки важности признаков. Меня интересуют только 10 лучших признаков на основе SHAP. 3 классификатора имеют только
Data Science
Вопрос или проблема Я применил как SVM, так и CNN (используя Keras) на одном наборе данных. Теперь я хочу сравнить производительность обеих моделей. Функция Keras model.evaluate предсказывает выходные данные для данного ввода, а затем вычисляет заданную в model.
Data Science
Вопрос или проблема Читая о глубоких нейронных сетях, я часто сталкиваюсь с утверждением, что глубокое обучение эффективно только тогда, когда у вас есть большие объемы данных. Эти утверждения обычно сопровождаются таким рисунком: Пример (взятый из https://hackernoon.com/%EF%B8%8F-big-challenge-in-deep-learning-training-data-31a88b97b282) приписывается “