Data Science
Data Science
Вопрос или проблема У меня есть генетический алгоритм для задачи маршрутизации транспортного средства с временными окнами, и мне нужно реализовать определенные модификации. Я не уверен, какое будет лучшее представление хромосом.
Data Science
Вопрос или проблема Я нашел очень хорошее объяснение о итерациях и batch_size, опубликованное здесь много лет назад пользователем @Djib2011. Теперь у меня есть вопрос. Если batch_size (5) строк (1-5) были переданы пяти ячейкам LSTM (1-5) для пяти итераций
Data Science
Вопрос или проблема У меня есть набор данных с 20 признаками и 65 образцами. Модели показывали плохие результаты, поэтому я использовал scipy.rbf для интерполяции и добавил 300 дополнительных образцов в набор данных. Производительность моделей значительно
Data Science
Вопрос или проблема Подходит ли обучение с подкреплением для этой задачи или оно будет работать хуже классических алгоритмов? “Задача вызова такси (DARP) заключается в проектировании маршрутов и расписаний для n пользователей, которые указывают
Data Science
Вопрос или проблема В данный момент мы пытаемся разобраться, как LGBM создает свои деревья и как после этого делаются предсказания. На мой нынешний взгляд, это работает следующим образом: Последовательно создаются несколько “
Data Science
Вопрос или проблема Я не совсем уверен в смещении/дисперсии бустированных деревьев решений (особенно LightGBM), поэтому мне интересно, ожидаем ли мы в общем улучшения производительности, создавая ансамбль из нескольких моделей LightGBM, так же как с Random Forest?
Data Science
Вопрос или проблема Я пытался подогнать свою модель по небольшой выборке из 128 образцов для бинарной классификации. Модель должна быть достаточно мощной, так как у нее сотни тысяч параметров. Она должна быть способна переобучиться до 100% точности.
Data Science
Вопрос или проблема В следующем наборе данных, если мы хотим включить только две переменные, STORE и PctDiscMM, в модель классификационного дерева, какое возможное количество первых разбиений? library(islr) data(OJ) length(unique(OJ$PctDiscMM)) length(unique(OJ$
Data Science
Вопрос или проблема У меня есть набор данных, содержащий ЭКГ-сигналы с 5 различными классами, описывающими качество конкретного окна ЭКГ-сигнала. Мне нужно создать модель машинного обучения для предсказания качества сигнала на основе признаков, извлеченных из каждого окна.
Data Science
Вопрос или проблема На графике ниже обнаружение объектов выполняется через точку, указывающую на правильное место, а не через ограничивающий прямоугольник (например, с использованием faster RCNN). Какой метод позволяет обучать такую точку?
Data Science
Вопрос или проблема Хорошая ли идея применять PCA к атрибутам, полученным с помощью Tf-Idf? Tf-idf возвращает много атрибутов, поэтому в этом случае я считаю, что применять PCA, чтобы уменьшить количество измерений, – хорошая идея.
Data Science
Вопрос или проблема Я обучил модель YOLOv7 для задачи обнаружения. У меня только один класс, который является объектом, который я хочу обнаружить. Я запустил test.py с –conf-thresh равным 0.001 (по умолчанию) и второй раз с –
Data Science
Вопрос или проблема Я занимаюсь многоклассовой классификацией и сравниваю влияние двух техник улучшения изображений (IET). IET 1 работает лучше, чем IET 2 при случайном начальном значении x (для разделения на тренировочный, тестовый и валидационный наборы).
Data Science
Вопрос или проблема В Scikit learn есть генератор данных make_regression. Можете кто-нибудь объяснить мне, как будто мне 5 лет, что имеется в виду в документации под “Набор входных данных может быть хорошо обусловленным (по умолчанию) или иметь
Data Science
Вопрос или проблема У меня есть дата-фрейм, который выглядит примерно так: A B C 1 2 2 2 4 3 4 8 5 9 16 7 16 32 11 22 43 14 28 55 17 34 67 20 40 79 23 A, B и C можно считать признаками в литературе по машинному обучению. Я изучал […]
Data Science
Вопрос или проблема Как мне присвоить вероятность предсказанию, выведенному моделью гауссовского наивного байеса? Я спрашиваю, потому что функция predict_proba, которую вы можете использовать с классификатором гауссовского наивного байеса в sklearn, дает
Data Science
Вопрос или проблема Предположим, у меня есть набор данных из 50 000 записей, из которых примерно 2% отсутствовали изначально. Из того, что я узнал, нам нужно использовать индикаторы для сравнения модели импутации с истинным значением, чтобы проверить
Data Science
Вопрос или проблема Я работал над простым API компьютерного зрения с несколькими конечными точками для извлечения полезной информации из изображений ebay. API размещается в контейнере Docker, который ищет h5 файлы, загружает их, если они отсутствуют
Data Science
Вопрос или проблема Я пытаюсь создать модель NER, которая может называть сущности в “Описание работы”. Сущности: Обязательные навыки (Обязательные навыки, такие как java, python, c++ и т.д.) Желательные навыки (кандидат “
Data Science
Вопрос или проблема У нас есть задача классификации с несколькими классами под контролем, где необходимо предсказать две цели для каждого образца: ‘бренд’ и ‘категория’. Наши признаки – ‘shop_name’