Data Science
Хорошее представление хромосомы в генетическом алгоритме VRPTW
00
Вопрос или проблема У меня есть генетический алгоритм для задачи маршрутизации транспортного средства с временными окнами, и мне нужно реализовать определенные модификации. Я не уверен, какое будет лучшее представление хромосом.
Data Science
Размер пакета против нейронов LSTM в скрытом слое
00
Вопрос или проблема Я нашел очень хорошее объяснение о итерациях и batch_size, опубликованное здесь много лет назад пользователем @Djib2011. Теперь у меня есть вопрос. Если batch_size (5) строк (1-5) были переданы пяти ячейкам LSTM (1-5) для пяти итераций
Data Science
Радиальная базисная функция для увеличения данных
00
Вопрос или проблема У меня есть набор данных с 20 признаками и 65 образцами. Модели показывали плохие результаты, поэтому я использовал scipy.rbf для интерполяции и добавил 300 дополнительных образцов в набор данных. Производительность моделей значительно
Data Science
Подходит ли обучение с подкреплением для задачи “Заказ автомобиля”?
00
Вопрос или проблема Подходит ли обучение с подкреплением для этой задачи или оно будет работать хуже классических алгоритмов? “Задача вызова такси (DARP) заключается в проектировании маршрутов и расписаний для n пользователей, которые указывают
Data Science
Как LGBM делает предсказание?
00
Вопрос или проблема В данный момент мы пытаемся разобраться, как LGBM создает свои деревья и как после этого делаются предсказания. На мой нынешний взгляд, это работает следующим образом: Последовательно создаются несколько “
Data Science
Случайный лес LightGBM
00
Вопрос или проблема Я не совсем уверен в смещении/дисперсии бустированных деревьев решений (особенно LightGBM), поэтому мне интересно, ожидаем ли мы в общем улучшения производительности, создавая ансамбль из нескольких моделей LightGBM, так же как с Random Forest?
Data Science
Какова может быть проблема, приводящая к тому, что модель никогда не может идеально переобучиться?
00
Вопрос или проблема Я пытался подогнать свою модель по небольшой выборке из 128 образцов для бинарной классификации. Модель должна быть достаточно мощной, так как у нее сотни тысяч параметров. Она должна быть способна переобучиться до 100% точности.
Data Science
Как вычислить возможное количество разбиений в дереве решений?
00
Вопрос или проблема В следующем наборе данных, если мы хотим включить только две переменные, STORE и PctDiscMM, в модель классификационного дерева, какое возможное количество первых разбиений? library(islr) data(OJ) length(unique(OJ$PctDiscMM)) length(unique(OJ$
Data Science
Когда мне следует делать разделение на обучающую и тестовую выборки, а также отбор признаков, если мой набор данных несбалансированный?
00
Вопрос или проблема У меня есть набор данных, содержащий ЭКГ-сигналы с 5 различными классами, описывающими качество конкретного окна ЭКГ-сигнала. Мне нужно создать модель машинного обучения для предсказания качества сигнала на основе признаков, извлеченных из каждого окна.
Data Science
Обучите точку вместо ограничивающего прямоугольника для обнаружения объектов.
00
Вопрос или проблема На графике ниже обнаружение объектов выполняется через точку, указывающую на правильное место, а не через ограничивающий прямоугольник (например, с использованием faster RCNN). Какой метод позволяет обучать такую точку?
Data Science
Запуск PCA на основе признаков tf-idf?
00
Вопрос или проблема Хорошая ли идея применять PCA к атрибутам, полученным с помощью Tf-Idf? Tf-idf возвращает много атрибутов, поэтому в этом случае я считаю, что применять PCA, чтобы уменьшить количество измерений, – хорошая идея.
Data Science
YOLO: почему изменение порога достоверности изменяет [email protected]?
00
Вопрос или проблема Я обучил модель YOLOv7 для задачи обнаружения. У меня только один класс, который является объектом, который я хочу обнаружить. Я запустил test.py с –conf-thresh равным 0.001 (по умолчанию) и второй раз с –
Data Science
Может ли производительность CNN зависеть от случайного семени разделения на обучение, тестирование и валидацию?
00
Вопрос или проблема Я занимаюсь многоклассовой классификацией и сравниваю влияние двух техник улучшения изображений (IET). IET 1 работает лучше, чем IET 2 при случайном начальном значении x (для разделения на тренировочный, тестовый и валидационный наборы).
Data Science
Что (в мире) такое хорошо обусловленный против низкозначного многопрофильного сингулярного распределения?
00
Вопрос или проблема В Scikit learn есть генератор данных make_regression. Можете кто-нибудь объяснить мне, как будто мне 5 лет, что имеется в виду в документации под “Набор входных данных может быть хорошо обусловленным (по умолчанию) или иметь
Data Science
Как построить генеративную модель, когда у нас есть более одной переменной
00
Вопрос или проблема У меня есть дата-фрейм, который выглядит примерно так: A B C 1 2 2 2 4 3 4 8 5 9 16 7 16 32 11 22 43 14 28 55 17 34 67 20 40 79 23 A, B и C можно считать признаками в литературе по машинному обучению. Я изучал […]
Data Science
Вероятность гауссовского наивного байеса
00
Вопрос или проблема Как мне присвоить вероятность предсказанию, выведенному моделью гауссовского наивного байеса? Я спрашиваю, потому что функция predict_proba, которую вы можете использовать с классификатором гауссовского наивного байеса в sklearn, дает
Data Science
Как я могу сравнить точность моделей импутации, если в файле уже есть пропущенные данные?
00
Вопрос или проблема Предположим, у меня есть набор данных из 50 000 записей, из которых примерно 2% отсутствовали изначально. Из того, что я узнал, нам нужно использовать индикаторы для сравнения модели импутации с истинным значением, чтобы проверить
Data Science
Ошибка типа “прерывистая” при запуске CNN внутри контейнера Docker
00
Вопрос или проблема Я работал над простым API компьютерного зрения с несколькими конечными точками для извлечения полезной информации из изображений ebay. API размещается в контейнере Docker, который ищет h5 файлы, загружает их, если они отсутствуют
Data Science
Геуристики для предсказания модели NER
00
Вопрос или проблема Я пытаюсь создать модель NER, которая может называть сущности в “Описание работы”. Сущности: Обязательные навыки (Обязательные навыки, такие как java, python, c++ и т.д.) Желательные навыки (кандидат “
Data Science
Задача многоклассовой классификации с несколькими целями для прогнозирования
00
Вопрос или проблема У нас есть задача классификации с несколькими классами под контролем, где необходимо предсказать две цели для каждого образца: ‘бренд’ и ‘категория’. Наши признаки – ‘shop_name’