Data Science
Сравнение наборов данных – Нужно ли использовать один и тот же тестовый набор данных?
01
Вопрос или проблема Я обучаю модель ML CNN. Я хочу сравнить различные наборы изображений. Эти наборы имеют разные характеристики (переведенные или нет, повернутые или нет и т.д.). Я не изменяю модель ML между обучением на разных наборах данных.
Data Science
Извлечение вывода из строк на основе обучающего набора
00
Вопрос или проблема Предупреждение Я не специалист по данным. У меня есть ощущение, что я упускаю что-то очевидное или не знаю чего-то, и если это так, пожалуйста, будьте ко мне снисходительны! Я хотел бы иметь возможность идентифицировать и извлекать
Data Science
Статистическое обучение для систем с ограниченными данными
00
Вопрос или проблема В настоящее время я провожу обзор количественных методов, используемых для тропического пресноводного рыболовства. Одна из основных проблем для методов моделирования в тропическом пресноводном рыболовстве заключается в нехватке доступных данных.
Data Science
Как я могу использовать частичные метки для классификации?
00
Вопрос или проблема Как можно обучить классификатор на данных, которые не всегда полностью маркированы? Например, предположим, что у нас есть искажённые данные из набора CIFAR-10 (в котором есть метки, такие как птица/автомобиль/корабль/грузовик).
Data Science
Обнаружение аномалий – связь между порогами и аномалиями
00
Вопрос или проблема Я разрабатываю программу для обнаружения аномалий на Python. Основная идея заключается в том, чтобы каждый день создавать новую модель LSTM, обучать ее на данных за предыдущие 7 дней и предсказывать следующий день.
Data Science
xgboost – colsample_bylevel и colsample_bynode
00
Вопрос или проблема Я не совсем понимаю значение этих параметров xgboost или как они отличаются: Если я укажу ровно один из этих параметров (не оба одновременно), colsample_bylevel=0.5 colsample_bynode=0.5 разве алгоритмы не должны вести себя одинаково в обоих случаях?
Data Science
Проблема классификации с временными запаздываниями – какую модель выбрать для предсказания присутствия-отсутствия в будущих временных точках
00
Вопрос или проблема Перед тем как описать свою проблему, я объясню свою выборку данных. Я создал биологическую базу данных, состоящую из микробных данных с 15 географически близких мест, и для каждого из них у меня есть 100 временных точек, всего 1500 точек данных.
Data Science
Существует ли список всех неправильно размеченных изображений MNIST с их правильными метками?
00
Вопрос или проблема Кажется, всем известно, что набор данных MNIST с рукописными цифрами содержит довольно много примеров, где метки явно неверные и соответствуют неправильной цифре; ниже приведены некоторые примеры людей, которые исследовали этот вопрос: https://arxiv.
Data Science
Количество капсул в первичном слое капсульных сетей
00
Вопрос или проблема Какое количество капсул в основной капсульной слой сети капсул? Во многих статьях написано, что количество капсул составляет 32, но в статье Хинтона – Динамическая маршрутизация между капсулами написано, что “
Data Science
Лучший алгоритм для рекомендательной системы на основе текста
00
Вопрос или проблема Помогите мне разобраться в лучшем алгоритме для системы рекомендаций статей, которая использует содержание статей для формирования рекомендаций. Какой алгоритм следует рассмотреть в случае большого объема текстовых данных для рекомендаций?
Вопросы и ответы
Как выполнить вывод пользовательской предобученной модели с использованием mmdet?
00
Вопрос или проблема Я пытаюсь запустить masa с некоторой кастомной моделью (настроенная yolov5xu, если это имеет значение), обученной на внешнем наборе данных. Мне сложно понять, как запустить это с помощью фреймворка mmdet. Документация кажется немного
Data Science
Chromadb на моем локальном компьютере
00
Вопрос или проблема Я пытаюсь установить chromadb на своей локальной системе, но получаю следующую ошибку, даже после установки Microsoft C++ Build Tools: Это связано с тем, что “Chromadb” можно использовать только в Google Colab, и нет возможности
Data Science
Внешние факторы в прогнозировании временных рядов производства электроэнергии
00
Вопрос или проблема Я занимаюсь прогнозированием временных рядов производства электроэнергии по видам электростанций (ядерные, угольные, газовые, солнечные, ветряные, гидроэлектростанции и т.д.) в своей стране на горизонте 5 лет.
Data Science
Какие алгоритмы можно использовать для моделирования многопроцессных процессов?
00
Вопрос или проблема В настоящее время я пытаюсь смоделировать процесс, который имеет несколько последовательных этапов, где информация и результаты предыдущих этапов должны использоваться для прогнозирования последующих этапов.
Data Science
Автоматизированный выбор признаков – Лучшие практики для предотвращения утечки данных?
00
Вопрос или проблема Этот вопрос относится в целом ко всем автоматизированным методам выбора признаков. В моем конкретном случае у нас есть Python-пакет под названием tsfresh и задача многоклассовой классификации. Что было сделано до сих пор?
Data Science
Модель коллаборативной фильтрации на основе классификации
00
Вопрос или проблема Я изучал алгоритмы для предсказания на основе коллаборативной фильтрации. В большинстве источников я читал о использовании матричной факторизации, основанной на оценках схожести пользователя. Но в моем случае мне нужно делать предсказания
Data Science
Показывает ли этот результат переобучение?
00
Вопрос или проблема Результаты модели случайного леса, которую я настроил с помощью gridsearch, следующие. Я также построил кривую обучения для нее. Вы считаете, что эта модель имеет сильное переобучение? Среднее значение целевых переменных равно 850.
Data Science
Прогнозирование продаж скрытых товаров магазина
00
Вопрос или проблема Я работаю над задачей прогнозирования продаж. Я могу предоставить алгоритму данные о том, какие товары были проданы, а какие нет.Как можно предоставить алгоритму информацию о товарах, которых нет в магазине?
Data Science
Как квантование может замедлить модель?
00
Вопрос или проблема Я работаю с библиотекой SentenceTransformers с одной из их моделей встраивания. Производительность хорошая, но я хотел бы пожертвовать частью точности ради повышения производительности. Я пробовал квантизировать модель, с которой работаю
Data Science
Как улучшить модель предсказания видео в Keras?
00
Вопрос или проблема Я работаю над моделью прогнозирования преступлений. У меня есть изображения того, как преступления выглядят каждый день в городе в течение года, и я хочу использовать 30 дней преступности для прогнозирования 31-го дня (так же, как