Data Science
Как улучшить классификацию документов между двумя похожими документами
00
Вопрос или проблема У меня есть задача классификации документов, где мне нужно определить, связан ли определённый документ с недвижимостью или нет. Я получаю URL веб-страницы, из которой извлекаю весь текст, а затем с помощью своей обученной модели, основанной
Data Science
Учитывая модель регрессии с множеством переменных признаков, какие инструменты вы бы использовали, чтобы определить, какие переменные признаков добавляют наибольшую дисперсию?
00
Вопрос или проблема Предположим, что у нас есть гипотетический набор данных {S} с 100 переменными признаков X и 10 предсказанными переменными Y. X1 … X100 Y1 …. Y10 1 .. 2 3 .. 4 4 .. 3 2 .. 1 Предположим, я хочу повысить точность Y1.
Data Science
Лучший способ решения проблемы с займом
00
Вопрос или проблема У меня есть данные о кредитах, которые мне нужно классифицировать в зависимости от причин получения кредитов, и использовать их для прогнозирования причин, по которым люди всегда обращаются за кредитом. Есть ли у вас предложения?
Data Science
Классификация запросов на обслуживание, заполнение анкеты и регистрация звонков
00
Вопрос или проблема Я совсем новичок в машинном обучении. Я только что прошел несколько учебников в Azure и завершил один практический рабочий процесс (предсказание цены на автомобиль). Надеюсь, что смогу задать здесь базовые вопросы.
Data Science
Сравнение наборов данных – Нужно ли использовать один и тот же тестовый набор данных?
01
Вопрос или проблема Я обучаю модель ML CNN. Я хочу сравнить различные наборы изображений. Эти наборы имеют разные характеристики (переведенные или нет, повернутые или нет и т.д.). Я не изменяю модель ML между обучением на разных наборах данных.
Data Science
Извлечение вывода из строк на основе обучающего набора
00
Вопрос или проблема Предупреждение Я не специалист по данным. У меня есть ощущение, что я упускаю что-то очевидное или не знаю чего-то, и если это так, пожалуйста, будьте ко мне снисходительны! Я хотел бы иметь возможность идентифицировать и извлекать
Data Science
Статистическое обучение для систем с ограниченными данными
00
Вопрос или проблема В настоящее время я провожу обзор количественных методов, используемых для тропического пресноводного рыболовства. Одна из основных проблем для методов моделирования в тропическом пресноводном рыболовстве заключается в нехватке доступных данных.
Data Science
Как я могу использовать частичные метки для классификации?
00
Вопрос или проблема Как можно обучить классификатор на данных, которые не всегда полностью маркированы? Например, предположим, что у нас есть искажённые данные из набора CIFAR-10 (в котором есть метки, такие как птица/автомобиль/корабль/грузовик).
Data Science
Обнаружение аномалий – связь между порогами и аномалиями
00
Вопрос или проблема Я разрабатываю программу для обнаружения аномалий на Python. Основная идея заключается в том, чтобы каждый день создавать новую модель LSTM, обучать ее на данных за предыдущие 7 дней и предсказывать следующий день.
Data Science
xgboost – colsample_bylevel и colsample_bynode
00
Вопрос или проблема Я не совсем понимаю значение этих параметров xgboost или как они отличаются: Если я укажу ровно один из этих параметров (не оба одновременно), colsample_bylevel=0.5 colsample_bynode=0.5 разве алгоритмы не должны вести себя одинаково в обоих случаях?
Data Science
Проблема классификации с временными запаздываниями – какую модель выбрать для предсказания присутствия-отсутствия в будущих временных точках
00
Вопрос или проблема Перед тем как описать свою проблему, я объясню свою выборку данных. Я создал биологическую базу данных, состоящую из микробных данных с 15 географически близких мест, и для каждого из них у меня есть 100 временных точек, всего 1500 точек данных.
Data Science
Существует ли список всех неправильно размеченных изображений MNIST с их правильными метками?
00
Вопрос или проблема Кажется, всем известно, что набор данных MNIST с рукописными цифрами содержит довольно много примеров, где метки явно неверные и соответствуют неправильной цифре; ниже приведены некоторые примеры людей, которые исследовали этот вопрос: https://arxiv.
Data Science
Количество капсул в первичном слое капсульных сетей
00
Вопрос или проблема Какое количество капсул в основной капсульной слой сети капсул? Во многих статьях написано, что количество капсул составляет 32, но в статье Хинтона – Динамическая маршрутизация между капсулами написано, что “
Data Science
Лучший алгоритм для рекомендательной системы на основе текста
00
Вопрос или проблема Помогите мне разобраться в лучшем алгоритме для системы рекомендаций статей, которая использует содержание статей для формирования рекомендаций. Какой алгоритм следует рассмотреть в случае большого объема текстовых данных для рекомендаций?
Вопросы и ответы
Как выполнить вывод пользовательской предобученной модели с использованием mmdet?
00
Вопрос или проблема Я пытаюсь запустить masa с некоторой кастомной моделью (настроенная yolov5xu, если это имеет значение), обученной на внешнем наборе данных. Мне сложно понять, как запустить это с помощью фреймворка mmdet. Документация кажется немного
Data Science
Chromadb на моем локальном компьютере
00
Вопрос или проблема Я пытаюсь установить chromadb на своей локальной системе, но получаю следующую ошибку, даже после установки Microsoft C++ Build Tools: Это связано с тем, что “Chromadb” можно использовать только в Google Colab, и нет возможности
Data Science
Внешние факторы в прогнозировании временных рядов производства электроэнергии
00
Вопрос или проблема Я занимаюсь прогнозированием временных рядов производства электроэнергии по видам электростанций (ядерные, угольные, газовые, солнечные, ветряные, гидроэлектростанции и т.д.) в своей стране на горизонте 5 лет.
Data Science
Какие алгоритмы можно использовать для моделирования многопроцессных процессов?
00
Вопрос или проблема В настоящее время я пытаюсь смоделировать процесс, который имеет несколько последовательных этапов, где информация и результаты предыдущих этапов должны использоваться для прогнозирования последующих этапов.
Data Science
Автоматизированный выбор признаков – Лучшие практики для предотвращения утечки данных?
00
Вопрос или проблема Этот вопрос относится в целом ко всем автоматизированным методам выбора признаков. В моем конкретном случае у нас есть Python-пакет под названием tsfresh и задача многоклассовой классификации. Что было сделано до сих пор?
Data Science
Модель коллаборативной фильтрации на основе классификации
00
Вопрос или проблема Я изучал алгоритмы для предсказания на основе коллаборативной фильтрации. В большинстве источников я читал о использовании матричной факторизации, основанной на оценках схожести пользователя. Но в моем случае мне нужно делать предсказания