Data Science
SelectKBest и корреляция возвращают мне абсолютно одинаковый выбор признаков. Как?
00
Вопрос или проблема Я работаю над выбором наиболее эффективных признаков из набора данных с более чем 2000 признаками. Я использую для этого разные алгоритмы (selectKBest с хи-квадратом, Extra Trees, Корреляция и т.д.). Но когда я смотрю на рейтинг признаков
Data Science
Как оценить точность на большом наборе данных?
00
Вопрос или проблема Учитывая, что у меня есть модель глубокого обучения (передача от бывшего коллеги). По какой-то причине наборы для обучения и валидации отсутствовали. В моей ситуации я хочу классифицировать свои данные на 100 категорий.
Data Science
Как группировать по столбцу и суммировать значения
00
Вопрос или проблема У меня есть таблица, которая выглядит так: Я хочу суммировать все значения для каждого гена для каждого столбца. Например, для LINC01128 это должно выглядеть так: ConN1 ConN2 ConN3 StN1 StN2 StN3 LINC01128 : 22 14 37 34 54 67 Моя таблица
Data Science
Значения метрик равны при обучении и тестировании модели.
00
Вопрос или проблема Я работаю над моделью нейронной сети с использованием Python, Keras и TensorFlow в качестве бэкенда. Набор данных содержит две последовательности с результатом, который может быть 1 или 0, и соотношение положительных и отрицательных
Data Science
RNN работает хуже, чем случайные угадывания на больших наборах данных.
00
Вопрос или проблема Я должен начать с того, что я здесь 100% новичок. Я обучал модель RNN на наборе данных из 30 классов с более чем 90000 образцов, и она достигла менее 2% точности. Обучив ту же модель на небольшом подмножестве тех же данных (только
Data Science
Аугментация данных в изображениях
00
Вопрос или проблема Предположим, есть ML-сеть, которая принимает серые изображения в качестве входных данных. У меня есть изображения в формате RGB. Поэтому, вместо того чтобы конвертировать эти RGB-изображения в градации серого, я рассматриваю каждую
Data Science
Как сгладить линии после добавления дополнительной точки?
00
Вопрос или проблема На самом деле, я отслеживаю судно, для которого уже есть маршрут и текущая позиция. Теперь проблема в том, что очевидно, что судно не будет находиться на тех же координатах, что и указано в маршруте. Поэтому я хочу связать текущие
Data Science
как реализовать VLOOKUP в Excel на Python
00
Вопрос или проблема У меня есть набор данных A и набор данных B, оба набора данных имеют общий столбец, который является идентификатором (ID). Я хочу проверить, можно ли найти значения идентификаторов A в значениях идентификаторов B.
Data Science
На каких данных оценивать модель детекции объектов? (на аналогичных или реальных данных?)
00
Вопрос или проблема Я обучаю модель обнаружения объектов (SSD300) для распознавания и классификации поз тела на термографических изображениях. Несмотря на то, что у меня есть более 2 тысяч различных поз, фон не меняется значительно (у меня только 5 различных точек зрения).
Data Science
Мультистикерная классификация пользователей на основе нескольких сообщений
00
Вопрос или проблема В настоящее время я выполняю курсовой проект для учебного курса в университете, и моя задача заключается в классификации многометочных пользовательских профилей на основе их публикаций в социальных сетях. Для каждого пользователя есть
Data Science
XGboost с учетом групповых и индивидуальных данных
00
Вопрос или проблема Мой набор данных состоит из комбинации двух баз данных. Одна база данных содержит индивидуальные данные о характеристиках и компенсации пяти главных исполнительных директоров крупных американских компаний. Вторая база данных содержит
Data Science
Решения для маркировки обучающих данных для задач бинарной классификации
00
Вопрос или проблема У меня есть огромный набор данных, для которого я пытаюсь использовать метод 80-20 (метод отложенной выборки) для обучения и тестирования моей модели. Однако набор данных, который мне был предоставлен, содержит 6 миллионов строк.
Data Science
Как работает кросс-энтропия с функцией активации Softmax?
00
Вопрос или проблема Я нашел в интернете, что производная функции активации кросс-энтропии с активацией softmax равна (выход – ожидаемое), что очень меня запутало. Если, например, ожидаемое значение равно 1, и так как выход всегда меньше 1 (softmax)
Data Science
Улучшение матричной факторизации
00
Вопрос или проблема Я использую матричное разложение SGD (python) с использованием набора данных movielens для создания рекомендаций. У меня есть веб-сайт, который позволяет пользователям оставлять отзывы, которые могут быть положительными или отрицательными
Data Science
Могу ли я изменить разделение данных после создания модели?
00
Вопрос или проблема Я создал модель, но понял, что неправильно разделил данные между обучающим и тестовым наборами, поэтому точность предсказания низкая. Неэтично ли начать моделирование заново и изменить разделение данных? Сначала вы правильно рандомизировали свой набор данных?
Data Science
Темы исследований в конформном прогнозировании
00
Вопрос или проблема Моя специализация – эконометрика, и скоро я начну работать над своей магистерской диссертацией. В последнее время меня заинтересовали методы оценки неопределенности, в частности, Конформное Прогнозирование.
Data Science
Могу ли я загрузить свои собственные веса?
00
Вопрос или проблема Исходный код: #Загрузите предобученные веса COCO !wget --quiet https://github.com/matterport/Mask_RCNN/releases/download/v2.0/mask_rcnn_coco.h5 !ls -lh mask_rcnn_coco.h5 COCO_WEIGHTS_PATH = "mask_rcnn_coco.
Data Science
Почему я получаю разную производительность на разных запусках моей ML модели?
00
Вопрос или проблема Я обучаю модели машинного обучения (Xgboost и LightGbm) с использованием snowpark, но после каждой попытки у меня получаются разные значения метрик (AUC, Средняя точность), и поэтому я никогда не знаю, какая моя лучшая модель.
Data Science
ValueError: Слой модели ожидает 2 входа, но получил 3 входных тензора, используя генератор.
00
Вопрос или проблема Я пытаюсь подогнать модель с использованием генератора и получаю следующую ошибку: ValueError: Слой модели ожидает 2 входа, но получил 3 входных тензора. Полученные входы: [<tf.Tensor 'IteratorGetNext:0' shape=(None, None) dtype=float32>
Data Science
Как продвигаться с токенизированным текстовым контентом, который представлен в числовом виде?
00
Вопрос или проблема У меня есть один набор данных с отзывами клиентов, но текстовые данные представлены в виде токенизированных чисел. Я не знаю, как дальше поступить, подскажите, пожалуйста, как действовать? Так как я сталкиваюсь с таким набором данных