Data Science
Удаление выбросов из многомерного набора данных и Увеличение данных
00
Вопрос или проблема Удаление выбросов из одноберных данных можно легко выполнить, убирая точки, которые находятся за пределами диапазона IQR. Но как должен проходить процесс обнаружения и удаления выбросов, если набор данных состоит из нескольких измерений?
Data Science
Как прогнозировать доход от контрактов с привязкой ко времени?
00
Вопрос или проблема Я изучаю идеи о том, как я могу прогнозировать доход от контрактов. Например, у меня могут быть клиенты, которые приобрели ежемесячный мобильный план, годовой план или трехлетний план. Как я могу использовать эту информацию для прогнозирования дохода?
Data Science
Оценка неопределенности регрессионных моделей
00
Вопрос или проблема Учитывая регрессионную модель с n признаками, как я могу измерить неопределенность или доверие к модели для каждого предсказания? Предположим, для конкретного предсказания точность потрясающая, но для другого –
Data Science
Многофункциональный One-Hot-кодировщик с переменным количеством экземпляров признаков
00
Вопрос или проблема Предположим, у нас есть данные в таких экземплярах: [ [15, 20, ("банан","яблоко","огурец"), ...], [91, 12, ("апельсин","банан"), ...], ... ] Мне интересно, как я могу закодировать третий элемент этих данных.
Data Science
Возможно ли для компьютеров определить, сколько людей говорит в аудиозаписи?
00
Вопрос или проблема Предположим, у меня есть аудиозапись 15 студентов, которые одновременно говорят “Я здесь”. Могу ли я сказать, сколько студентов говорило и кто они, используя машинное обучение? Я хочу создать приложение для учета посещаемости
Data Science
Можно ли вычислить оценку Дэвиса-Боулдина на основе заранее вычисленной матрицы расстояний с использованием sklearn?
00
Вопрос или проблема Я пытаюсь вычислить показатель Дависа-Боулдина, чтобы сравнить различные подходы к кластеризации. У меня есть предрасчитанная матрица расстояний (которая представляет собой расстояние на основе редактирования между текстами).
Data Science
Python использует conda-base tensorflow-gpu вместо установки conda окружения.
00
Вопрос или проблема Я хочу создать виртуальную среду с помощью anaconda для python 3, в которой я смогу использовать конкретную версию tensorflow-gpu. Моя базовая версия conda python – 3.6.8, а базовая версия tensorflow-gpu –
Data Science
Как выполнить обратный пошаговый отбор в Python
00
Вопрос или проблема В настоящее время я работаю с книгой: «Введение в статистическое обучение с приложениями на Python». В упражнениях до сих пор я использовал пакет ISLP. Сейчас я пытаюсь решить упражнения из главы 6 и застрял на вопросе 8, часть (d).
Data Science
Почему дисперсия моих предсказаний модели значительно меньше, чем у обучающих данных?
00
Вопрос или проблема Я обучил модель GRU на некоторых данных и затем создал множество предсказаний на тестовом наборе. Предсказания действительно плохие, о чем свидетельствует почти нулевой коэффициент детерминации R2. Я замечаю, что дисперсия предсказаний
Data Science
Бинарная классификация с использованием RNN не превышает 50% точности.
00
Вопрос или проблема Я пытаюсь выяснить причину, по которой моя сеть RNN не может превысить 50% для двоичной классификации. Мои входные данные имеют форму: X.shape - TensorShape([9585, 25, 2]) Мои метки представляют собой вектор с единым измерением с значениями 1.0 и 0.0: y - <
Data Science
Сочетание нескольких вероятностей от классификатора. Пропагирование вероятностей.
00
Вопрос или проблема Допустим, я обучил классификатор, который классифицирует изображения животных на 10 разных классов. И предположим, что у меня есть 20 различных изображений конкретного животного, и поскольку я знаю фотографа, я с уверенностью знаю
Data Science
сбивающий с толку относительно кластеризации k-means для корреляции данных
00
Вопрос или проблема Я пытаюсь обдумать свой процесс, прежде чем начать какое-либо реальное программирование. Однако я легко запутался. Предположим, у меня есть 100 инструментов, и я знаю их ценовые колебания каждый день в течение года.
Data Science
как обучить пользовательские векторы слов word2vec для поиска связанных статей?
00
Вопрос или проблема Я начинающий в машинном обучении. Мой проект заключается в создании поисковой системы на основе ИИ, которая показывает связанные статьи, когда мы ищем на сайте. Для этого я решил обучить свое собственное встраивание.
Data Science
Заполнение большого количества пропущенных значений произвольным значением
00
Вопрос или проблема У меня есть набор данных, скажем, с 1 миллионом наблюдений. В качестве глупого примера представим, что мы хотим предсказать, может ли человек стать специалистом по данным или нет (0/1). У меня есть переменные, в которых много пропусков
Data Science
Извлечь фразы/ключевые слова, которые ПОДОБНЫ списку ключевых слов/фраз на Python, из документа.
00
Вопрос или проблема ИЗМЕНЕНИЕ : Если бы мне нужно было сопоставить односоставные фразы, я мог бы сначала токенизировать текст из документа, а затем рассчитать косинусное сходство всех токенов со всеми ключевыми словами из keyword_list.
Data Science
Ищем алгоритм кластеризации для сильно зашумленных данных.
00
Вопрос или проблема Я пытаюсь найти кластеры в некоторых данных с высоким уровнем шума (см. график ниже, данные здесь). Я пробовал использовать DBSCAN, который в некоторой степени сработал, но требовал значительной ручной настройки входных параметров
Data Science
Azure Devops для Data Science
00
Вопрос или проблема Моя команда (7 человек) переходит на git, используя Azure Devops. Я немного запутался, как это настроить для команды по работе с данными. Я использовал его для личных проектов, которые довольно просты: разрабатываешь в одной ветке
Data Science
🚀 Сотрудничайте с нами на хакатоне RAIN 2024! Давайте внедрять инновации с помощью ИИ и робототехники, чтобы решить главные проблемы Африки 🚀
00
Вопрос или проблема 🚀 Сотрудничайте с нами на RAIN Hackathon 2024! Давайте инновировать с ИИ и робототехникой, чтобы решить крупнейшие проблемы Африки 🚀. Ответ или решение 🚀 Сотрудничайте с нами на хакатоне RAIN Hackathon 2024!
Data Science
Модель классификации изображений транспортных средств – загрузка завершена
00
Вопрос или проблема Я хотел бы обучить однопurpose модель для классификации изображений грузовиков/транспортных средств на 2 категории: грузовик с закрытым грузовым отсеком всё остальное, например, грузовик с незакрытым грузом Груз закрыт Груз не закрыт
Data Science
Какие модели неявно учитывают взаимодействие между признаками?
00
Вопрос или проблема Я хотел бы лучше понять, как разные модели (в частности, нейронные сети и случайные леса, но и любые другие) учитывают взаимодействие между признаками в табличных данных? Например, может ли модель в ходе обучения понять, что “