Data Science
Data Science
Вопрос или проблема Удаление выбросов из одноберных данных можно легко выполнить, убирая точки, которые находятся за пределами диапазона IQR. Но как должен проходить процесс обнаружения и удаления выбросов, если набор данных состоит из нескольких измерений?
Data Science
Вопрос или проблема Я изучаю идеи о том, как я могу прогнозировать доход от контрактов. Например, у меня могут быть клиенты, которые приобрели ежемесячный мобильный план, годовой план или трехлетний план. Как я могу использовать эту информацию для прогнозирования дохода?
Data Science
Вопрос или проблема Учитывая регрессионную модель с n признаками, как я могу измерить неопределенность или доверие к модели для каждого предсказания? Предположим, для конкретного предсказания точность потрясающая, но для другого –
Data Science
Вопрос или проблема Предположим, у нас есть данные в таких экземплярах: [ [15, 20, ("банан","яблоко","огурец"), ...], [91, 12, ("апельсин","банан"), ...], ... ] Мне интересно, как я могу закодировать третий элемент этих данных.
Data Science
Вопрос или проблема Предположим, у меня есть аудиозапись 15 студентов, которые одновременно говорят “Я здесь”. Могу ли я сказать, сколько студентов говорило и кто они, используя машинное обучение? Я хочу создать приложение для учета посещаемости
Data Science
Вопрос или проблема Я пытаюсь вычислить показатель Дависа-Боулдина, чтобы сравнить различные подходы к кластеризации. У меня есть предрасчитанная матрица расстояний (которая представляет собой расстояние на основе редактирования между текстами).
Data Science
Вопрос или проблема Я хочу создать виртуальную среду с помощью anaconda для python 3, в которой я смогу использовать конкретную версию tensorflow-gpu. Моя базовая версия conda python – 3.6.8, а базовая версия tensorflow-gpu –
Data Science
Вопрос или проблема В настоящее время я работаю с книгой: «Введение в статистическое обучение с приложениями на Python». В упражнениях до сих пор я использовал пакет ISLP. Сейчас я пытаюсь решить упражнения из главы 6 и застрял на вопросе 8, часть (d).
Data Science
Вопрос или проблема Я обучил модель GRU на некоторых данных и затем создал множество предсказаний на тестовом наборе. Предсказания действительно плохие, о чем свидетельствует почти нулевой коэффициент детерминации R2. Я замечаю, что дисперсия предсказаний
Data Science
Вопрос или проблема Я пытаюсь выяснить причину, по которой моя сеть RNN не может превысить 50% для двоичной классификации. Мои входные данные имеют форму: X.shape - TensorShape([9585, 25, 2]) Мои метки представляют собой вектор с единым измерением с значениями 1.0 и 0.0: y - <
Data Science
Вопрос или проблема Допустим, я обучил классификатор, который классифицирует изображения животных на 10 разных классов. И предположим, что у меня есть 20 различных изображений конкретного животного, и поскольку я знаю фотографа, я с уверенностью знаю
Data Science
Вопрос или проблема Я пытаюсь обдумать свой процесс, прежде чем начать какое-либо реальное программирование. Однако я легко запутался. Предположим, у меня есть 100 инструментов, и я знаю их ценовые колебания каждый день в течение года.
Data Science
Вопрос или проблема Я начинающий в машинном обучении. Мой проект заключается в создании поисковой системы на основе ИИ, которая показывает связанные статьи, когда мы ищем на сайте. Для этого я решил обучить свое собственное встраивание.
Data Science
Вопрос или проблема У меня есть набор данных, скажем, с 1 миллионом наблюдений. В качестве глупого примера представим, что мы хотим предсказать, может ли человек стать специалистом по данным или нет (0/1). У меня есть переменные, в которых много пропусков
Data Science
Вопрос или проблема ИЗМЕНЕНИЕ : Если бы мне нужно было сопоставить односоставные фразы, я мог бы сначала токенизировать текст из документа, а затем рассчитать косинусное сходство всех токенов со всеми ключевыми словами из keyword_list.
Data Science
Вопрос или проблема Я пытаюсь найти кластеры в некоторых данных с высоким уровнем шума (см. график ниже, данные здесь). Я пробовал использовать DBSCAN, который в некоторой степени сработал, но требовал значительной ручной настройки входных параметров
Data Science
Вопрос или проблема Моя команда (7 человек) переходит на git, используя Azure Devops. Я немного запутался, как это настроить для команды по работе с данными. Я использовал его для личных проектов, которые довольно просты: разрабатываешь в одной ветке
Data Science
Вопрос или проблема 🚀 Сотрудничайте с нами на RAIN Hackathon 2024! Давайте инновировать с ИИ и робототехникой, чтобы решить крупнейшие проблемы Африки 🚀. Ответ или решение 🚀 Сотрудничайте с нами на хакатоне RAIN Hackathon 2024!
Data Science
Вопрос или проблема Я хотел бы обучить однопurpose модель для классификации изображений грузовиков/транспортных средств на 2 категории: грузовик с закрытым грузовым отсеком всё остальное, например, грузовик с незакрытым грузом Груз закрыт Груз не закрыт
Data Science
Вопрос или проблема Я хотел бы лучше понять, как разные модели (в частности, нейронные сети и случайные леса, но и любые другие) учитывают взаимодействие между признаками в табличных данных? Например, может ли модель в ходе обучения понять, что “