Data Science
реализовать кластер dask с prophet
00
Вопрос или проблема Я пытаюсь реализовать dask. В данный момент я использую joblib, и он работает отлично, использует весь ЦП, что, на мой взгляд, идеально, но я хочу добавить больше ресурсов. Теперь, пытаясь реализовать dask, это идет гораздо медленнее
Data Science
Прогнозирование с помощью алгоритма машинного обучения
00
Вопрос или проблема Извините, если это слишком общий вопрос, но я застрял где-то между идеальным и адекватным в моей модели. Поэтому я хотел бы спросить здесь. Если это не подходящий вопрос, ваши негативные отзывы тоже приветствуются, извините.
Data Science
Какое решение лучше всего подходит в моем случае?
00
Вопрос или проблема В настоящее время я ищу возможность создать API для модели, которая может отвечать на вопросы на основе собственных материалов, таких как мои заметки или книги. Я хочу, чтобы модель могла предоставлять ответы напрямую из этих источников.
Data Science
Заменить ли значения NaN в столбце результата
00
Вопрос или проблема У меня есть обучающий набор данных, где нам необходимо предсказать “Результат” на основе признаков “A”, “B”, “C” и “D” с использованием машинного обучения. Для нескольких строк “
Data Science
дисперсия, объясненная моделью
00
Вопрос или проблема Это вопрос для новичков. отредактировано 19/11. Я действительно запутался в термине дисперсия и во множестве других вариантов. Например, на рисунке ниже показана дисперсия двух моделей для сравнения. Являются ли общие термины (например
Data Science
Keras очень низкая точность, насыщается после нескольких эпох во время обучения.
00
Вопрос или проблема Я совсем новичок в области науки о данных и сразу же начал работать с моделями TensorFlow. Ранее я работал с примерами, представленными на сайте. Это моя первая попытка реализовать проект с его использованием.
Data Science
Машинное обучение, статистика и математика
00
Вопрос или проблема Я только начал углубляться в машинное обучение, и каждый раз, когда я пытаюсь разобраться в концепциях или коде, я сталкиваюсь с математическими задачами и их запутанными обозначениями. Имея опыт в компьютерных науках, я немного их
Data Science
Нейронная сеть не выдает ожидаемый результат после обучения в Python.
00
Вопрос или проблема Моя нейронная сеть не выдает ожидаемый результат после обучения в Python. Есть ли какая-либо ошибка в коде? Есть ли способ уменьшить среднюю квадратичную ошибку (MSE)? Я пытался обучать (Запускать программу) сеть несколько раз, но
Data Science
Как обеспечить обобщение при наличии очень-очень маленьких данных?
00
Вопрос или проблема У меня есть 21 наблюдение с более чем 10000 признаков. Проблема заключается в бинарной классификации, и данные сбалансированы. Используя метод выбора признаков, я нашел 5 признаков. Теперь у меня есть 21 наблюдение с 5 признаками.
Data Science
Сколько нечестных пользователей будет заблокировано, чтобы остановить одно мошенничество, исходя из данной матрицы ошибок?
00
Вопрос или проблема Один из вопросов недавнего онлайн-теста, на который я не смог ответить, выглядит следующим образом (я не смог скопировать точный вопрос, поэтому это полностью из памяти. Прошу прощения за возможные неточности в формулировке.
Data Science
Объединение результатов двух отдельных матриц смешивания от различных моделей машинного обучения для общего увеличения точности истинно положительных результатов.
00
Вопрос или проблема Каковы шаги, если возможно объединить результаты двух матриц путаницы, чтобы получить более точный конечный прогноз. Мы рассчитали две матрицы путаницы, как показано ниже, для наивного байеса и дерева решений, увеличив количество истинных
Data Science
ошибка при выполнении lasso.py
00
Вопрос или проблема Следующий код ошибки был сгенерирован при запуске lasso.py. Может кто-нибудь помочь в исправлении этой ошибки? Вот код: from cvxpy import * import numpy as np import cvxopt from multiprocessing import Pool # Данные задачи.
Data Science
Лучший алгоритм для рекомендательной системы на основе текста
00
Вопрос или проблема Помогите мне разобраться в лучшем алгоритме для системы рекомендаций статей, которая использует содержание статей для формирования рекомендаций. Какой алгоритм следует рассмотреть в случае большого объема текстовых данных для рекомендаций?
Data Science
Модель коллаборативной фильтрации на основе классификации
00
Вопрос или проблема Я изучал алгоритмы для предсказания на основе коллаборативной фильтрации. В большинстве источников я читал о использовании матричной факторизации, основанной на оценках схожести пользователя. Но в моем случае мне нужно делать предсказания
Data Science
Как правильно реализовать RNN в Pytorch?
00
Вопрос или проблема Я прочитал о RNN в PyTorch: RNN — документация PyTorch. Согласно документу, RNN выполняет следующую функцию: Я посмотрел другой пример RNN (из учебника PyTorch): NLP С НУЛЯ: КЛАССИФИКАЦИЯ ИМЕН С ПОМОЩЬЮ RNN УРОВНЯ СИМВОЛОВ.
Data Science
Как извлечь векторные представления категориальных переменных
00
Вопрос или проблема Я немного запутался с кодированием категориальных переменных. Есть другие посты/блог-посты по этой теме, но ни один из них не обсуждает проблему, с которой я сталкиваюсь. У меня есть набор данных со смешанными переменными (то есть
Data Science
Помощь в прогнозировании центров затрат
00
Вопрос или проблема Как говорит заголовок: Мне поставили задачу предсказать центры затрат для данных о грузоперевозках. Я совершенно не представляю, как это сделать. Уникальное количество центров затрат превышает 5000, а количество признаков составляет около 100.
Data Science
Как использовать KS-тест в отчете по Data Science?
00
Вопрос или проблема Я пишу отчет по анализу данных и хочу найти распределение, которое подойдёт для моей выборки. Я получил хороший результат , но когда я использовал тест Колмогорова-Смирнова (KS-test) для проверки модели, я получил низкое значение p, 1.
Data Science
Тренды и темы искусственного интеллекта
00
Вопрос или проблема Мне интересно, существуют ли веб-сайты, с помощью которых можно постоянно быть в курсе последних тенденций или тем, связанных с разрушительными приложениями в области искусственного интеллекта. Обычно я читаю научные публикации, посвященные
Data Science
Основной рабочий процесс топологического анализа данных и глубокого обучения
00
Вопрос или проблема У меня есть определенная путаница относительно применения топологического анализа данных (TDA) и глубокого обучения к табличному набору данных. Согласно общепринятому стандарту, строки представляют собой точки, а столбцы — признаки.