data-science-model
Data Science
Вопрос или проблема Я пытаюсь реализовать dask. В данный момент я использую joblib, и он работает отлично, использует весь ЦП, что, на мой взгляд, идеально, но я хочу добавить больше ресурсов. Теперь, пытаясь реализовать dask, это идет гораздо медленнее
Data Science
Вопрос или проблема Извините, если это слишком общий вопрос, но я застрял где-то между идеальным и адекватным в моей модели. Поэтому я хотел бы спросить здесь. Если это не подходящий вопрос, ваши негативные отзывы тоже приветствуются, извините.
Data Science
Вопрос или проблема В настоящее время я ищу возможность создать API для модели, которая может отвечать на вопросы на основе собственных материалов, таких как мои заметки или книги. Я хочу, чтобы модель могла предоставлять ответы напрямую из этих источников.
Data Science
Вопрос или проблема У меня есть обучающий набор данных, где нам необходимо предсказать “Результат” на основе признаков “A”, “B”, “C” и “D” с использованием машинного обучения. Для нескольких строк “
Data Science
Вопрос или проблема Это вопрос для новичков. отредактировано 19/11. Я действительно запутался в термине дисперсия и во множестве других вариантов. Например, на рисунке ниже показана дисперсия двух моделей для сравнения. Являются ли общие термины (например
Data Science
Вопрос или проблема Я совсем новичок в области науки о данных и сразу же начал работать с моделями TensorFlow. Ранее я работал с примерами, представленными на сайте. Это моя первая попытка реализовать проект с его использованием.
Data Science
Вопрос или проблема Я только начал углубляться в машинное обучение, и каждый раз, когда я пытаюсь разобраться в концепциях или коде, я сталкиваюсь с математическими задачами и их запутанными обозначениями. Имея опыт в компьютерных науках, я немного их
Data Science
Вопрос или проблема Моя нейронная сеть не выдает ожидаемый результат после обучения в Python. Есть ли какая-либо ошибка в коде? Есть ли способ уменьшить среднюю квадратичную ошибку (MSE)? Я пытался обучать (Запускать программу) сеть несколько раз, но
Data Science
Вопрос или проблема У меня есть 21 наблюдение с более чем 10000 признаков. Проблема заключается в бинарной классификации, и данные сбалансированы. Используя метод выбора признаков, я нашел 5 признаков. Теперь у меня есть 21 наблюдение с 5 признаками.
Data Science
Вопрос или проблема Один из вопросов недавнего онлайн-теста, на который я не смог ответить, выглядит следующим образом (я не смог скопировать точный вопрос, поэтому это полностью из памяти. Прошу прощения за возможные неточности в формулировке.
Data Science
Вопрос или проблема Каковы шаги, если возможно объединить результаты двух матриц путаницы, чтобы получить более точный конечный прогноз. Мы рассчитали две матрицы путаницы, как показано ниже, для наивного байеса и дерева решений, увеличив количество истинных
Data Science
Вопрос или проблема Следующий код ошибки был сгенерирован при запуске lasso.py. Может кто-нибудь помочь в исправлении этой ошибки? Вот код: from cvxpy import * import numpy as np import cvxopt from multiprocessing import Pool # Данные задачи.
Data Science
Вопрос или проблема Помогите мне разобраться в лучшем алгоритме для системы рекомендаций статей, которая использует содержание статей для формирования рекомендаций. Какой алгоритм следует рассмотреть в случае большого объема текстовых данных для рекомендаций?
Data Science
Вопрос или проблема Я изучал алгоритмы для предсказания на основе коллаборативной фильтрации. В большинстве источников я читал о использовании матричной факторизации, основанной на оценках схожести пользователя. Но в моем случае мне нужно делать предсказания
Data Science
Вопрос или проблема Я прочитал о RNN в PyTorch: RNN — документация PyTorch. Согласно документу, RNN выполняет следующую функцию: Я посмотрел другой пример RNN (из учебника PyTorch): NLP С НУЛЯ: КЛАССИФИКАЦИЯ ИМЕН С ПОМОЩЬЮ RNN УРОВНЯ СИМВОЛОВ.
Data Science
Вопрос или проблема Я немного запутался с кодированием категориальных переменных. Есть другие посты/блог-посты по этой теме, но ни один из них не обсуждает проблему, с которой я сталкиваюсь. У меня есть набор данных со смешанными переменными (то есть
Data Science
Вопрос или проблема Как говорит заголовок: Мне поставили задачу предсказать центры затрат для данных о грузоперевозках. Я совершенно не представляю, как это сделать. Уникальное количество центров затрат превышает 5000, а количество признаков составляет около 100.
Data Science
Вопрос или проблема Я пишу отчет по анализу данных и хочу найти распределение, которое подойдёт для моей выборки. Я получил хороший результат , но когда я использовал тест Колмогорова-Смирнова (KS-test) для проверки модели, я получил низкое значение p, 1.
Data Science
Вопрос или проблема Мне интересно, существуют ли веб-сайты, с помощью которых можно постоянно быть в курсе последних тенденций или тем, связанных с разрушительными приложениями в области искусственного интеллекта. Обычно я читаю научные публикации, посвященные
Data Science
Вопрос или проблема У меня есть определенная путаница относительно применения топологического анализа данных (TDA) и глубокого обучения к табличному набору данных. Согласно общепринятому стандарту, строки представляют собой точки, а столбцы — признаки.