machine-learning
Data Science
Вопрос или проблема Пытаюсь объяснить свой вопрос на упрощенном наборе данных. Имея следующий набор данных: день f1 f2 0 0 10 1000 1 1 45 2000 2 2 120 3400 3 3 90 5000 Я пробую два подхода для генерации оценки на основе наблюдений данных: Подход 1: Я
Data Science
Вопрос или проблема В последнее время я занимаюсь задачей бинарной классификации с несбалансированными данными, где данные упорядочены во времени. Я хотел бы проверить свою модель, используя тренировочные и валидационные разделы с одинаковым соотношением
Data Science
Вопрос или проблема Я применил TF*IDF к столбцу ‘Ad-topic line’ в моем наборе данных. Для каждой строки темы рекламы я получаю один и тот же вывод: Во-первых, я не могу понять вывод. Значения TF*IDF указаны справа, но что конкретно означают цифры в скобках?
Data Science
Вопрос или проблема Я работаю над кластеризацией клиентской базы компании, занимающейся бизнесом между организациями. У меня есть данные о клиентах, которые состоят как из числовых (например, количество покупок, средние расходы за покупку), так и из категориальных
Data Science
Вопрос или проблема Каковы шаги, если возможно объединить результаты двух матриц путаницы, чтобы получить более точный конечный прогноз. Мы рассчитали две матрицы путаницы, как показано ниже, для наивного байеса и дерева решений, увеличив количество истинных
Data Science
Вопрос или проблема Надеюсь, у вас всё хорошо и вы в порядке. Я пытаюсь реализовать модель CNN для прогнозирования камней в почках. Эта модель работает как ожидается на моем локальном компьютере, но когда я пытаюсь развернуть приложение в Streamlit Cloud
Data Science
Вопрос или проблема Я хочу добавить несколько английских слов в модель, но как я могу это сделать? https://github.com/julius-speech/julius Это, вероятно, невозможно, поскольку эта модель предназначена только для предсказания. Она не предназначена для обучения.
Программное обеспечение
Вопрос или проблема Мы хотим сканировать отсканированные документы (PDF/изображения) и извлекать значимую информацию в виде пар ключ-значение или в любом другом формате. Например, когда поставщик отправляет нам счет-фактуру в виде отсканированного PDF
Data Science
Вопрос или проблема Я написал следующий код для классификации диалектов на основе набора данных TIMIT, используя .wav файлы. По какой-то причине моя модель не обучается и классифицирует все в один и тот же класс. Обязательно ли конвертировать в спектрограмму?
Data Science
Вопрос или проблема Я работаю одновременно с несколькими очень большими наборами данных (десятки – сотни гигабайт). Я подписался на Colab Pro+, полагая, что это лучший вариант. Однако я сталкиваюсь с серьезной проблемой при загрузке данных в Colab.
Data Science
Вопрос или проблема Я пытаюсь найти способ предсказать/рассчитать, как форма (например, контур ледника) изменится в будущем, исходя из ее истории (предыдущей формы) и дополнительных факторов (например, Δтемпературы). В моем примере: у меня есть форма/координаты
Data Science
Вопрос или проблема Если я преобразую Spark DataFrame в Pandas DataFrame, а затем применю операции Pandas и модели sklearn к набору данных в Databricks, будут ли операции из Pandas и sklearn распределены по кластеру? Или мне нужно использовать операции
Data Science
Вопрос или проблема Я теоретизирую идею использовать CNN и MCTS вместе для игры в определённую игру. В общих чертах, игра имеет следующие характеристики: Есть два игрока, и игра примерно пошаговая. На каждом ходе есть довольно много вариантов, из которых
Data Science
Вопрос или проблема Если вы обучаете агента с помощью обучения с подкреплением (в данном случае с использованием функции Q), следует ли давать негативное вознаграждение (наказывать), если агент предлагает незаконные действия для представленного состояния?
Data Science
Вопрос или проблема Суть в том, что я хочу отделить системные ошибки от ошибок сенсоров, используя некоторый набор данных из беспроводной сенсорной сети с помощью алгоритма машинного обучения. Например, если у меня есть несколько температурных сенсоров
Data Science
Вопрос или проблема У меня есть около 5 лет данных индекса, содержащего много признаков на ежедневной основе. Я хочу классифицировать, будет ли индекс двигаться вверх или вниз в следующий торговый день (движение вверх или вниз определяется по ценам открытия/закрытия следующего дня).
Data Science
Вопрос или проблема У меня есть 200 уникальных файлов *.txt для каждой папки: Каждый файл содержит первоначальный текст иска, разделенный по юридическим областям (папкам) общественной защиты. Я хотел бы создать обучающие данные для прогнозирования новых
Data Science
Вопрос или проблема Я новичок как в области науки о данных, так и в Python. У меня есть набор данных временных образцов, для которых я хочу провести агломеративную иерархическую кластеризацию. Я обнаружил, что метод динамического выравнивания по времени
Data Science
Вопрос или проблема Я пытаюсь самостоятельно реализовать алгоритм логистической регрессии для самообучения, но у меня возникают некоторые проблемы с достижением аналогичной точности, как у логистической регрессии из sklearn. Вот код, который я использую
Data Science
Вопрос или проблема Я пока только знакомлюсь с основами машинного обучения и хочу сравнить результаты контролируемого алгоритма (KNN) и неконтролируемого алгоритма (k-means) в контексте выявления сетевых атак типа DOS. Я застрял на том, как мои данные