Data Science
Кластеризация широты, долготы вместе с числовыми и категориальными данными
00
Вопрос или проблема Я работаю над кластеризацией клиентской базы компании, занимающейся бизнесом между организациями. У меня есть данные о клиентах, которые состоят как из числовых (например, количество покупок, средние расходы за покупку), так и из категориальных
Data Science
Объединение результатов двух отдельных матриц смешивания от различных моделей машинного обучения для общего увеличения точности истинно положительных результатов.
00
Вопрос или проблема Каковы шаги, если возможно объединить результаты двух матриц путаницы, чтобы получить более точный конечный прогноз. Мы рассчитали две матрицы путаницы, как показано ниже, для наивного байеса и дерева решений, увеличив количество истинных
Data Science
Модель Keras CNN выдает сообщение об ошибке: ‘ValueError: Слой ‘conv1d_12′ ожидал 2 переменные, но получил 0 переменных при загрузке’
00
Вопрос или проблема Надеюсь, у вас всё хорошо и вы в порядке. Я пытаюсь реализовать модель CNN для прогнозирования камней в почках. Эта модель работает как ожидается на моем локальном компьютере, но когда я пытаюсь развернуть приложение в Streamlit Cloud
Data Science
Как добавить слова в список слов английской модели в движке распознавания речи Julius?
00
Вопрос или проблема Я хочу добавить несколько английских слов в модель, но как я могу это сделать? https://github.com/julius-speech/julius Это, вероятно, невозможно, поскольку эта модель предназначена только для предсказания. Она не предназначена для обучения.
Программное обеспечение
Решение OCR для сканирования отсканированных документов
00
Вопрос или проблема Мы хотим сканировать отсканированные документы (PDF/изображения) и извлекать значимую информацию в виде пар ключ-значение или в любом другом формате. Например, когда поставщик отправляет нам счет-фактуру в виде отсканированного PDF
Data Science
Моя сеть для классификации диалектов не работает
00
Вопрос или проблема Я написал следующий код для классификации диалектов на основе набора данных TIMIT, используя .wav файлы. По какой-то причине моя модель не обучается и классифицирует все в один и тот же класс. Обязательно ли конвертировать в спектрограмму?
Data Science
Лучший способ загрузить данные в блокнот Colab
00
Вопрос или проблема Я работаю одновременно с несколькими очень большими наборами данных (десятки – сотни гигабайт). Я подписался на Colab Pro+, полагая, что это лучший вариант. Однако я сталкиваюсь с серьезной проблемой при загрузке данных в Colab.
Data Science
Прогнозирование изменения форм/координат
00
Вопрос или проблема Я пытаюсь найти способ предсказать/рассчитать, как форма (например, контур ледника) изменится в будущем, исходя из ее истории (предыдущей формы) и дополнительных факторов (например, Δтемпературы). В моем примере: у меня есть форма/координаты
Data Science
Pyspark Dataframes в Pandas и ML Ops – Задержка при параллельном выполнении?
00
Вопрос или проблема Если я преобразую Spark DataFrame в Pandas DataFrame, а затем применю операции Pandas и модели sklearn к набору данных в Databricks, будут ли операции из Pandas и sklearn распределены по кластеру? Или мне нужно использовать операции
Data Science
Запрос о использовании CNN и MCTS для определенной игры
00
Вопрос или проблема Я теоретизирую идею использовать CNN и MCTS вместе для игры в определённую игру. В общих чертах, игра имеет следующие характеристики: Есть два игрока, и игра примерно пошаговая. На каждом ходе есть довольно много вариантов, из которых
Data Science
Обучение с подкреплением: негативная награда (наказание) за незаконные действия?
00
Вопрос или проблема Если вы обучаете агента с помощью обучения с подкреплением (в данном случае с использованием функции Q), следует ли давать негативное вознаграждение (наказывать), если агент предлагает незаконные действия для представленного состояния?
Data Science
Реально ли использовать алгоритмы деревьев решений для обнаружения ошибок сенсоров?
00
Вопрос или проблема Суть в том, что я хочу отделить системные ошибки от ошибок сенсоров, используя некоторый набор данных из беспроводной сенсорной сети с помощью алгоритма машинного обучения. Например, если у меня есть несколько температурных сенсоров
Data Science
Шаги по подгонке модели машинного обучения для предсказания движения рынка вверх и вниз.
00
Вопрос или проблема У меня есть около 5 лет данных индекса, содержащего много признаков на ежедневной основе. Я хочу классифицировать, будет ли индекс двигаться вверх или вниз в следующий торговый день (движение вверх или вниз определяется по ценам открытия/закрытия следующего дня).
Data Science
Как использовать классификацию текстов, если источником обучения являются текстовые файлы в категоризованных папках?
00
Вопрос или проблема У меня есть 200 уникальных файлов *.txt для каждой папки: Каждый файл содержит первоначальный текст иска, разделенный по юридическим областям (папкам) общественной защиты. Я хотел бы создать обучающие данные для прогнозирования новых
Data Science
Агломеративная иерархическая кластеризация в Python с использованием расстояния DTW
00
Вопрос или проблема Я новичок как в области науки о данных, так и в Python. У меня есть набор данных временных образцов, для которых я хочу провести агломеративную иерархическую кластеризацию. Я обнаружил, что метод динамического выравнивания по времени
Data Science
Проблемы с самостоятельно реализованной логистической регрессией
00
Вопрос или проблема Я пытаюсь самостоятельно реализовать алгоритм логистической регрессии для самообучения, но у меня возникают некоторые проблемы с достижением аналогичной точности, как у логистической регрессии из sklearn. Вот код, который я использую
Data Science
Как выбрать подходящие признаки и визуализировать данные так, чтобы алгоритм k-средних мог их кластеризовать?
00
Вопрос или проблема Я пока только знакомлюсь с основами машинного обучения и хочу сравнить результаты контролируемого алгоритма (KNN) и неконтролируемого алгоритма (k-means) в контексте выявления сетевых атак типа DOS. Я застрял на том, как мои данные
Data Science
Какую модель выбрать для прогнозирования присутствия-отсутствия в будущих временных точках?
00
Вопрос или проблема Я создал биологический набор данных, который состоит из микробных данных с 15 географически близких местоположений, и для каждого из них у меня есть 100 временных точек, всего 1500 точек данных. Для этого я пытаюсь предсказать присутствие
Data Science
Показывает ли этот результат переобучение?
00
Вопрос или проблема Результаты модели случайного леса, которую я настроил с помощью Gridsearch, следующие. Как вы думаете, есть ли у этой модели серьезная переобученность? Среднее значение целевых показателей составляет 850. R2: 0.
Data Science
Множественная регрессия (с использованием машинного обучения – как построить график данных)
00
Вопрос или проблема Мне интересно, как я могу использовать машинное обучение для построения множественной линейной регрессии на графике. У меня есть одна зависимая переменная (цены на квартиры) и пять независимых (этаж, год постройки, количество комнат