data-mining
Data Science
Вопрос или проблема У меня есть данные, похожие на рейтинги фильмов, и метки расположены в порядке, например, от 1 до 10. Поскольку целевая метка не является номинальной, а порядковой переменной, какие типы моделей мне следует использовать для классификации таких данных?
Data Science
Вопрос или проблема Я получил это как задание от рекрутера и успешно собрал датасет из примерно 650 фильмов с их разделами «Сюжет», «Музыка» и «Маркетинг», а также кассовыми сборами. Я попробовал tfidf и count векторизаторы и выполнил LSA/PCA для уменьшения
Data Science
Вопрос или проблема Я пытаюсь предсказать значения в столбце ёмкости, однако каждая точка данных состоит из нескольких данных. Каждая точка данных представляет данные цикла. Каждый цикл имеет емкость. Каждый цикл работает в течение некоторого времени
Data Science
Вопрос или проблема Четвёртый набор данных содержит (train_data, test_data, previous_data и information_history_data). Цель состоит в том, чтобы найти рейтинг пользователя по кредиту в банке. Я запутался с первым шагом в этом процессе, потому что существует
Data Science
Вопрос или проблема Задача состоит в том, чтобы смоделировать, влияет ли последовательность событий на вероятность бинарной целевой переменной. У нас есть, например, пять различных событий, которые происходят во времени (события: A, B, C, D, E).
Data Science
Вопрос или проблема У меня есть набор библиометрических данных (ссылок). Я хочу извлечь имена авторов, названия и названия конференции/журнала из них. Поскольку стиль ссылок, используемый в разных статьях, варьируется, меня интересует, существуют ли уже
Data Science
Вопрос или проблема Я совсем новичок в области добычи данных. Я хочу работать над методом кластеризации на основе клик. Я хочу провести сравнение между различными наборами данных для анализа социальных сетей или выявления сообществ в анализе социальных сетей.
Data Science
Вопрос или проблема Я пытаюсь построить график загрузок PCA против спектров. Пока я могу получить координаты PCA для каждого наблюдения. В инструкции я видел, что существует виджет под названием кривые для этого. Он делает именно то, что мне нужно, но
Data Science
Вопрос или проблема Я хотел бы использовать Orange для создания модели, которая позволит мне предсказать будущие скорости WiFi, используя среднюю квартальную скорость WiFi за последние несколько лет. Наборы данных, которые я использую, включают среднюю
Data Science
Вопрос или проблема Мое описание: Кластер 2 состоит из 9511 экземпляров, средний возраст составляет около 42 лет (колеблется от 29.7207 до 54.5257). Учитывая возраст, Кластер 2 хорошо отделен от Кластера 1, с расстоянием 18.9513.
Data Science
Вопрос или проблема Я использую scikit-learn в Python для создания моделей, пробуя разные ядра. Я был удивлён, увидев, что RBF обучается менее чем за секунду, тогда как линейная модель заняла минуту, а полиномиальная — часы. Может кто-то объяснить, почему это происходит?