data-mining - ответы на вопросы - Page 4 of 4

Data Science

Моделирование влияния порядка событий на вероятность

00

Вопрос или проблема Задача состоит в том, чтобы смоделировать, влияет ли последовательность событий на вероятность бинарной целевой переменной. У нас есть, например, пять различных событий, которые происходят во времени (события: A, B, C, D, E).

Data Science

Извлечение данных из библиометрической информации

00

Вопрос или проблема У меня есть набор библиометрических данных (ссылок). Я хочу извлечь имена авторов, названия и названия конференции/журнала из них. Поскольку стиль ссылок, используемый в разных статьях, варьируется, меня интересует, существуют ли уже

Data Science

Обработка данных: Кластеризация на основе клик для сравнения в анализе социальных сетей

00

Вопрос или проблема Я совсем новичок в области добычи данных. Я хочу работать над методом кластеризации на основе клик. Я хочу провести сравнение между различными наборами данных для анализа социальных сетей или выявления сообществ в анализе социальных сетей.

Data Science

Как построить загрузки PCA в зависимости от спектрального региона

00

Вопрос или проблема Я пытаюсь построить график загрузок PCA против спектров. Пока я могу получить координаты PCA для каждого наблюдения. В инструкции я видел, что существует виджет под названием кривые для этого. Он делает именно то, что мне нужно, но

Data Science

Оранжевый: Прогностическая модель для скорости Wi-Fi в будущем

00

Вопрос или проблема Я хотел бы использовать Orange для создания модели, которая позволит мне предсказать будущие скорости WiFi, используя среднюю квартальную скорость WiFi за последние несколько лет. Наборы данных, которые я использую, включают среднюю

Data Science

Как бы вы описали кластер 2 из этого вывода работы программы EM?

00

Вопрос или проблема Мое описание: Кластер 2 состоит из 9511 экземпляров, средний возраст составляет около 42 лет (колеблется от 29.7207 до 54.5257). Учитывая возраст, Кластер 2 хорошо отделен от Кластера 1, с расстоянием 18.9513.

Data Science

Скорость для различных ядер в SVM scikit-learn

00

Вопрос или проблема Я использую scikit-learn в Python для создания моделей, пробуя разные ядра. Я был удивлён, увидев, что RBF обучается менее чем за секунду, тогда как линейная модель заняла минуту, а полиномиальная — часы. Может кто-то объяснить, почему это происходит?