Data Science
Моделирование влияния порядка событий на вероятность
00
Вопрос или проблема Задача состоит в том, чтобы смоделировать, влияет ли последовательность событий на вероятность бинарной целевой переменной. У нас есть, например, пять различных событий, которые происходят во времени (события: A, B, C, D, E).
Data Science
Извлечение данных из библиометрической информации
00
Вопрос или проблема У меня есть набор библиометрических данных (ссылок). Я хочу извлечь имена авторов, названия и названия конференции/журнала из них. Поскольку стиль ссылок, используемый в разных статьях, варьируется, меня интересует, существуют ли уже
Data Science
Обработка данных: Кластеризация на основе клик для сравнения в анализе социальных сетей
00
Вопрос или проблема Я совсем новичок в области добычи данных. Я хочу работать над методом кластеризации на основе клик. Я хочу провести сравнение между различными наборами данных для анализа социальных сетей или выявления сообществ в анализе социальных сетей.
Data Science
Как построить загрузки PCA в зависимости от спектрального региона
00
Вопрос или проблема Я пытаюсь построить график загрузок PCA против спектров. Пока я могу получить координаты PCA для каждого наблюдения. В инструкции я видел, что существует виджет под названием кривые для этого. Он делает именно то, что мне нужно, но
Data Science
Оранжевый: Прогностическая модель для скорости Wi-Fi в будущем
00
Вопрос или проблема Я хотел бы использовать Orange для создания модели, которая позволит мне предсказать будущие скорости WiFi, используя среднюю квартальную скорость WiFi за последние несколько лет. Наборы данных, которые я использую, включают среднюю
Data Science
Как бы вы описали кластер 2 из этого вывода работы программы EM?
00
Вопрос или проблема Мое описание: Кластер 2 состоит из 9511 экземпляров, средний возраст составляет около 42 лет (колеблется от 29.7207 до 54.5257). Учитывая возраст, Кластер 2 хорошо отделен от Кластера 1, с расстоянием 18.9513.
Data Science
Скорость для различных ядер в SVM scikit-learn
00
Вопрос или проблема Я использую scikit-learn в Python для создания моделей, пробуя разные ядра. Я был удивлён, увидев, что RBF обучается менее чем за секунду, тогда как линейная модель заняла минуту, а полиномиальная — часы. Может кто-то объяснить, почему это происходит?