Data Science
Как рассчитать разницу на основе совпадающих критериев
00
Вопрос или проблема Здравствуйте, я пытаюсь перейти с Excel на Pandas. Я хочу добавить новый столбец под названием ‘daily_volume’, где, если ‘project_name’ равен ‘project_name’ в предыдущей строке, то рассчитать разницу.
Data Science
Фильтрация на основе содержания для рекомендаций по стажировкам без оценок пользователей — это осуществимо?
00
Вопрос или проблема Я разрабатываю функцию рекомендаций для платформы стажировок студентов. Студенты будут явно выбирать свои интересы и навыки во время регистрации, а рекрутеры будут публиковать предложения стажировок с соответствующими требованиями
Data Science
PCA в визуальной аналитике
00
Вопрос или проблема Я изучаю визуальную аналитику и у меня есть теоретический вопрос по этой теме. Мой профессор представил эту схему на своем слайде. Для соединения данных с визуализацией. Некоторые темы очень легко понять и они касаются представления
Data Science
Кросс-эластичность спроса с логистической регрессией
00
Вопрос или проблема Первый пост, будьте добры 😁 Я пытаюсь рассчитать кросс-эластичность спроса. Основная экономическая концепция проста, но при попытке реализовать её я вижу множество различных методов/равнений, которые дают разные результаты.
Data Science
Метка большого объема аудиоданных автоматически или полуавтоматически.
00
Вопрос или проблема Я работаю над проектом, где мне нужно разметить аудиоданные, в которых тысячи данных, каждое аудиоданные составляет одну секунду. Мне нужно размечать, находится ли оно в состоянии простоя, происходит ли событие или шум.
Data Science
Кластеризация временных рядов с использованием динамического временного выравнивания
00
Вопрос или проблема Я хотел бы кластеризовать/сгруппировать кривые на приложенной картинке с помощью Python. Данные уже нормализованы, и мой подход заключается в использовании dtw (динамического временного выравнивания) для расчета расстояния, а затем
Data Science
Является ли HDBSCAN агломеративной иерархической кластеризацией?
00
Вопрос или проблема Я смотрю на HDBSCAN и задаюсь вопросом, является ли он делительным или агломеративным? Я понимаю оба подхода, но не понимаю, какой из них использует HDBSCAN. Ищу пояснения. Ответ дан в Пропозиции 1 в статье по HDBSCAN 1.
Data Science
LSTM генерирует прямую линию для предсказаний вне диапазона данных.
00
Вопрос или проблема У меня есть такая проблема: Я пытаюсь предсказать ежедневные температуры. У меня есть данные за 30 лет, и я использую эту нейронную сеть: model = Sequential() model.add(LSTM(units=128,activation="relu", input_shape=(30, 1), return_sequences=True)) model.
Data Science
Не удается установить пакет spacy на Windows 10 через pip.
02
Вопрос или проблема У меня следующая среда. ОС: Windows 10 Python: Python 3.7.4 PIP: pip 19.3.1 Я пытаюсь установить spacy на свою ОС Windows 10. У меня возникает следующая ошибка. ОШИБКА: Команда завершилась с кодом выхода 1: команда: 'd:\rajesh\python\env1\scripts\python.
Data Science
Как преобразовать изображение в анфас?
00
Вопрос или проблема Мне нужно завершить проект, в котором я должен применить некоторые техники или модели к изображениям. Моя цель – преобразовать изображение в фронтальное/прямое, когда речь идет о наклоненных, сдвинутых или любых других трансформациях.
Data Science
Как настроить гиперпараметры оценщика в инструменте Orange
00
Вопрос или проблема Привет, я хочу настроить/поискать гиперпараметры SVM в инструменте Orange. Как я могу это сделать? Я хочу применить исчерпывающий поиск по сетке к SVM http://scikit-learn.org/stable/modules/grid_search.html Дааааааааа, копаю золото
Data Science
Прогнозирование будущих продаж автомобилей
00
Вопрос или проблема Я новичок в области машинного обучения. В последнее время я стараюсь создать модель, чтобы прогнозировать продажи определенной марки и модели автомобиля у дилера и местоположение, где они будут проданы. Данные, которые мне предоставили
Data Science
Как вычислить информацию, переданную в сообщении для данной выборки данных
00
Вопрос или проблема Данные наборы. Тестовый набор Место,цвет,Модель,Категория,Локация,вес,Разновидность,Материал,Объем 1,6,4,4,4,1,1,1,6 2,5,4,4,4,2,6,1,1 1,6,2,1,4,1,4,2,4 1,6,2,1,4,1,2,1,2 2,6,5,5,5,2,2,1,2 1,5,4,4,4,1,6,2,2 1,3,3,3,3,1,6,2,2 Обучающий
Data Science
Почему я получаю другой ответ в методе главных компонент для уменьшения размерности?
00
Вопрос или проблема Проблема: Рассмотрите двумерные образы (2, 1), (3, 5), (4, 3), (5, 6), (6, 7), (7, 8). Вычислите главную компоненту, используя алгоритм PCA. Используйте алгоритм PCA для преобразования образа (2, 1) на собственный вектор.
Data Science
МЛ. Как заставить нейронную сеть запоминать контекст и данные?
02
Вопрос или проблема Я хочу, чтобы нейронная сеть могла запоминать, но перцептрон может запоминать что-то только во время обучения. Я хочу, чтобы нейронная сеть адаптировалась к новым условиям без повторного обучения, например, если я сказал, что меня
Data Science
Устранится ли в конце концов моя ошибка валидации?
00
Вопрос или проблема В данный момент я обучаю бинарный классификатор, который принимает 2 входных значения и выводит, какой объект, по его мнению, является “лучшим”. У меня есть абсолютно огромный набор данных, примерно 2 триллиона записей
Data Science
найти биграмы в pandas
00
Вопрос или проблема У меня есть DataFrame с 4 колонками: ‘Заголовок’, ‘Body_ID’, ‘Сторона’, ‘articleBody’, где ‘Заголовок’ и ‘articleBody’ содержат очищенные и токенизированные слова.
Data Science
Группировка похожих классов для повышения точности, при этом максимизируя количество классов.
00
Вопрос или проблема Предположим, у меня есть множество различных классов, некоторые из которых связаны между собой. Моя модель имеет высокую точность классификации для некоторых классов, в то время как другие классы сложно предсказать.
Data Science
Сегментация временных рядов
00
Вопрос или проблема У меня есть график временного ряда, который сегментирован на несколько частей в зависимости от дня технического обслуживания. Вы можете представить это как вертикальные линии, появляющиеся из оси x, которые символизируют техническое
Data Science
Почему линейная регрессия хорошо работает с временными рядами?
00
Вопрос или проблема Я следовал от этого вопроса. У меня есть следующая задача: у меня есть данные временных рядов. Обучение по последовательно 3 дням для предсказания каждого 4-го дня. Каждый день данных представляет собой один CSV файл, который имеет размерность 24×