Data Science
Как каталогизировать нелабелированные данные рекламных электронных писем
00
Вопрос или проблема У меня есть неразмеченные данные рекламных писем. Я хочу категоризировать эти письма по темам, таким как мода, здоровье и благополучие, спорт, медиа, развлечения и т. д. Можете ли вы подсказать какой-либо эффективный метод или предобученную
Data Science
Концептуальная кластеризация с использованием sklearn?
00
Вопрос или проблема Как я могу выполнить концептуальную кластеризацию в sklearn? Мой случай использования заключается в том, что у меня есть статьи из Википедии на английском языке, над которыми я занимаюсь несупервизионным обучением (tfidf -> усеченное
Data Science
Семантический поиск
00
Вопрос или проблема Мы пытаемся решить проблему, связанную с семантическим поиском в нашем наборе данных, т.е. у нас есть данные, специфичные для конкретной области (например: предложения, касающиеся автомобилей) Наши данные представляют собой просто
Data Science
Сегментация клиентов с несбалансированными данными
00
Вопрос или проблема Я пытаюсь провести сегментацию клиентов на основе своих транзакционных данных и у меня возникают некоторые трудности с выбором наилучшего подхода. Поскольку это несупервизированная модель, я могу использовать любой алгоритм и получить
Data Science
Дендограмма: ValueError: Истинностное значение серии неоднозначно. Используйте a.empty, a.bool(), a.item(), a.any() или a.all()
00
Вопрос или проблема Я пытаюсь построить дентрограмму для кластеризации данных, но эта ошибка мешает мне. Мои данные здесь. Сначала я выбрал столбцы для работы: df_euro = pd.read_csv('https://assets.datacamp.com/production/repositories/655/datasets/2a1f3ab7bcc76eef1b8e1eb29afbd54c4ebf86f2/eurovision-2016.
Data Science
Работа с несколькими экземплярами конкретной целевой функции в большом наборе данных.
00
Вопрос или проблема У меня есть данные о машине, которая включает в себя различные компоненты. Все детали взаимодействуют, данные отслеживаются для этих частей, учитывается потребление энергии и множество других измерений, связанных с их характеристиками.
Data Science
Лучше иметь одну модель с большим количеством категорий или две модели с меньшим количеством для многоцелеой классификации?
00
Вопрос или проблема Для классификации текста на три категории вопрос, жалоба и дополнение, где каждый экземпляр может иметь несколько меток (вопрос и жалоба, вопрос и дополнения): лучше иметь одну модель для всех трех категорий?
Data Science
Обнаружение аномалий – связь между порогами и аномалиями
00
Вопрос или проблема Я разрабатываю программу для обнаружения аномалий на Python. Основная идея заключается в том, чтобы каждый день создавать новую модель LSTM, обучать ее на данных за предыдущие 7 дней и предсказывать следующий день.
Data Science
Подход к прогнозированию отказов оборудования на основе истории обслуживания
00
Вопрос или проблема Я уже некоторое время борюсь с этой проблемой и наконец решил задать вопрос здесь, чтобы получить помощь. Проблема, которую я пытаюсь решить, связана с предсказательным обслуживанием. В частности, система выдает 2 вида сообщений об
Data Science
Лучшие методы стратификации данных на 4 группы (несупервизорным способом) с использованием набора/комбинации переменных.
00
Вопрос или проблема Я пытаюсь стратифицировать группу пациентов по возможным молекулярным подтипам рака. Я понимаю, что у всех этих пациентов есть рак, но целью является (вне зависимости от обучения) кластеризовать их на 4 возможных подтипа.