Data Science

Ошибка тестирования значительно выше ошибки обучения после сетевого поиска и кросс-валидации.

00

Вопрос или проблема В данный момент я работаю над проектом машинного обучения. Это задача с контролируемым обучением. Моя цель – предсказать для заданных данных животного (содержание, размер, вес и т.д.) ингредиенты (энергия, витамины и т.

Data Science

Мульти-меточная классификация с вложенными признаками

00

Вопрос или проблема Мне нужно выполнить многометочный классификацию. У меня есть три признака, и они вложены. Я не уверен, как это объединить или какой классификационный алгоритм будет лучше всего. Некоторая многоуровневая нейронная сеть, как показано

Data Science

активационная функция для бинаризованных нейронных сетей

00

Вопрос или проблема Я пытаюсь реализовать бинарную нейронную сеть с использованием keras и tensorflow. Вот мой текущий код: import tensorflow as tf from tensorflow import keras from keras import datasets from keras.utils.vis_utils import plot_model from keras.

Data Science

Что заставляет эту модель запоминать?

00

Вопрос или проблема Сравните две модели class SineNetwork1(nn.Module): def __init__(self): super().__init__() self.linear = nn.Linear(1, 100) self.relu = nn.ReLU() self.linear2 = nn.Linear(100, 1) def forward(self, x): x = self.

Data Science

Как найти распределение одной переменной на основе распределения населения

00

Вопрос или проблема Я пытаюсь найти распределение возраста подмножества женатых людей в популяции. Однако я понимаю, что простая визуализация количества женатых по возрасту (Рисунок 1) сильно зависит от исходного распределения возрастов в популяции, как показано на Рисунке 2.

Data Science

Какой инструмент будет подходящим для сбора аналитики структуры данных в потоках данных?

00

Вопрос или проблема Мы обрабатываем довольно большое количество объектов JSON (сотни тысяч ежедневно), и нам нужно собирать данные о обработанных объектах. Нас интересует получение следующей аналитики по каждому полю обработанных объектов JSON: Процент

Data Science

Скрейпинг нескольких сайтов с разными структурами

00

Вопрос или проблема Я хотел бы собрать данные с более чем 193 сайтов на основе определенных параметров, связанных с общими функциями сайтов, такими как AI-чат-бот, и после получения этих данных я хотел бы Consolidate их в тренировочный набор данных для

Data Science

Извлечь сегмент из сканирования документа

00

Вопрос или проблема Мне нужно извлечь некоторую “ценную” информацию из сканированного документа. Например, номер документа, дата поступления, организации, лица и т.д. Пример документа: Я пытаюсь извлечь выделенный сегмент документа.

Data Science

Можно ли использовать простое расстояние до нескольких ближайших точек данных в качестве меры неопределенности прогноза?

00

Вопрос или проблема Одним из ‘продаваемых моментов’ регрессии гауссовского процесса является то, что она предоставляет не только модель, но и оценку неопределенности предсказания. Обычно показывается изображение с кривой, подогнанной под данные

Data Science

Методы увеличения бинарных наборов данных

00

Вопрос или проблема У меня есть небольшой набор данных (около 100 образцов) с примерно 20 признаками, которые в основном бинарные, и несколько из них числовые (около 5). Я хотел использовать методы для увеличения обучающего набора и посмотреть, смогу

Data Science

Не удается снизить потери при выполнении анализа настроений с использованием Keras.

00

Вопрос или проблема Я создал модель в Keras, которая предсказывает 4 настроения/эмоции на основе текстового ввода. Размер моих данных: label_1 : 100.000 label_2 : 100.000 label_3 : 100.000 label_4 : 50.000 Валидационные данные: 45.

Data Science

дисперсия, объясненная моделью

00

Вопрос или проблема Это вопрос для новичков. отредактировано 19/11. Я действительно запутался в термине дисперсия и во множестве других вариантов. Например, на рисунке ниже показана дисперсия двух моделей для сравнения. Являются ли общие термины (например

Data Science

Количество двунаправленных LSTM в модели энкодер-декодер равно максимальной длине входного текста/символов?

00

Вопрос или проблема Я слегка запутался в этом аспекте RNN, пытаясь понять, как работает seq2seq кодер-декодер на https://machinelearningmastery.com/configure-encoder-decoder-model-neural-machine-translation/. Мне кажется, что количество LSTM в кодере

Data Science

Как справиться с отсутствующими значениями

00

Вопрос или проблема Я знаю, что эта тема была обсуждена extensively, но я не нашел ответа, который удовлетворял бы мои потребности. В настоящее время я стажируюсь и работаю с электронными платами. Эти электронные платы проходят через испытательные стенды.

Data Science

В многоклассовой классификации в SGDClassifier как мне узнать, использует ли он по умолчанию метод один против остальных или один против одного?

00

Вопрос или проблема Согласно книге Geron, для многоклассовой классификации SGDClassifier в scikit-learn использует схему один против остальных. Но как мне узнать, какая схема используется, если эта информация не представлена в справочном файле.

Data Science

Концептуальная кластеризация с использованием sklearn?

00

Вопрос или проблема Как я могу выполнить концептуальную кластеризацию в sklearn? Мой случай использования заключается в том, что у меня есть статьи из Википедии на английском языке, над которыми я занимаюсь несупервизионным обучением (tfidf -> усеченное

Data Science

целевая кодировка с несколькими столбцами

00

Вопрос или проблема Я пытаюсь выполнить целевое кодирование с несколькими столбцами в датафрейме, и получаю сообщение об ошибке, которое не понимаю. Вот фрагмент кода. X['Код района Кодированный'] = encoder.fit_transform(X['Код района'], y) X['Код объекта

Data Science

Ошибка в lmest: отсутствуют данные в ковариатах, влияющих на начальные вероятности.

00

Вопрос или проблема Я запускаю модель LM, используя пакет LMest, доступный в R. В наборе данных НЕТ пропущенных значений. pct_miss(df_long) [1] 0 n_miss(df_long) [1] 0 Функция lmest без ковариат работает нормально. Однако, когда я добавил ковариаты в

Data Science

Семантический поиск

00

Вопрос или проблема Мы пытаемся решить проблему, связанную с семантическим поиском в нашем наборе данных, т.е. у нас есть данные, специфичные для конкретной области (например: предложения, касающиеся автомобилей) Наши данные представляют собой просто

Data Science

Представление строго правильного оценочного правила для многоклассовой классификации

00

Вопрос или проблема Я работаю над задачей классификации, используя признаки $\mathbf{x}$ для предсказания целевой переменной $y \in \mathbb{N}_0$. Под строгим правильным правилом оценивания я имею в виду функцию потерь $\ell(y,\hat{y})$, для которой