Data Science
Что мы можем узнать, визуализируя карты признаков
00
Вопрос или проблема У меня есть следующая классификационная модель (собаки против кошек): def GetModel(): oModel = nn.Sequential( nn.Identity(), #-- ничего не делает nn.Conv2d(3, 16, 3, bias=False, stride=2), nn.BatchNorm2d(16), nn.
Data Science
Количество слоев извлечения признаков в СКСН
00
Вопрос или проблема На курсе, который я проходил по машинному обучению, мы обычно использовали около 2 слоев извлечения признаков для задач классификации изображений, используя, например, наборы данных MNIST или CIFAR. Однако, когда я проверял пример
Data Science
Как мне разработать функции для задачи идентификации именованных сущностей?
00
Вопрос или проблема Я работал над задачей идентификации именованных сущностей (а не распознавания). В этой задаче обработки естественного языка (NLP) модели дано предложение, и она должна предсказать, является ли каждое слово (или токен) именованной сущностью или нет.
Data Science
Как использовать калькулятор признаков tsfresh с результатами от другого калькулятора признаков
00
Вопрос или проблема При использовании библиотеки tsfresh для извлечения признаков возможно ли запустить калькулятор признаков , который принимает результаты другого калькулятора признаков в качестве своих параметров? Например, я хочу рассчитать (или аппроксимировать) частоту моего сигнала.
Data Science
Разные методы масштабирования различных признаков приводят к ложной зависимости между ними.
01
Вопрос или проблема Мой набор данных содержит следующие две характеристики: “длительность фильма” (минуты) и “длительность телешоу” (сезоны). Если определенный пример имеет тип “фильм”, его длительность будет отображаться в характеристике “
Data Science
Как обрабатывать один столбец с непрерывными и категориальными данными для модели машинного обучения
00
Вопрос или проблема Я работаю с финансовыми данными, где у меня есть признак (столбец) с 90% значений в диапазоне от 0 до 1000 (непрерывные) и 10% значений как -1, -2 и -9. (значения по умолчанию) Определение значений по умолчанию: -1: данные недоступны
Data Science
Какие хорошие методы прогнозирования будущих доходов на основе категориальных и значения данных?
00
Вопрос или проблема У меня есть ежемесячные снимки (3 года) всех данных контрактов. Они включают следующую информацию: Статус контракта [Категориальный]: Предложен, отслеживается, отправлен, выигран, проигран и т.д. Этапы контракта [Категориальный]: Поиск
Data Science
Классификация текстов с очень короткими строками
00
Вопрос или проблема У меня есть набор данных с короткими названиями профессий (например, «менеджер по маркетингу», «системный администратор» и т. д.) и соответствующими кодами профессий по переписи (например, 1006 Аналитики компьютерных систем).
Data Science
Как использовать TF*IDF баллы для моей модели машинного обучения?
00
Вопрос или проблема Я применил TF*IDF к столбцу ‘Ad-topic line’ в моем наборе данных. Для каждой строки темы рекламы я получаю один и тот же вывод: Во-первых, я не могу понять вывод. Значения TF*IDF указаны справа, но что конкретно означают цифры в скобках?
Data Science
Какие методы выбора признаков для обработки естественного языка это представляет?
00
Вопрос или проблема У меня есть набор данных, полученный из НЛП для технических документов. Мой набор данных содержит 60 000 записей. В наборе данных имеется 30 000 признаков. Значение – это количество повторений, сколько раз слово/признак появлялось.
Data Science
Как использовать метаданные точности измерений в классификаторе
00
Вопрос или проблема Учитывая, что нужно приписать класс группам измерений с помощью классификационной модели, каким образом можно включить информацию о точности измерений? Более конкретно, существует ли стратегия инженерии признаков для включения информации
Data Science
Автоматизированный выбор признаков – Лучшие практики для предотвращения утечки данных?
00
Вопрос или проблема Этот вопрос относится в целом ко всем автоматизированным методам выбора признаков. В моем конкретном случае у нас есть Python-пакет под названием tsfresh и задача многоклассовой классификации. Что было сделано до сих пор?
Data Science
Использование извлеченного векторного признака для выполнения детекции без обучения на примерах.
00
Вопрос или проблема Я разработал модель глубокого обучения, обученную с нуля на фруктах и овощах. Однако, так как данные ограничены, я могу охватить только несколько различных типов фруктов и овощей с помощью этой модели. Тем не менее, точность по этим
Data Science
Классификация по данным о движении
00
Вопрос или проблема Сводка вопроса: Как можно выполнить задачу классификации индивидуумов по их данным о движении/позиции? У меня нет набора данных (в голове), но я буду делать вид, что он у меня есть, чтобы сделать мой вопрос немного более конкретным
Data Science
Как извлечь характеристики из длинных химических названий?
00
Вопрос или проблема У меня есть интересная проблема, не знаю даже, с чего начать. Я работаю над бинарным классификатором, который будет принимать химическое название, закодированное в виде строки, и прогнозировать, является ли оно ‘
Data Science
Извлечение изображений из (возможно) испорченной репродукции
00
Вопрос или проблема Я ищу алгоритмы извлечения признаков в литературе (либо в обычной компьютерной зрении, либо в нейронных сетях) или готовые движки индексации, подходящие для поиска оригинальных изображений в базе данных при условии, что воспроизведение