Data Science
Data Science
Вопрос или проблема Извините за самоцитирующийся заголовок 😉 Мне было бы любопытно узнать, какая кривая могла бы использоваться для моделирования – в масштабе (скажем) недель* – “цикла вовлеченности” одной новостной страницы онлайн-газеты
Data Science
Вопрос или проблема У меня есть нейронная сеть, которая принимает около 25 входов и выдает 3 действия. Выходы: дельта X и дельта Y робота и угол робота. После ввода данных в модель я получаю очень разные (и странные) предсказания угла. В чем может быть причина?
Data Science
Вопрос или проблема При кодировании батчевого градиентного спуска легко реализовать сходимость, так как после каждой итерации стоимость движется к минимуму, и когда изменение стоимости приближается к заранее определенному числу, мы останавливаем итерации
Data Science
Вопрос или проблема В настоящее время я изучаю, как объединить данные с иерархическими зависимостями. Пример проблемы, которую я хочу кластеризовать: мы хотели бы сгруппировать города, чтобы выявить сходные характеристики по отношению к жителям.
Data Science
Вопрос или проблема Существует ли какой-либо стандартный инструмент, библиотека или список для расширения сокращений названий городов? Например, “MT HOLLY” -> “MOUNT HOLLY” или “ST MICHAELS”
Data Science
Вопрос или проблема На этот вопрос уже есть ответы здесь: Разница между OrdinalEncoder и LabelEncoder (4 ответа) Закрыто 1 час назад. Я написал следующий код для кодирования категориальных признаков датафрейма (названного ‘
Data Science
Вопрос или проблема Я пытаюсь предсказать на основе нескольких параметров, таких как тип поездки, тип автомобиля, источник бронирования, время начала, время до бронирования (начало – бронирование) и несколько других параметров, отменит ли клиент бронь или нет.
Data Science
Вопрос или проблема Я занимаюсь обнаружением выбросов (условные выбросы) в многомерном временном ряду. Выбросы появляются каждые 2 недели $\pm$ 4 дня. Как я могу учесть этот предварительный опыт в своих моделях, чтобы снизить количество ложноположительных результатов?
Data Science
Вопрос или проблема Недавно я пытался обучить сверточную нейронную сеть для классификации людей как испаноязычных или белых (для учебных целей). Я не мог найти хорошую выборку данных только для этих двух рас, поэтому мне пришлось вручную собирать изображения из интернета.
Data Science
Вопрос или проблема Большинство (если не все) реализаций/примеров снижения размерности UMAP, которые я видел, используют значение min_dist, немного превышающее ноль, чтобы избежать слишком плотного кластеризования точек. Это имеет смысл, но я заметил
Data Science
Вопрос или проблема Я пытаюсь провести анализ настроений по некоторым данным, используя keras. Я использую слой встраивания и затем LSTM. Я знаю, что слой встраивания снижает разреженность кодирования “один-горячий”
Data Science
Вопрос или проблема Существует много информации о том, как обрабатывать категориальные переменные при предварительной обработке данных для классификации с использованием машинного обучения. Однако я не могу найти никаких рекомендаций о том, как обрабатывать
Data Science
Вопрос или проблема У меня есть набор данных, в котором каждая зависимая переменная — это число успехов в N испытаниях Бернулли, причем N и p (вероятность успеха) отличаются для каждого наблюдения. Цель состоит в том, чтобы обучить модель предсказывать p, учитывая предикторы.
Data Science
Вопрос или проблема Я пытаюсь реализовать очень простую однослойную МЛП для игрушечной задачи регрессии с одной переменной (размерность = 1) и одной целью (размерность = 1). Это простая задача подгонки кривой с нулевым шумом. Matlab –
Data Science
Вопрос или проблема Я ищу набор данных с файловыми журналами, которые содержат помеченные проблемы в области кибербезопасности. Поскольку я пытаюсь создать модель анализа журналов кибербезопасности, предпочтений по типу журналов нет, но предпочтительным
Data Science
Вопрос или проблема Я новичок в области науки о данных и методов машинного обучения. Мне нужно построить модель, которая позволит мне классифицировать тексты на основе анализа настроений. Прямо сейчас у меня есть только текст, и они не имеют ни класса
Data Science
Вопрос или проблема Я использую реальные CSV-файлы клиентов из моего интернет-магазина. Изначально я собирался использовать k-средние с 2 значениями. Я хочу, чтобы эти два значения были кодом провинции и суммой расходов в моем магазине.
Data Science
Вопрос или проблема Я знаю, что глубокое обучение является подмножеством машинного обучения. Но правильно ли, что классические алгоритмы машинного обучения в основном сосредоточены на реализации дискриминативного ИИ, тогда как алгоритмы глубокого обучения
Data Science
Вопрос или проблема Какой метод можно использовать для классификации данных в следующем примере? Есть таблица (сотни строк и сотни столбцов). Несколько столбцов в этой таблице уникально позволяют классифицировать каждую строку: Класс 0: …шумные биты…00…шумные
Data Science
Вопрос или проблема Мы пытаемся создать модель для классификации различных типов документов в качестве первого шага в нашем процессе (финальная цель – прочитать весь текст). В настоящее время мы используем ImageNet для извлечения признаков, а затем