Data Science
Какое разумное распределение можно использовать для моделирования просмотров со временем для… этого вопроса?
00
Вопрос или проблема Извините за самоцитирующийся заголовок 😉 Мне было бы любопытно узнать, какая кривая могла бы использоваться для моделирования – в масштабе (скажем) недель* – “цикла вовлеченности” одной новостной страницы онлайн-газеты
Data Science
Соберите нейронную сеть для многовыходной регрессии.
00
Вопрос или проблема У меня есть нейронная сеть, которая принимает около 25 входов и выдает 3 действия. Выходы: дельта X и дельта Y робота и угол робота. После ввода данных в модель я получаю очень разные (и странные) предсказания угла. В чем может быть причина?
Data Science
Как определить сходимость стохастического градиентного спуска?
00
Вопрос или проблема При кодировании батчевого градиентного спуска легко реализовать сходимость, так как после каждой итерации стоимость движется к минимуму, и когда изменение стоимости приближается к заранее определенному числу, мы останавливаем итерации
Data Science
Кластеризация с иерархическими зависимостями данных
00
Вопрос или проблема В настоящее время я изучаю, как объединить данные с иерархическими зависимостями. Пример проблемы, которую я хочу кластеризовать: мы хотели бы сгруппировать города, чтобы выявить сходные характеристики по отношению к жителям.
Data Science
Как преобразовать аббревиатуры префиксов названий городов?
00
Вопрос или проблема Существует ли какой-либо стандартный инструмент, библиотека или список для расширения сокращений названий городов? Например, “MT HOLLY” -> “MOUNT HOLLY” или “ST MICHAELS”
Data Science
Не удается закодировать несколько категориальных столбцов одновременно [дубликат]
00
Вопрос или проблема На этот вопрос уже есть ответы здесь: Разница между OrdinalEncoder и LabelEncoder (4 ответа) Закрыто 1 час назад. Я написал следующий код для кодирования категориальных признаков датафрейма (названного ‘
Data Science
Как я могу улучшить точность своей модели? (Предсказание отмены такси)
00
Вопрос или проблема Я пытаюсь предсказать на основе нескольких параметров, таких как тип поездки, тип автомобиля, источник бронирования, время начала, время до бронирования (начало – бронирование) и несколько других параметров, отменит ли клиент бронь или нет.
Data Science
Используя частоту выброса
00
Вопрос или проблема Я занимаюсь обнаружением выбросов (условные выбросы) в многомерном временном ряду. Выбросы появляются каждые 2 недели $\pm$ 4 дня. Как я могу учесть этот предварительный опыт в своих моделях, чтобы снизить количество ложноположительных результатов?
Data Science
Нейронная сеть, достигающая локальных оптимумов
00
Вопрос или проблема Недавно я пытался обучить сверточную нейронную сеть для классификации людей как испаноязычных или белых (для учебных целей). Я не мог найти хорошую выборку данных только для этих двух рас, поэтому мне пришлось вручную собирать изображения из интернета.
Data Science
С несколькими идентичными данными, следует ли мне установить UMAP min_dist = 0?
00
Вопрос или проблема Большинство (если не все) реализаций/примеров снижения размерности UMAP, которые я видел, используют значение min_dist, немного превышающее ноль, чтобы избежать слишком плотного кластеризования точек. Это имеет смысл, но я заметил
Data Science
Какие уравнения участвуют в расчете параметров слоя внедрения?
00
Вопрос или проблема Я пытаюсь провести анализ настроений по некоторым данным, используя keras. Я использую слой встраивания и затем LSTM. Я знаю, что слой встраивания снижает разреженность кодирования “один-горячий”
Data Science
Альтернативы MultiLabelBinarizer
00
Вопрос или проблема Существует много информации о том, как обрабатывать категориальные переменные при предварительной обработке данных для классификации с использованием машинного обучения. Однако я не могу найти никаких рекомендаций о том, как обрабатывать
Data Science
Обучение модели, где каждый ответ в наблюдательных данных имеет разную известную дисперсию.
00
Вопрос или проблема У меня есть набор данных, в котором каждая зависимая переменная — это число успехов в N испытаниях Бернулли, причем N и p (вероятность успеха) отличаются для каждого наблюдения. Цель состоит в том, чтобы обучить модель предсказывать p, учитывая предикторы.
Data Science
Тензорфлоу простая нейронная сеть имеет очень плохую производительность в задачах регрессии (аппроксимации кривой).
00
Вопрос или проблема Я пытаюсь реализовать очень простую однослойную МЛП для игрушечной задачи регрессии с одной переменной (размерность = 1) и одной целью (размерность = 1). Это простая задача подгонки кривой с нулевым шумом. Matlab –
Data Science
Набор данных анализа логов с помеченными проблемами кибербезопасности
00
Вопрос или проблема Я ищу набор данных с файловыми журналами, которые содержат помеченные проблемы в области кибербезопасности. Поскольку я пытаюсь создать модель анализа журналов кибербезопасности, предпочтений по типу журналов нет, но предпочтительным
Data Science
Создание модели классификации текста с нуля
00
Вопрос или проблема Я новичок в области науки о данных и методов машинного обучения. Мне нужно построить модель, которая позволит мне классифицировать тексты на основе анализа настроений. Прямо сейчас у меня есть только текст, и они не имеют ни класса
Data Science
Какой алгоритм машинного обучения мне использовать для построения графика и прогнозирования местоположения клиента по сравнению с затраченными средствами?
00
Вопрос или проблема Я использую реальные CSV-файлы клиентов из моего интернет-магазина. Изначально я собирался использовать k-средние с 2 значениями. Я хочу, чтобы эти два значения были кодом провинции и суммой расходов в моем магазине.
Data Science
Машинное обучение против глубокого обучения? В контексте генеративного ИИ против дискриминативного ИИ?
00
Вопрос или проблема Я знаю, что глубокое обучение является подмножеством машинного обучения. Но правильно ли, что классические алгоритмы машинного обучения в основном сосредоточены на реализации дискриминативного ИИ, тогда как алгоритмы глубокого обучения
Data Science
Классификация шумных данных
00
Вопрос или проблема Какой метод можно использовать для классификации данных в следующем примере? Есть таблица (сотни строк и сотни столбцов). Несколько столбцов в этой таблице уникально позволяют классифицировать каждую строку: Класс 0: …шумные биты…00…шумные
Data Science
функции, помогающие различать изображения документов
00
Вопрос или проблема Мы пытаемся создать модель для классификации различных типов документов в качестве первого шага в нашем процессе (финальная цель – прочитать весь текст). В настоящее время мы используем ImageNet для извлечения признаков, а затем