Data Science
Прогнозирование продаж скрытых товаров магазина
00
Вопрос или проблема Я работаю над задачей прогнозирования продаж. Я могу предоставить алгоритму данные о том, какие товары были проданы, а какие нет.Как можно предоставить алгоритму информацию о товарах, которых нет в магазине?
Data Science
Как квантование может замедлить модель?
00
Вопрос или проблема Я работаю с библиотекой SentenceTransformers с одной из их моделей встраивания. Производительность хорошая, но я хотел бы пожертвовать частью точности ради повышения производительности. Я пробовал квантизировать модель, с которой работаю
Data Science
Как улучшить модель предсказания видео в Keras?
00
Вопрос или проблема Я работаю над моделью прогнозирования преступлений. У меня есть изображения того, как преступления выглядят каждый день в городе в течение года, и я хочу использовать 30 дней преступности для прогнозирования 31-го дня (так же, как
Data Science
Модель LSTM TensorFlow с меньшей потерей эпохи, но более высоким средним RMSE. Как/почему?
00
Вопрос или проблема Меня очень смущает меньшая потеря, но более высокий RMSE: Вот новая модель с лучшими показателями потерь на том же наборе данных и с большим числом предикторов: Сложение 3 из 3 Эпоха 1/10 170362/170362 [==============================]
Data Science
Использование KNN для классификации инвентаря (физических товарных позиций) – это лучший способ?
00
Вопрос или проблема Я работаю над задачей машинного обучения, связанной с инвентаризацией (то есть физическим запасом в розничной торговле), однако в процессе очистки (удаления выбросов) некоторые товары (через соответствующие транзакции) будут удалены.
Data Science
Сегментационная сеть генерирует шумный вывод
00
Вопрос или проблема Я реализовал SegNet и его вариант ReLU в PyTorch. В данный момент я использую это как доказательство концепции, но меня беспокоит шум, который производит сеть. С оптимизатором ADAM, похоже, шум немного меньше, тогда как с SGD шум увеличивается.
Data Science
Набор данных с несколькими вариантами ответов для дообучения
00
Вопрос или проблема Надеюсь, здесь можно задавать вопросы, но я ищу набор данных (формат не так важен), который похож на SQuAD, но также содержит ложные ответы на вопросы. Я хочу использовать его для дообучения GPT-3, и все, что я нахожу, это либо вопросы
Data Science
Работа с пропущенными данными в SVD
00
Вопрос или проблема Я новичок в машинном обучении и пытаюсь применить SVD к набору данных movielens для рекомендаций фильмов. У меня есть матрица “фильм-пользователь”, где строка – это идентификатор пользователя, столбец –
Data Science
Как интегрировать новые функции в существующую модель машинного обучения?
00
Вопрос или проблема Допустим, мы обучили регрессионную модель $M$ на фиксированном наборе $n$ признаков, $F_1,F_2,…,F_n$ на определенном наборе данных $G$. Теперь предположим, что после обучения модели для поднабора $H\subset G$ становятся доступными
Data Science
Наивный Байес предсказывает тип = ‘сырой’, возвращая NA
00
Вопрос или проблема Я создал модель наивного байеса для классификации текста. Она предсказывает правильно. Но она возвращает ‘NA’ в результатах предсказания, если я задаю ‘type = raw’. Я видел некоторые результаты на Stackoverflow о добавлении шума.
Data Science
Передача глубинного обучения с одного набора воздушных изображений на многие другие
00
Вопрос или проблема Я новичок в глубокем обучении, но мне удалось успешно использовать RasterVision для предсказания границ зданий на наборе аэрофотографий. Этот набор аэрофотографий относится к провинции Новой Зеландии. Теперь, когда у меня есть модель
Data Science
Модель классификации на основе упорядоченных признаков
00
Вопрос или проблема Я пытаюсь построить классификатор для конкретного набора данных карт, скажем, карты или без карт. Я использую Mobilenet, обученный на наборе данных Imagenet, в качестве своего классификатора и далее обучаю его на моем наборе данных.
Data Science
Перцептрон – Какую ступенчатую функцию выбрать
00
Вопрос или проблема Я изучаю алгоритм Перцептрон. Некоторые книги используют следующую ступенчатую функцию: 1, если x>=0, иначе -1 где x — это скалярное произведение между весами w и образцом x. Другие книги используют: 1, если x>
Data Science
Значения потерь, похоже, колеблются, но веса верные.
00
Вопрос или проблема Я делаю свои первые шаги с tensorflow (и в машинном обучении в целом) и использую этот код для тренировки очень простой модели, которая пытается найти основное линейное соотношение: f(x,y) = 4x + 7y –
Data Science
Как создать классификатор на основе данных с сенсоров?
00
Вопрос или проблема Я работаю над локализацией в помещении на основе магнитометра. У меня есть 9 отдельных наборов временных рядов с показаниями датчиков, взятыми с координат 00, 01, 02, 10, 11 и так далее до 22. В основном я использую свою собственную
Data Science
Использование различных метрик для обучения и валидации
00
Вопрос или проблема Существует ли теоретическое обоснование для использования другой метрики на валидационном наборе для выбора модели, чем та, которая использовалась для обучения? Например, можно обучить модель, используя какой-либо тип дифференцируемой потери (т.
Data Science
Существует ли база данных текстового сходства для фраз?
00
Вопрос или проблема Я хочу обучить свое приложение для оценки схожести фраз. Я хочу, чтобы моя модель предсказывала коэффициент схожести для фраз, как показано в приведенных ниже примерах. пример- International Business Machines = I.
Data Science
IDE для рабочего процесса машинного обучения – AWS SageMaker
00
Вопрос или проблема Похоже, что мы на самом деле не используем IDE на любом этапе рабочего процесса машинного обучения, если используем AWS SageMaker. Вся работа выполняется в Jupyter Notebook. Это так? Jupyter Notebook можно рассматривать как интегрированную среду разработки (IDE).
Data Science
Метрика регрессии для набора данных с широким диапазоном значений целевой переменной.
00
Вопрос или проблема У меня есть набор данных из около 100 изображений. Каждое изображение имеет метку, которая является числовым значением. Модели должны учиться на изображениях, чтобы предсказывать числовые метки. Однако проблема в том, что я не знаю
Data Science
Подход Train/val/test для настройки гиперпараметров
00
Вопрос или проблема Когда вы планируете обучать модель, имеет ли смысл разделение данных на 60-20-20 для обучения, валидации и тестирования, сначала настраивая гиперпараметры на обучающем наборе данных, используя валидационный набор, и выбирая лучшую модель.