Data Science

Почему Faster R-CNN использует оптимизатор SGD вместо Adam?

00

Вопрос или проблема Я только начинаю изучать Faster R-CNN и у меня есть некоторые сомнения по поводу оптимизатора этой сети. Насколько я понимаю, оптимизатор Adam работает гораздо лучше, чем SGD во многих сетях. Тем не менее, в статье о Faster R-CNN выбирается

Data Science

Как выбрать архитектуру нейронной сети?

00

Вопрос или проблема Как выбрать архитектуру нейронной сети? Примеры: «Что если мне нужно переводить слова?» «Генерировать текст, изображения?» «Играть в обычную игру?» «Играть в игру, которая меняется в зависимости от действий игрока, то есть нейронная

Data Science

Как объяснить относительную разницу между макро-AUC и макро-F1 в задаче многоклассовой классификации?

00

Вопрос или проблема На днях я опубликовал статью, в которой результат модели с учителем следующий. Все метрики усредненные по классу. Меня попросили прокомментировать разницу между AUC и другими метриками, в частности F1. Быстро это относительно сбалансированная задача.

Data Science

Лучший способ оценить производительность в моем случае

00

Вопрос или проблема У меня есть набор данных, который выглядит так F1 F2 F3 F4 F5 F6 A1 A2 A3 1 0 0 0 4 3 X X X 0 3 9 0 0 0 X A X 0 0 0 0 1 0 X X X 0 0 3 2 0 0 X X […]

Data Science

Почему бы нам не увеличить параметр с 64 до 128 в этой модели CNN?

00

Вопрос или проблема Я смотрю на пример лабораторной работы из курса на Coursera под названием “Введение в Tensorflow”. В этой модели CNN они постепенно увеличивают количество фильтров с 16 до 32, а затем до 64. Почему мы не увеличиваем его до 128 и больше?

Data Science

Как обеспечить одинаковый шаблон кодирования?

00

Вопрос или проблема Я создал модель XGBRegressor с определенными закодированными даными типа ‘object’ в данных. Теперь, если я хочу запустить модель с новым набором данных, который только что закодирован, она дает неправильные предсказания.

Data Science

Как измерить влияние Covid, анализируя транзакции по кредитным картам клиентов.

00

Вопрос или проблема Я хочу знать, как можно определить, находится ли клиент в финансовом затруднении из-за ситуации с COVID, используя его транзакции по кредитной карте. У меня есть ежедневные транзакции клиентов до текущей даты.

Data Science

Ошибка вне выборки в Orange

00

Вопрос или проблема Есть ли способ увидеть ошибку вне выборки в Orange? Виджет Тест и Оценка только сообщает среднеквадратичную ошибку, корень среднеквадратичной ошибки, среднюю абсолютную ошибку, коэффициент детерминации и среднеквадратичное отклонение.

Data Science

Как рассчитывается ошибка с несколькими выходными нейронами в нейронной сети?

00

Вопрос или проблема Книги по машинному обучению в общем описывают, что ошибка, рассчитанная для данной выборки $i$, определяется следующим образом: $e_i = y_i – \hat{y_i}$ Где $\hat{y}$ — это целевой выход, а $y$ — это фактический выход, получаемый сетью.

Data Science

Путаница в применении k-кратной кросс-валидации к набору данных

00

Вопрос или проблема У меня есть набор данных, который уже разделен на 10 частей, при этом каждая часть содержит обучающие, валидационные и тестовые наборы. Я не понимаю, как применить 10-кратную кросс-валидацию к этому набору данных.

Data Science

Как использовать текст в качестве входных данных для нейронной сети – задача регрессии? Сколько лайков/апплодисментов получит статья?

00

Вопрос или проблема Я пытаюсь предсказать количество лайков, которые статья или пост получит, используя нейронную сеть. У меня есть датафрейм с ~70,000 строк и 2 столбцами: “text” (предиктор – строки текста) и “

Data Science

Прогнозирование частичного ввода

00

Вопрос или проблема В контексте контролируемого машинного обучения существует ли способ сделать прогноз по частичному вводу (т.е. некоторые признаки неизвестны) в общем? Если нет, существуют ли модели, которые поддерживают эту функцию?

Data Science

Нужна помощь в создании диаграммы архитектуры нейронной сети для этой конкретной сети.

00

Вопрос или проблема Полный новичок в машинном обучении, но мне нужно опубликовать статью, это требование курса. Мне нужна помощь. Для этой реализации ResNet50 мне нужна схема архитектуры, которая выглядит так: Вот код: import torch import torch.

Data Science

несбалансированный целевой набор данных (многоклассовый)

00

Вопрос или проблема У меня есть задача предсказания с многими классами но 300 классов несбалансированы должен ли я сбалансировать все 300 классов, чтобы получить лучший результат? существует ли более простой способ решить эту задачу?

Data Science

Ошибка Keras NasNetlarge без верхнего уровня

00

Вопрос или проблема Я пытаюсь использовать NasNetlarge в Keras без верхней части, но не могу избавиться от верхней части: from keras.applications import NASNetLarge model = NASNetLarge(input_shape=(224, 224, 3), include_top=False, weights="imagenet")

Data Science

Панды: Расчет лучшего продавца с учетом количества проданных домов

00

Вопрос или проблема Я анализировал данные продавцов и пытался получить инсайты. Я написал оператор groupby, чтобы получить среднюю цену продажи для каждого продавца. for seller,seller_df in g: df=df.append({'Seller':seller,'AveragePrice':seller_df.

Data Science

Ищу набор данных о причинно-следственной связи.

00

Вопрос или проблема Я ищу набор данных о причинно-следственных связях, который выглядел бы так: животное + машина -> авария превышение скорости -> штраф за нарушение ПДД помидоры + салат -> салат вирус -> болезнь кариес ->

Data Science

Рейтинг банкоматов на основе использования и экономических данных (Модель оценки/рейтинга)

00

Вопрос или проблема У меня есть образец данных о расположении около 10 банкоматов, а также их количестве использования (внесения наличных, снятия наличных и других операций) за последние 3 месяца. Я планирую собрать дополнительные данные, такие как ближайшие

Data Science

Детали нормализации по слоям в GPT-2

02

Вопрос или проблема Я прочитал, что GPT-2 и другие трансформеры используют нормализацию по слоям перед блоками самовнимания и полносвязными слоями, но я все еще не уверен, как именно работает нормализация. Предположим, что наш размер контекста составляет

Data Science

Существует ли математическая верификация для TBPTT (усечённого обратного распространения ошибки через время)?

00

Вопрос или проблема Мой вопрос в заголовке. В настоящее время я ищу публикацию или академическую ссылку на этот алгоритм, даже в новом контексте. Спасибо за все возможные ответы, Обрезанная обратная пропаганда во времени (truncated BPTT) является широко