Data Science
Требуется ли масштабирование для таких наборов данных?
00
Вопрос или проблема У меня есть набор данных с такими характеристиками, как количество просмотров продукта (в сотнях тысяч), количество кликов по продуктам (в тысячах), коэффициент конверсии (в десятичном формате, например, 7,6%) и продажи (в сотнях).
Data Science
Тренды и темы искусственного интеллекта
00
Вопрос или проблема Мне интересно, существуют ли веб-сайты, с помощью которых можно постоянно быть в курсе последних тенденций или тем, связанных с разрушительными приложениями в области искусственного интеллекта. Обычно я читаю научные публикации, посвященные
Data Science
Включение структурной информации в трансформер?
03
Вопрос или проблема В задаче нейронного машинного перевода (NMT) мои входные данные содержат реляционную информацию. Эти отношения можно смоделировать с помощью графовой структуры. Один из подходов может заключаться в использовании графовой нейронной
Data Science
Распознавание форм для фигур, образованных точечными точками
00
Вопрос или проблема На изображении, в правом нижнем углу, находятся круг и треугольник, созданные с помощью набора координат. Я тщательно искал в интернете алгоритм или подход для правильной классификации формы. И все же мне ничего не удалось найти.
Data Science
Скорость для различных ядер в SVM scikit-learn
00
Вопрос или проблема Я использую scikit-learn в Python для создания моделей, пробуя разные ядра. Я был удивлён, увидев, что RBF обучается менее чем за секунду, тогда как линейная модель заняла минуту, а полиномиальная — часы. Может кто-то объяснить, почему это происходит?
Data Science
Как обрабатывать сходство слов и категоризировать группу слов в одно слово.
00
Вопрос или проблема Я новичок в этой области и довольно долго искал решения, только чтобы наткнуться на множество различных возможных подходов, но ничего конкретного. Если у меня есть список слов, скажем: email_addr, email, email_address, address или
Data Science
Градиентный бустинг – Зачем псевдо-остатки?
01
Вопрос или проблема У меня есть несколько вопросов, которые я не совсем понимаю относительно алгоритма градиентного бустинга с решающими деревьями: Имеет ли значение начальное значение как $\hat{y}$ или вы можете выбрать любое, например, между 0 и 1?
Data Science

Может ли RNN обучаться для каждого t во времени на новом наборе данных (много записей)?

00
Вопрос или проблема По сути, мой набор данных не является простым многомерным временным рядом, как это часто бывает (в какой-то степени). На каждый месяц у меня есть N записей (не менее 3000). Может ли RNN любого сорта (пожалуйста, простите мою неосведомлённость
Data Science
ValueError: Ошибка при проверке входных данных: ожидался вход dense_36_input с формой (None, 12), но получен массив с формой (140, 2)
00
Вопрос или проблема Создание модели: model=Sequential() model.add(Dense(input_dim = 12, units = 10, activation='relu', kernel_initializer="uniform")) model.add(Dense(units = 8, activation='relu', kernel_initializer="uniform")) model.
Data Science
Мне нужно обучать отдельную модель DeepFake для каждого вводимого человека?
00
Вопрос или проблема Я хотел бы создать глубокую фейковую модель конкретного человека (назовем его Стив). Затем я хотел бы иметь возможность загрузить видео любого случайного человека и заменить его лицо на лицо Стива. На данный момент я заметил, что большинство
Data Science
Связывание изменений значения во времени с известными событиями
00
Вопрос или проблема Я работаю с двумя наборами данных. Первый набор данных содержит значения флуоресценции, измеренные каждую минуту. Второй набор данных содержит определенные события и их время. Мы знаем, что эти события вызывают пики значений флуоресценции
Data Science
Техники оптимизации маркетинговых расходов
00
Вопрос или проблема Мне нужна помощь в оптимизации затрат на маркетинг. Я работаю с клиентом, который ведет оффлайн-операции, основанные в основном на онлайн-маркетинге (фейсбук, гугл, твиттер и т.д.). Они попросили меня проанализировать их маркетинговые
Data Science
Использование Keras с sklearn: применение class_weight с cross_val_score
00
Вопрос или проблема У меня имеется сильно несбалансированный набор данных (± 5% положительных экземпляров), для которого я обучаю бинарные классификаторы. Я использую вложенную 5-кратную кросс-валидацию с поиском по сетке для настройки гиперпараметров.
Data Science
Когда низкий коэффициент детерминации может создать хорошие предсказательные модели?
00
Вопрос или проблема Большинство обсуждений по поводу предсказаний моделей утверждает, что следует сосредоточиться на метриках ошибки, таких как RMSE, MSE, MAE или MAPE. Некоторые даже утверждают, что r-квадрат может быть низким в хорошей модели.
Data Science
Метрики регрессии интерпретации
00
Вопрос или проблема Я провел анализ набора данных с помощью модели случайного леса. Результаты следующие. Почему MSE крайне высок, но коэффициент детерминации (r2) показывает точность около 83-84%? Это нормально и связано с набором данных, или это указывает на проблему?
Data Science
Как выбрать подходящие предикторы для модели классификации?
01
Вопрос или проблема Я работаю над задачей классификации. У меня есть две модели: Модель логистической регрессии Модель случайного леса Для первой модели, если я выберу только предикторы с p-значениями<0.05, я снизлю точность, полноту и т.
Data Science
Плохие результаты метрик из-за сильного классового дисбаланса в классификации кредитных карт.
00
Вопрос или проблема Здравствуйте, в данный момент я пишу дипломную работу и застрял на некоторых этапах. Я разработал несколько моделей машинного обучения (XGBoost, (сбалансированный) случайный лес, ElasticNet и др.) на крайне несбалансированном наборе
Data Science
Обучение с переносом с использованием множества небольших наборов данных
00
Вопрос или проблема Контекст Я работаю над моделью обработки естественного языка (NLP), которая может классифицировать документы в одну из N категорий. У меня есть данные документов от нескольких различных клиентов. Темы документов схожи между клиентами
Data Science
Keras – метод add_weight() не добавляет к общему количеству параметров модели
00
Вопрос или проблема Я создаю пользовательский уровень Keras FConv2D() и добавляю вес в его функции build() с помощью метода add_weight(), как предложено в официальном руководстве Keras по созданию пользовательских уровней. def build(self, input_shape): shape = tf.
Data Science
Математика за этим, $MSE = смещение^2 + дисперсия$
00
Вопрос или проблема Основано на deeplearningbook: $$ \begin{align} MSE &= E[(\theta_m^{-} – \theta)^2] \\ &= Bias(\theta_m^{-})^2 + Var(\theta_m^{-})\\ \end{align} $$ где $m$ — это количество образцов в обучающем наборе, $\theta$ — это фактический