Data Science
Data Science
Вопрос или проблема Я работаю с набором данных Yahoo! Webscope ydata-frontpage-todaymodule-clicks-v1_0 (в частности, с журналами кликов за первые десять дней мая 2009 года). Описание набора данных гласит, что каждый пользователь и статья имеют 6 признаков
Data Science
Вопрос или проблема Я обучаю модель Keras для многомерной регрессии, используя пользовательскую функцию потерь с целью получить прогнозы с точностью до ниже 0.01 в отношении этой функции потерь. Как видно из приведенного ниже графика функций потерь, как
Data Science
Вопрос или проблема Этот вопрос также на основном SO. Я видел на meta можно спрашивать на двух форумах Я скачал из bucket мой VertexAI AutoML, вот как это выглядит: Когда я пробую: ```import tensorflow as tf # Load the saved_model.
Data Science
Вопрос или проблема Почему нам нужно использовать инструмент Labelimg для обнаружения объектов? После маркировки множества тренировочных изображений с помощью инструмента labelimg, который даст файл CSV, как этот CSV файл работает с TensorFlow object detection API и Keras?
Data Science
Вопрос или проблема Я строю иерархический текстовый классификатор, используя подход Local Classifier Per Parent Node (LCPN) с политикой ‘siblings’, как описано в обзоре иерархической классификации в различных областях применения: Например
Data Science
Вопрос или проблема У меня есть четыре независимые переменные для анализа их влияния на одну зависимую переменную. Одна из независимых переменных закодирована в процентах. Как я могу определить ее влияние на зависимую переменную.
Data Science
Вопрос или проблема Что мы имеем в виду, когда говорим о Data analytics и Data analysis? Data analytics — это широкая область, связанная с использованием данных и инструментов для принятия бизнес-решений. Data analysis — это подмножество data analytics
Data Science
Вопрос или проблема Я обучил модель машинного обучения с хорошей точностью, но что дальше? Мне сложно ответить на этот вопрос: как вы представите свою модель? Какую платформу вы используете? Как вы обеспечиваете непрерывное обучение модели?
Data Science
Вопрос или проблема Я довольно новичок в ML, и теперь, когда я прошел через учебники и документацию, я захотел сам создать модель. Проблема: Я плотник, и когда мы были в школе, у нас была проблема, где нам предоставили несколько примеров планировок гостиных
Data Science
Вопрос или проблема Я пытаюсь обучить байесовскую нейронную сеть, и в какой-то момент мне нужно вычислить логарифмическую вероятность для некоторых данных в соответствии с многомерным диагональным нормальным распределением с параметрами (mu, sigma).
Data Science
Вопрос или проблема Я нашел рекурсивную версию прямого алгоритма на Википедии, однако я не понимаю обозначения, использованные в псевдокоде: Что означает $$x_{t-1}$$ под знаком суммы? Что нужно суммировать? Было бы очень полезно, если бы кто-нибудь мог
Data Science
Вопрос или проблема Я пытаюсь понять несколько аспектов архитектуры трансформера на основе этого изображения: Предположим, $n$ — это количество токенов, $d_e$ — размерность эмбеддингов, а $d_m$ — размерность модели. Насколько я понимаю, матрицы позиционного
Data Science
Вопрос или проблема Существует необходимость оценить среднегодовой объем суточного трафика (AADT). У нас есть много данных о скоростях автомобилей за несколько лет. Замечено, что AADT зависит от среднего количества таких выборок за некоторое время, поэтому
Data Science
Вопрос или проблема Насколько я понимаю, все токены передаются в трансформер одновременно, и позиционные кодировки помогают ему понять их порядок в последовательности. А косинусовое кодирование помогает захватить краткосрочные и долгосрочные зависимости
Data Science
Вопрос или проблема У меня есть временные ряды данных (доходность акций), и я обучаю на них регрессию случайного леса. Общее количество наблюдений = 2499. Чтобы лучше оценить производительность, я реализовал тестирование с прокатными окнами с размерами
Data Science
Вопрос или проблема Мне действительно нужна помощь с GAM. Я должен выяснить, является ли ассоциация линейной или нелинейной с помощью GAM. Переменная предиктор — это температура на лаге 0, а результат — сердечно-сосудистые госпитализации (переменная подсчета).
Data Science
Вопрос или проблема Предположим, я имею дело с бинарной классификацией. Для какого типа данных использование Наивного Байеса с использованием метода максимального правдоподобия даст лучшее решение, а для какого типа данных логистическая регрессия будет лучшим выбором?
Data Science
Вопрос или проблема В моих конспектах курса указаны две причины, почему кросс-валидация имеет пессимистичный уклон. Первая причина заключается в том, что точность измеряется для моделей, которые обучены на меньшем количестве данных, что я понимаю.
Data Science
Вопрос или проблема Я использую Tensorflow. Рассмотрим следующий пример: >>> x <tf.Tensor: shape=(1,), dtype=float32, numpy=array([-0.22630838], dtype=float32)> >>> tf.keras.layers.BatchNormalization()(x) <
Data Science
Вопрос или проблема Я занимаюсь классификацией с использованием Python. Я использую класс GridSearchCV, этот класс имеет атрибут best_score_, определяемый как “Средняя кросс-валидиционная оценка лучшего оценщика”. С этим классом я также могу