training - ответы на вопросы - Page 2 of 3

Data Science

Возможно ли обновить данные и повторно обучить только одну из нескольких серий данных в модели BigQuery?

00

Вопрос или проблема Я создаю нечто очень похожее на этот пример проекта BigQuery ML. Моя система отличается в двух направлениях: Во-первых, ей потребуется несколько тысяч временных рядов, поэтому я предпочел бы использовать функцию множественных рядов

Data Science

Как собрать обучающие данные для простых голосовых команд?

00

Вопрос или проблема Я пытаюсь создать модель машинного обучения для распознавания простых голосовых команд, таких как “вверх”, “вниз”, “влево” и т. д. При решении подобных задач, основанных на изображениях, я бы просто

Data Science

Почему неправильно обучать и тестировать модель на одном и том же наборе данных?

00

Вопрос или проблема Каковы подводные камни такого подхода и почему это плохая практика? Может ли так случиться, что модель начинает запоминать изображения “наизусть” вместо того, чтобы понимать лежащую в основе логику?

Data Science

Почему было бы неправильно вычислять и использовать средние значения тестового набора?

00

Вопрос или проблема У меня есть 2 вопроса касательно всей темы набора данных в машинном обучении, и я был бы рад получить ответ 🙂 1. Почему неправильно вычислять и использовать средние значения и стандартные отклонения тестового набора?

Data Science

Как я могу обучить модель изменять вектор, поощряя модель на основе ближайших соседей измененных векторов?

00

Вопрос или проблема Я провожу эксперимент с системой извлечения документов, в которой документы представлены в виде векторов. Когда поступают запросы, они преобразуются в векторы тем же методом, который используется для документов.

Data Science

Точность и потеря в МЛП

00

Вопрос или проблема Я пытаюсь исследовать модели для предсказания, выиграет ли команда или проиграет, основываясь на характеристиках команды и ее соперника. Мои обучающие данные состоят из 15 000 образцов с 760 числовыми признаками.

Data Science

Обучение нейронной сети с ДВУМЯ возможными правильными выходами для одного входа

00

Вопрос или проблема У меня есть система в виде черного ящика, которая имеет два правильных вывода для одного входного образца. Теперь я хочу обучить нейронную сеть, чтобы она генерировала хотя бы один из правильных выводов для этого входного образца.

Data Science

Динамически удалять данные из обучающего набора данных

00

Вопрос или проблема Сегодня мне пришло в голову, что было бы неплохим подходом динамически удалять данные из обучающего набора при обучении нейронной сети. Предполагая задачу классификации, подход мог бы быть таким: Обучить сеть на эпоху.

Data Science

Обратное распространение с функцией активации шага или порога

00

Вопрос или проблема Я понимаю, что градиентный спуск является локальным и работает только с входными данными нейрона, тем, что он выводит, и тем, что он должен выводить. Во всем, что я видел, градиентный спуск требует, чтобы функция активации была дифференцируемой

Data Science

Какое решение лучше всего подходит в моем случае?

00

Вопрос или проблема В настоящее время я ищу возможность создать API для модели, которая может отвечать на вопросы на основе собственных материалов, таких как мои заметки или книги. Я хочу, чтобы модель могла предоставлять ответы напрямую из этих источников.

Data Science

Обоснованно ли проводить разделение на обучающую и тестовую выборки на основе информации/энтропии?

00

Вопрос или проблема Я хочу разделить свой временной ряд данных на обучающую и тестовую выборки. Данные имеют сезонный характер и очень шумные. Когда я случайным образом разделяю, тестовые и обучающие образцы не сходятся в своих распределениях.

Data Science

Почему модель Light GBM даёт разные результаты при тестировании?

00

Вопрос или проблема Используя регрессор Light GBM, я обучил свои данные и, используя Grid Search, получил лучшие параметры, но при тестировании с этими параметрами я получаю разные результаты каждый раз, что означает, что модель выдает разные результаты

Data Science

XGBoost CV путаница в том, как выбрать оценочный набор

00

Вопрос или проблема Если я использую XGBoost с GridSearchCV, как мне выбрать набор для оценки? Обратите внимание, что я имею в виду eval_set в параметрах модели. Моя текущая реализация использует GridSearchCV для оптимизации гиперпараметров, однако, если

Data Science

Кривая обучения и валидации

00

Вопрос или проблема Я новичок в Deep Learning. Мне не очень хорошо удается понимать и комментировать графики. Можете помочь мне с этими графиками Вопросы, которые я задаю себе, когда вижу графики обучения, следующие: Уменьшается ли потеря и увеличивается ли точность?

Data Science

Плоты obj_loss для обучения и валидации YOLOv7-tiny расходятся очень рано.

00

Вопрос или проблема Я обучаю модель YOLOv7-tiny и у меня есть следующие наблюдения из сессии обучения: графики потерь объектности в обучающей и проверочной выборках разошлись довольно рано в процессе обучения потери по классам и рамкам, хотя и не совсем

Data Science

Должен ли я удалить дубликаты по признакам, но без цели?

00

Вопрос или проблема Я веду дебаты с кем-то по поводу проблемы, где есть дубликаты по признакам (т.е. $ X_1 = X_2 $, но $ Y_1 != Y_2 $). С моей точки зрения, мы должны сохранить эти данные, так как они могут быть показательными и, следовательно, интересными

Data Science

Расчет стоимости модели Gemini 1.0 Pro

00

Вопрос или проблема Представьте, что вы готовитесь к тонкой настройке модели Gemini. Пока вы планируете, вы начинаете задумываться о различных расходах, которые вам нужно будет учесть. Вы знаете, что ценообразование Gemini часто подчеркивает расходы

Data Science

разделение на обучающую и тестовую выборки с помощью train_test_split для вещественных значений?

00

Вопрос или проблема Как разделить на обучающую и тестовую выборки с помощью train_test_split значений с плавающей запятой? Я использовал LabelEncoder, но у меня около 300К строк, и когда я использовал cross_val, я увидел ValueError: наименьший класс в

Data Science

Что именно представляет собой истинное распределение в задачах машинного обучения?

00

Вопрос или проблема Я определяю задачу классификации как задачу вычисления функции $h$, которая аппроксимирует функцию $f$, классифицирующую данные. Аппроксимация вычисляется на основе набора обучающих образцов и их классификаций по $f$ и обучения модели на этом наборе данных.

Data Science

Ошибка: В операции градиент имеет None для categorical_crossentropy

00

Вопрос или проблема Я пытаюсь обучить свою дискриминаторную сеть, используя Keras с задним планом TensorFlow. Сеть предназначена для классификации входных данных на один из 9 выходных меток. Я передаю 2D вход (высота, ширина, без каналов) и вектор one-hot для вывода.