Data Science
Возможно ли обновить данные и повторно обучить только одну из нескольких серий данных в модели BigQuery?
00
Вопрос или проблема Я создаю нечто очень похожее на этот пример проекта BigQuery ML. Моя система отличается в двух направлениях: Во-первых, ей потребуется несколько тысяч временных рядов, поэтому я предпочел бы использовать функцию множественных рядов
Data Science
Как собрать обучающие данные для простых голосовых команд?
00
Вопрос или проблема Я пытаюсь создать модель машинного обучения для распознавания простых голосовых команд, таких как “вверх”, “вниз”, “влево” и т. д. При решении подобных задач, основанных на изображениях, я бы просто
Data Science
Почему неправильно обучать и тестировать модель на одном и том же наборе данных?
00
Вопрос или проблема Каковы подводные камни такого подхода и почему это плохая практика? Может ли так случиться, что модель начинает запоминать изображения “наизусть” вместо того, чтобы понимать лежащую в основе логику?
Data Science
Почему было бы неправильно вычислять и использовать средние значения тестового набора?
00
Вопрос или проблема У меня есть 2 вопроса касательно всей темы набора данных в машинном обучении, и я был бы рад получить ответ 🙂 1. Почему неправильно вычислять и использовать средние значения и стандартные отклонения тестового набора?
Data Science
Как я могу обучить модель изменять вектор, поощряя модель на основе ближайших соседей измененных векторов?
00
Вопрос или проблема Я провожу эксперимент с системой извлечения документов, в которой документы представлены в виде векторов. Когда поступают запросы, они преобразуются в векторы тем же методом, который используется для документов.
Data Science
Точность и потеря в МЛП
00
Вопрос или проблема Я пытаюсь исследовать модели для предсказания, выиграет ли команда или проиграет, основываясь на характеристиках команды и ее соперника. Мои обучающие данные состоят из 15 000 образцов с 760 числовыми признаками.
Data Science
Обучение нейронной сети с ДВУМЯ возможными правильными выходами для одного входа
00
Вопрос или проблема У меня есть система в виде черного ящика, которая имеет два правильных вывода для одного входного образца. Теперь я хочу обучить нейронную сеть, чтобы она генерировала хотя бы один из правильных выводов для этого входного образца.
Data Science
Динамически удалять данные из обучающего набора данных
00
Вопрос или проблема Сегодня мне пришло в голову, что было бы неплохим подходом динамически удалять данные из обучающего набора при обучении нейронной сети. Предполагая задачу классификации, подход мог бы быть таким: Обучить сеть на эпоху.
Data Science
Обратное распространение с функцией активации шага или порога
00
Вопрос или проблема Я понимаю, что градиентный спуск является локальным и работает только с входными данными нейрона, тем, что он выводит, и тем, что он должен выводить. Во всем, что я видел, градиентный спуск требует, чтобы функция активации была дифференцируемой
Data Science
Какое решение лучше всего подходит в моем случае?
00
Вопрос или проблема В настоящее время я ищу возможность создать API для модели, которая может отвечать на вопросы на основе собственных материалов, таких как мои заметки или книги. Я хочу, чтобы модель могла предоставлять ответы напрямую из этих источников.
Data Science
Обоснованно ли проводить разделение на обучающую и тестовую выборки на основе информации/энтропии?
00
Вопрос или проблема Я хочу разделить свой временной ряд данных на обучающую и тестовую выборки. Данные имеют сезонный характер и очень шумные. Когда я случайным образом разделяю, тестовые и обучающие образцы не сходятся в своих распределениях.
Data Science
Почему модель Light GBM даёт разные результаты при тестировании?
00
Вопрос или проблема Используя регрессор Light GBM, я обучил свои данные и, используя Grid Search, получил лучшие параметры, но при тестировании с этими параметрами я получаю разные результаты каждый раз, что означает, что модель выдает разные результаты
Data Science
XGBoost CV путаница в том, как выбрать оценочный набор
00
Вопрос или проблема Если я использую XGBoost с GridSearchCV, как мне выбрать набор для оценки? Обратите внимание, что я имею в виду eval_set в параметрах модели. Моя текущая реализация использует GridSearchCV для оптимизации гиперпараметров, однако, если
Data Science
Кривая обучения и валидации
00
Вопрос или проблема Я новичок в Deep Learning. Мне не очень хорошо удается понимать и комментировать графики. Можете помочь мне с этими графиками Вопросы, которые я задаю себе, когда вижу графики обучения, следующие: Уменьшается ли потеря и увеличивается ли точность?
Data Science
Плоты obj_loss для обучения и валидации YOLOv7-tiny расходятся очень рано.
00
Вопрос или проблема Я обучаю модель YOLOv7-tiny и у меня есть следующие наблюдения из сессии обучения: графики потерь объектности в обучающей и проверочной выборках разошлись довольно рано в процессе обучения потери по классам и рамкам, хотя и не совсем
Data Science
Должен ли я удалить дубликаты по признакам, но без цели?
00
Вопрос или проблема Я веду дебаты с кем-то по поводу проблемы, где есть дубликаты по признакам (т.е. $ X_1 = X_2 $, но $ Y_1 != Y_2 $). С моей точки зрения, мы должны сохранить эти данные, так как они могут быть показательными и, следовательно, интересными
Data Science
Расчет стоимости модели Gemini 1.0 Pro
00
Вопрос или проблема Представьте, что вы готовитесь к тонкой настройке модели Gemini. Пока вы планируете, вы начинаете задумываться о различных расходах, которые вам нужно будет учесть. Вы знаете, что ценообразование Gemini часто подчеркивает расходы
Data Science
разделение на обучающую и тестовую выборки с помощью train_test_split для вещественных значений?
00
Вопрос или проблема Как разделить на обучающую и тестовую выборки с помощью train_test_split значений с плавающей запятой? Я использовал LabelEncoder, но у меня около 300К строк, и когда я использовал cross_val, я увидел ValueError: наименьший класс в
Data Science
Что именно представляет собой истинное распределение в задачах машинного обучения?
00
Вопрос или проблема Я определяю задачу классификации как задачу вычисления функции $h$, которая аппроксимирует функцию $f$, классифицирующую данные. Аппроксимация вычисляется на основе набора обучающих образцов и их классификаций по $f$ и обучения модели на этом наборе данных.
Data Science

Ошибка: В операции градиент имеет None для categorical_crossentropy

00
Вопрос или проблема Я пытаюсь обучить свою дискриминаторную сеть, используя Keras с задним планом TensorFlow. Сеть предназначена для классификации входных данных на один из 9 выходных меток. Я передаю 2D вход (высота, ширина, без каналов) и вектор one-hot для вывода.