training
Data Science
Вопрос или проблема Я создаю нечто очень похожее на этот пример проекта BigQuery ML. Моя система отличается в двух направлениях: Во-первых, ей потребуется несколько тысяч временных рядов, поэтому я предпочел бы использовать функцию множественных рядов
Data Science
Вопрос или проблема Я пытаюсь создать модель машинного обучения для распознавания простых голосовых команд, таких как “вверх”, “вниз”, “влево” и т. д. При решении подобных задач, основанных на изображениях, я бы просто
Data Science
Вопрос или проблема Каковы подводные камни такого подхода и почему это плохая практика? Может ли так случиться, что модель начинает запоминать изображения “наизусть” вместо того, чтобы понимать лежащую в основе логику?
Data Science
Вопрос или проблема У меня есть 2 вопроса касательно всей темы набора данных в машинном обучении, и я был бы рад получить ответ 🙂 1. Почему неправильно вычислять и использовать средние значения и стандартные отклонения тестового набора?
Data Science
Вопрос или проблема Я провожу эксперимент с системой извлечения документов, в которой документы представлены в виде векторов. Когда поступают запросы, они преобразуются в векторы тем же методом, который используется для документов.
Data Science
Вопрос или проблема Я пытаюсь исследовать модели для предсказания, выиграет ли команда или проиграет, основываясь на характеристиках команды и ее соперника. Мои обучающие данные состоят из 15 000 образцов с 760 числовыми признаками.
Data Science
Вопрос или проблема У меня есть система в виде черного ящика, которая имеет два правильных вывода для одного входного образца. Теперь я хочу обучить нейронную сеть, чтобы она генерировала хотя бы один из правильных выводов для этого входного образца.
Data Science
Вопрос или проблема Сегодня мне пришло в голову, что было бы неплохим подходом динамически удалять данные из обучающего набора при обучении нейронной сети. Предполагая задачу классификации, подход мог бы быть таким: Обучить сеть на эпоху.
Data Science
Вопрос или проблема Я понимаю, что градиентный спуск является локальным и работает только с входными данными нейрона, тем, что он выводит, и тем, что он должен выводить. Во всем, что я видел, градиентный спуск требует, чтобы функция активации была дифференцируемой
Data Science
Вопрос или проблема В настоящее время я ищу возможность создать API для модели, которая может отвечать на вопросы на основе собственных материалов, таких как мои заметки или книги. Я хочу, чтобы модель могла предоставлять ответы напрямую из этих источников.
Data Science
Вопрос или проблема Я хочу разделить свой временной ряд данных на обучающую и тестовую выборки. Данные имеют сезонный характер и очень шумные. Когда я случайным образом разделяю, тестовые и обучающие образцы не сходятся в своих распределениях.
Data Science
Вопрос или проблема Используя регрессор Light GBM, я обучил свои данные и, используя Grid Search, получил лучшие параметры, но при тестировании с этими параметрами я получаю разные результаты каждый раз, что означает, что модель выдает разные результаты
Data Science
Вопрос или проблема Если я использую XGBoost с GridSearchCV, как мне выбрать набор для оценки? Обратите внимание, что я имею в виду eval_set в параметрах модели. Моя текущая реализация использует GridSearchCV для оптимизации гиперпараметров, однако, если
Data Science
Вопрос или проблема Я новичок в Deep Learning. Мне не очень хорошо удается понимать и комментировать графики. Можете помочь мне с этими графиками Вопросы, которые я задаю себе, когда вижу графики обучения, следующие: Уменьшается ли потеря и увеличивается ли точность?
Data Science
Вопрос или проблема Я обучаю модель YOLOv7-tiny и у меня есть следующие наблюдения из сессии обучения: графики потерь объектности в обучающей и проверочной выборках разошлись довольно рано в процессе обучения потери по классам и рамкам, хотя и не совсем
Data Science
Вопрос или проблема Я веду дебаты с кем-то по поводу проблемы, где есть дубликаты по признакам (т.е. $ X_1 = X_2 $, но $ Y_1 != Y_2 $). С моей точки зрения, мы должны сохранить эти данные, так как они могут быть показательными и, следовательно, интересными
Data Science
Вопрос или проблема Представьте, что вы готовитесь к тонкой настройке модели Gemini. Пока вы планируете, вы начинаете задумываться о различных расходах, которые вам нужно будет учесть. Вы знаете, что ценообразование Gemini часто подчеркивает расходы
Data Science
Вопрос или проблема Как разделить на обучающую и тестовую выборки с помощью train_test_split значений с плавающей запятой? Я использовал LabelEncoder, но у меня около 300К строк, и когда я использовал cross_val, я увидел ValueError: наименьший класс в
Data Science
Вопрос или проблема Я определяю задачу классификации как задачу вычисления функции $h$, которая аппроксимирует функцию $f$, классифицирующую данные. Аппроксимация вычисляется на основе набора обучающих образцов и их классификаций по $f$ и обучения модели на этом наборе данных.
Data Science
Вопрос или проблема Я пытаюсь обучить свою дискриминаторную сеть, используя Keras с задним планом TensorFlow. Сеть предназначена для классификации входных данных на один из 9 выходных меток. Я передаю 2D вход (высота, ширина, без каналов) и вектор one-hot для вывода.