Data Science
Предобработка для дообученной модели CNN на основе предобученных моделей
00
Вопрос или проблема Необходимо ли предварительно обрабатывать изображения так же, как это было сделано во время обучения предобученных моделей в нашей дообученной модели для использования её в другой задаче классификации? Допустим, у меня есть предобученная
Data Science
Разделите набор данных на обучающую/валидационную/тестовую выборки для обнаружения объектов.
00
Вопрос или проблема У меня есть набор данных для обнаружения объектов с метками в формате YOLO, каждая картинка может содержать вхождения разных классов и множественные вхождения одного и того же класса. Как можно разделить набор данных на обучающую
Data Science
Как предсказать значение преимущества в глубоком обучении с подкреплением
00
Вопрос или проблема В данный момент я работаю над коллекцией алгоритмов обучения с подкреплением: https://github.com/lhk/rl_gym Для глубокого Q-обучения необходимо вычислить Q-значения, которые должны предсказываться вашей сетью.
Data Science
Как объединить наборы данных для мультимодальной биометрической системы
00
Вопрос или проблема Есть совершенно разные наборы данных различных людей для распознавания лиц и динамики нажатия клавиш, которые мне нужно использовать. Идея заключается в том, что поскольку эти наборы данных содержат разных пользователей и потенциально
Data Science
Что мы можем узнать, визуализируя карты признаков
00
Вопрос или проблема У меня есть следующая классификационная модель (собаки против кошек): def GetModel(): oModel = nn.Sequential( nn.Identity(), #-- ничего не делает nn.Conv2d(3, 16, 3, bias=False, stride=2), nn.BatchNorm2d(16), nn.
Data Science
Снижение размерности для корреляции большого количества переменных
00
Вопрос или проблема Итак, у меня есть набор данных с примерно 750 переменными (столбцами) и 50 000 строк записей. Я хотел бы уменьшить размерность набора данных до 25-50-100 размерностей и затем вычислить матрицу корреляции между этими размерностями.
Data Science
Поиск наблюдений, которые наиболее схожи в некоторых аспектах, но наиболее различаются в других.
00
Вопрос или проблема У меня есть набор данных из примерно 75 административных регионов. Среди множества других переменных есть четыре специфические демографические переменные и число, представляющее финансирование на душу населения от государственного гранта.
Data Science
Создайте инструмент для ручной классификации изображений учебных данных.
00
Вопрос или проблема У меня есть большое количество изображений, которые мне нужно классифицировать для обучения алгоритма кластеризации, и я хотел бы сделать это офлайн (данные являются собственностью). По сути, я хотел бы создать настольный инструмент
Data Science
Автоматическая генерация треклиста для микса на YouTube.
00
Вопрос или проблема Я работаю над личным проектом, в котором хочу автоматически генерировать временные метки для треклистов музыкальных миксов на YouTube. Для получения названий треков я использую этот API Shazam https://rapidapi.
Data Science
Извлечение иерархических признаков в моделях многослойного перцептрона
00
Вопрос или проблема Я говорю о простых нейронных сетях, МЛП. Я прочитал статью Глорот и Бенгио (2010), Понимание сложности обучения глубоких прямых нейронных сетей. В ней я прочитал интересное утверждение: «Методы глубокого обучения стремятся к обучению
Data Science
Обнаружение аномалий/выбросов в реальном времени?
00
Вопрос или проблема Мои данные – это статистика использования/игры для игроков конкретной игры. Одна точка данных для пользователя – это агрегированная статистика за одну неделю. Цель заключается в следующем: обнаружить, когда аккаунт игрока
Data Science
Как эффективно запускать крупную языковую модель с контекстным окном более 60 000 токенов на нескольких графических процессорах?
00
Вопрос или проблема Я работаю с большой языковой моделью (LLM), которая требует большого контекстного окна в 60 000–70 000 токенов для моего приложения. Моя конфигурация включает пять графических процессоров (GPU): три с 16 ГБ и два с 8 ГБ.
Data Science
Умное вычисление возврата инвестиций в рекламу
00
Вопрос или проблема Ищу способ прогнозировать возврат на рекламные расходы (ROAS). Не обязательно, чтобы это была сложная модель (на самом деле, было бы гораздо лучше, если бы это не было так!). У нас есть все данные, поступающие через наш SQL-пipeline
Data Science
Перетасовка обучающих данных вызывает утечку информации в модели временных рядов с последовательностями изображений?
00
Вопрос или проблема Я работаю над предсказательной моделью производства солнечной энергии на основе последовательностей изображений, захваченных с интервалом в 10 минут. Один пример, который моя модель получает на вход, состоит из последовательности изображений.
Data Science
Как найти возможные подлежащие для данного глагола в области повседневных объектов
00
Вопрос или проблема Я ищу инструменты (возможно, в NLTK) или статьи, которые говорят о следующем: например. Ввод: Vase(Subject1) put(verb) Ответ, который я ищу: flower, water Существует ли инструмент, который может выдать субъекты (объекты), которые могут
Data Science
Когда регрессионные модели превосходят наивный метод?
00
Вопрос или проблема Период действия вознаграждения истекает через 7 дней. Ответы на этот вопрос имеют право на +150 репутационного вознаграждения. С. М. ищет канонический ответ. Случай 1: У меня есть следующая задача: Обучение на протяжении 3 последовательных
Data Science
Прогнозирование ценовых движений криптовалют с использованием анализа настроений и прогнозирования временных рядов
00
Вопрос или проблема Прогнозирование движений цен криптовалют с использованием анализа настроений и методов прогнозирования временных рядов Вы – data scientist, работающий в финансовой компании, заинтересованной в разработке системы для прогнозирования
Data Science
Как делать предсказания для нескольких входных образцов одновременно в tf 2 с keras
00
Вопрос или проблема Я довольно запутался в выводе model.predict Когда после обучения я валидирую свою модель на примерно 6000 выборках, я использую следующий псевдокод: model.fit(...) predictions = model.predict(val_set) len(predictions) # == len(val_set)
Data Science
Как выполнять обнаружение аномалий в GPS-данных на Python
00
Вопрос или проблема У меня есть набор данных в формате GPS: широта, долгота. Я хочу обнаружить аномалии с помощью Python. Я тестировал knn, smv, cof, iforest используя pycaret. Но у меня не получилось. Эти цвета аномальны, потому что угол изменения слишком
Data Science
Я получаю эту ошибку ValueError: недостаточно значений для распаковки (ожидалось 4, получено 2)
00
Вопрос или проблема Я написал этот код: tf = TfidfVectorizer() text_tf = tf.fit_transform(df_clean) text_tf from sklearn.model_selection import train_test_split x_train, x_test, y_train, y_test = train_test_split(text_tf,test_size=0.