Data Science
Data Science
Вопрос или проблема Я наткнулся на крайне многомерный минимум, который не могу воспроизвести, сколько бы моделей я ни обучал. Проблема в том, что я прошел несколько эпох слишком далеко и переобучился на обучающих данных. Мои критерии ранней остановки
Data Science
Вопрос или проблема Мое описание: Кластер 2 состоит из 9511 экземпляров, средний возраст составляет около 42 лет (колеблется от 29.7207 до 54.5257). Учитывая возраст, Кластер 2 хорошо отделен от Кластера 1, с расстоянием 18.9513.
Data Science
Вопрос или проблема Я пытаюсь предсказать значение y. Меня в основном интересует, когда его пики будут и как будет выглядеть общая кривая за день. Менее важно, чтобы фактически предсказанные значения были точными. Чуть преувеличивая: мне все равно, если
Data Science
Вопрос или проблема Допустим, у меня есть 3 плотные последовательности одинаковой длины. Должен ли я подгонять масштабировщик по ним отдельно или вместе? import numpy as np from sklearn.preprocessing import StandardScaler arr = np.
Data Science
Вопрос или проблема Я работаю над проектом в области машинного обучения, где мы хотим визуализировать движения в высокоразмерном, но разреженном векторном пространстве (например, вектор 1×75, где большинство элементов закодированы в формате one-hot или по модулю 3).
Data Science
Вопрос или проблема Насколько я понимаю, целевая функция — это то, что я пытаюсь оптимизировать, а оценочная статистика — это то, что я использую для поиска переобучения. Я наткнулся на 4 функции потерь, которые, кажется, одинаковы, но я не совсем уверен.
Data Science
Вопрос или проблема У меня есть доступ к данным по медицинским выплатам от крупной страховой компании. Как некоторые из вас уже знают, существует большая разница в цене на препарат X в зависимости от места его применения. Наша компания хочет помочь участникам
Data Science
Вопрос или проблема У меня есть интересная проблема, не знаю даже, с чего начать. Я работаю над бинарным классификатором, который будет принимать химическое название, закодированное в виде строки, и прогнозировать, является ли оно ‘
Data Science
Вопрос или проблема Если вы обучаете базовую FFNN (Сеть с прямой связью), вы можете применять регуляризации, такие как дроп-аут, l1, l2 и гауссовский шум, чтобы модель была устойчивой и показывала лучшие результаты на новых данных.
Data Science
Вопрос или проблема В статье о рекомендациях на Youtube автор говорит, что генерация кандидатов является задачей многоклассовой классификации. Я пытаюсь понять, что здесь является классами: категория видео или само видео? Если это категория видео, как
Data Science
Вопрос или проблема Я пишу тестовый пользовательский слой, который реализует алгоритм простого экспоненциального сглаживания. Проблема: когда я его обучаю, коэффициент альфа (сглаживание) всегда сходится к значению 1. Это означает, что прогноз на один
Data Science
Вопрос или проблема Я пишу академическую работу по применению методов машинного обучения к прогнозированию временных рядов, и не уверен, как описать теоретическую часть о регуляризованной целевой функции для XGBoost. Ниже вы можете найти уравнение, представленное
Data Science
Вопрос или проблема Я пытаюсь стратифицировать группу пациентов по возможным молекулярным подтипам рака. Я понимаю, что у всех этих пациентов есть рак, но целью является (вне зависимости от обучения) кластеризовать их на 4 возможных подтипа.
Data Science
Вопрос или проблема Как говорит заголовок: Мне поставили задачу предсказать центры затрат для данных о грузоперевозках. Я совершенно не представляю, как это сделать. Уникальное количество центров затрат превышает 5000, а количество признаков составляет около 100.
Data Science
Вопрос или проблема Я использую подход с transfer learning. Для этого я следовал уроку tensorflow для поэтов. Я использую заранее обученную архитектуру InceptionV3, натренированную на наборе данных Imagenet. Последний слой и классификация softmax были
Data Science
Вопрос или проблема Мы онлайн-школа, у нас новые группы начинаются в первый день каждого месяца. В течение ~45 дней, предшествующих первому дню, мы получаем отчет каждые 3-4 дня, который сообщает нам о количестве потенциальных клиентов, которые мы получили для предстоящей группы.
Data Science
Вопрос или проблема У меня есть набор данных, который содержит около 87000 изображений в директории, причем каждый класс находится в отдельной подпапке. Я попробовал класс ImageDataGenerator() и функцию flow_from_directory() для генерации изображений
Data Science
Вопрос или проблема Я пишу отчет по анализу данных и хочу найти распределение, которое подойдёт для моей выборки. Я получил хороший результат , но когда я использовал тест Колмогорова-Смирнова (KS-test) для проверки модели, я получил низкое значение p, 1.
Data Science
Вопрос или проблема У меня есть набор данных с такими характеристиками, как количество просмотров продукта (в сотнях тысяч), количество кликов по продуктам (в тысячах), коэффициент конверсии (в десятичном формате, например, 7,6%) и продажи (в сотнях).
Data Science
Вопрос или проблема Мне интересно, существуют ли веб-сайты, с помощью которых можно постоянно быть в курсе последних тенденций или тем, связанных с разрушительными приложениями в области искусственного интеллекта. Обычно я читаю научные публикации, посвященные