Data Science

00

Вопрос или проблема Я хочу написать метод для тестирования нескольких гипотез для пары школ (скажем, TAMU и UT Austin). Я хочу рассмотреть все возможные пары слов (Исследование, Тезис, Предложение, ИИ, Аналитика) и протестировать гипотезу о том, что количество

Data Science

Как проводится оценка модели и повторное обучение после развертывания без меток истинного значения?

00

Вопрос или проблема Предположим, я развернул модель, вручную пометив истинные метки с моими обучающими данными, поскольку в данном случае нет способа получить истинные метки без участия человека. После развертывания модели, если я хотел бы оценить, как

Data Science

Почему seaborn строит мои ящичные диаграммы так?

00

Вопрос или проблема Я занимаюсь проектом по обнаружению выбросов, и одним из методов для понимания моего набора данных я использую ящики с усами, чтобы визуализировать, как данные расположены относительно всех данных для этой конкретной характеристики.

Data Science

ошибка памяти – матрица переходов Марковского процесса N-го порядка из данной последовательности

00

Вопрос или проблема Хорошо. Что не так с вашим кодом! Я пытаюсь вычислить вероятности перехода для каждого этапа. Код работает для небольшого массива, но для реального набора данных у меня возникла ошибка памяти. У меня версия Python на 64 ГБ, и я максимизировал

Data Science

OpenAI Gym: gym.make() не ссылается на обновленный код Env

00

Вопрос или проблема Я создаю свою кастомную среду Gym, и до сих пор всё работало хорошо, следуя инструкциям, распространённым по интернету. Однако сейчас я нахожусь на этапе, когда часто происходят изменения в классе среды (наследуя gym.

Data Science

Градиентный вывод через пользовательскую функцию потерь

00

Вопрос или проблема Я совершенно нов в Pytorch (и в машинном обучении в целом), поэтому мне трудно понять, что происходит в отношении настраиваемой функции потерь, которую я рассматриваю. Я понимаю, что происходит в функции, но мне нужно понять, как рассчитывается

Data Science

Обработка пропущенных значений в предикторах для моделей градиентного бустинга (gbm()) в R

00

Вопрос или проблема В настоящее время я работаю над проектом предсказательной модели с использованием пакета gbm в R и столкнулся с проблемой пропущенных значений в одной из моих предикторных переменных. Я был бы признателен за ваши советы и рекомендации

Data Science

Почему потери MSE и кросс-энтропии имеют одинаковый градиент?

00

Вопрос или проблема Я студент по специальности анализ данных, и когда я учился выводить функцию потерь логистической регрессии (потери кросс-энтропии), я обнаружил, что градиент совершенно идентичен градиенту методом наименьших квадратов для линейной

Data Science

построить график результатов gridsearch из файла csv как?

00

Вопрос или проблема как я могу построить график своих результатов из csv файла gridsearch? clf = GridSearchCV(pipeline, parameters, cv=3, return_train_score=True) clf.fit(x, y) df = pd.DataFrame(clf.cv_results_) я пытаюсь получить график, похожий на тот

Data Science

Res2Net50 с AM-Softmax для проверки говорящего: Почему average_accuracy возвращает только 0 или 100?

00

Вопрос или проблема Я создаю модель Res2Net50 для задачи верификации говорящего. Я использую AM-Softmax в качестве функции потерь с следующими параметрами: Маржа: 0.2 Масштаб: 10 После обучения модели в течение 5 эпох на наборе данных с 1000 точками данных

Data Science

Как написать генератор для дообучения моделей на основе трансформеров (Tensorflow)

00

Вопрос или проблема Я пытался написать генератор для модели DistillBertFast ## Генератор def _generator(text=train_texts, label=Y_oh_train, batch_size=1): # label = tf.ragged.constant(label) while True: for i in range(0,len(text),batch_size): yield dict(tokenizer(text[i:i+batch_size]

Data Science

Как разделить данные для верификации говорящего с использованием AAM Softmax потерь?

00

Вопрос или проблема Существуют несколько моделей для задачи верификации спикеров (wavlm-ecapa / xvector / …). Некоторые из этих моделей были обучены с использованием AAM Softmax loss, который принимает количество меток на вход.

Data Science

Можно ли использовать результаты кластеризации на основе вероятности для обучения с учителем?

00

Вопрос или проблема Я новичок, и у меня есть вопрос. Можно ли использовать результаты кластеризации на основе вероятности для обучающего обучения? Данные производства содержат 80000 строк. Они не размечены, но есть информация о том, что уровень дефектов составляет 7,2%.

Data Science

Прогнозы для классов, на которых DNN еще не был обучен, – возможно ли это?

00

Вопрос или проблема Мои данные имеют мультиклассовый, многометочный тип, и я планирую иметь в общей сложности 100 выходных классов. Мои входные данные X для модели представляют собой аудиоданные, а y – это одномерный numpy массив с одной горячей

Data Science

Как извлекать значения из неструктурированного текста

00

Вопрос или проблема Я разрабатываю инструмент, который должен извлекать интересующие значения из неструктурированных текстовых записей. Набор данных состоит из несколько сотен тысяч медицинских записей. Каждая запись относительно короткая (около 100 символов).

Data Science

Почему мы не можем подать datetime на линейную регрессию и чем toordinal() отличается от любого другого типа данных целого числа?

00

Вопрос или проблема Я впервые работаю с датами. Сначала я знал, что мне нужно преобразовать их в временные метки, что дало мне значения в формате “datetime64”. Но потом я узнал, что линейная регрессия из sklearn не принимает datetime как тип данных для регрессии.

Data Science

Питон: рассчитать взвешенный средний коэффициент корреляции

00

Вопрос или проблема Я рассчитываю волатильность (стандартное отклонение) доходности портфеля активов, используя подход с дисперсией и ковариацией. Коэффициенты корреляции и волатильности активов были оценены на основе исторической доходности.

Data Science

Как изменить пороговое значение в оранжевом цвете?

00

Вопрос или проблема Как я могу изменить пороговое значение для каждого классификатора? В ROC-анализе мы можем убрать галочку с “умолчательного порога”. Я не думаю, что вы можете сделать это для классификаторов или любых других виджетов (например, матрицы смешения).

Data Science

Какой лучший способ предсказать классы для моделей, разработанных с использованием функционального API в Keras?

00

Вопрос или проблема Какой лучший способ предсказать классы для моделей, разработанных с использованием функционального API в Keras? Ответ или решение Что является наилучшим способом прогнозирования классов для моделей, разработанных с использованием функционального API в Keras?

Data Science

Оценка местоположения в модели

00

Вопрос или проблема Оценка местоположения в модели. Ответ или решение Оценка местоположения в модели: ключевые аспекты и методики Введение Оценка местоположения в различных моделях представляет собой важную задачу в информационных технологиях, особенно