Data Science
Data Science
Вопрос или проблема Я хочу написать метод для тестирования нескольких гипотез для пары школ (скажем, TAMU и UT Austin). Я хочу рассмотреть все возможные пары слов (Исследование, Тезис, Предложение, ИИ, Аналитика) и протестировать гипотезу о том, что количество
Data Science
Вопрос или проблема Предположим, я развернул модель, вручную пометив истинные метки с моими обучающими данными, поскольку в данном случае нет способа получить истинные метки без участия человека. После развертывания модели, если я хотел бы оценить, как
Data Science
Вопрос или проблема Я занимаюсь проектом по обнаружению выбросов, и одним из методов для понимания моего набора данных я использую ящики с усами, чтобы визуализировать, как данные расположены относительно всех данных для этой конкретной характеристики.
Data Science
Вопрос или проблема Хорошо. Что не так с вашим кодом! Я пытаюсь вычислить вероятности перехода для каждого этапа. Код работает для небольшого массива, но для реального набора данных у меня возникла ошибка памяти. У меня версия Python на 64 ГБ, и я максимизировал
Data Science
Вопрос или проблема Я создаю свою кастомную среду Gym, и до сих пор всё работало хорошо, следуя инструкциям, распространённым по интернету. Однако сейчас я нахожусь на этапе, когда часто происходят изменения в классе среды (наследуя gym.
Data Science
Вопрос или проблема Я совершенно нов в Pytorch (и в машинном обучении в целом), поэтому мне трудно понять, что происходит в отношении настраиваемой функции потерь, которую я рассматриваю. Я понимаю, что происходит в функции, но мне нужно понять, как рассчитывается
Data Science
Вопрос или проблема В настоящее время я работаю над проектом предсказательной модели с использованием пакета gbm в R и столкнулся с проблемой пропущенных значений в одной из моих предикторных переменных. Я был бы признателен за ваши советы и рекомендации
Data Science
Вопрос или проблема Я студент по специальности анализ данных, и когда я учился выводить функцию потерь логистической регрессии (потери кросс-энтропии), я обнаружил, что градиент совершенно идентичен градиенту методом наименьших квадратов для линейной
Data Science
Вопрос или проблема как я могу построить график своих результатов из csv файла gridsearch? clf = GridSearchCV(pipeline, parameters, cv=3, return_train_score=True) clf.fit(x, y) df = pd.DataFrame(clf.cv_results_) я пытаюсь получить график, похожий на тот
Data Science
Res2Net50 с AM-Softmax для проверки говорящего: Почему average_accuracy возвращает только 0 или 100?
Вопрос или проблема Я создаю модель Res2Net50 для задачи верификации говорящего. Я использую AM-Softmax в качестве функции потерь с следующими параметрами: Маржа: 0.2 Масштаб: 10 После обучения модели в течение 5 эпох на наборе данных с 1000 точками данных
Data Science
Вопрос или проблема Я пытался написать генератор для модели DistillBertFast ## Генератор def _generator(text=train_texts, label=Y_oh_train, batch_size=1): # label = tf.ragged.constant(label) while True: for i in range(0,len(text),batch_size): yield dict(tokenizer(text[i:i+batch_size]
Data Science
Вопрос или проблема Существуют несколько моделей для задачи верификации спикеров (wavlm-ecapa / xvector / …). Некоторые из этих моделей были обучены с использованием AAM Softmax loss, который принимает количество меток на вход.
Data Science
Вопрос или проблема Я новичок, и у меня есть вопрос. Можно ли использовать результаты кластеризации на основе вероятности для обучающего обучения? Данные производства содержат 80000 строк. Они не размечены, но есть информация о том, что уровень дефектов составляет 7,2%.
Data Science
Вопрос или проблема Мои данные имеют мультиклассовый, многометочный тип, и я планирую иметь в общей сложности 100 выходных классов. Мои входные данные X для модели представляют собой аудиоданные, а y – это одномерный numpy массив с одной горячей
Data Science
Вопрос или проблема Я разрабатываю инструмент, который должен извлекать интересующие значения из неструктурированных текстовых записей. Набор данных состоит из несколько сотен тысяч медицинских записей. Каждая запись относительно короткая (около 100 символов).
Data Science
Вопрос или проблема Я впервые работаю с датами. Сначала я знал, что мне нужно преобразовать их в временные метки, что дало мне значения в формате “datetime64”. Но потом я узнал, что линейная регрессия из sklearn не принимает datetime как тип данных для регрессии.
Data Science
Вопрос или проблема Я рассчитываю волатильность (стандартное отклонение) доходности портфеля активов, используя подход с дисперсией и ковариацией. Коэффициенты корреляции и волатильности активов были оценены на основе исторической доходности.
Data Science
Вопрос или проблема Как я могу изменить пороговое значение для каждого классификатора? В ROC-анализе мы можем убрать галочку с “умолчательного порога”. Я не думаю, что вы можете сделать это для классификаторов или любых других виджетов (например, матрицы смешения).
Data Science
Вопрос или проблема Какой лучший способ предсказать классы для моделей, разработанных с использованием функционального API в Keras? Ответ или решение Что является наилучшим способом прогнозирования классов для моделей, разработанных с использованием функционального API в Keras?
Data Science
Вопрос или проблема Оценка местоположения в модели. Ответ или решение Оценка местоположения в модели: ключевые аспекты и методики Введение Оценка местоположения в различных моделях представляет собой важную задачу в информационных технологиях, особенно