Data Science
Как правильно вычислить метрику EER (проверка говорящего)?
00
Вопрос или проблема У меня есть модель верификации говорящего, производительность которой я хочу измерить с помощью метрики EER. У меня есть X говорящих, и каждый говорящий имеет несколько файлов речи. Я вычисляю EER следующим образом: Я вычисляю косинусное
Data Science
Выход функции преобразования PCA из sklearn в Python не совпадает.
00
Вопрос или проблема Я вычисляю PCA по некоторым данным, используя 10 компонент и используя 3 из 10 следующим образом: transformer = PCA(n_components=10) trained=transformer.fit(train) one=numpy.matmul(train,numpy.transpose(trained.
Data Science
Инициализация весов, которые являются поэлементным произведением нескольких переменных.
00
Вопрос или проблема В двухслойных персептронах, которые скользят по словам текста, таких как word2vec и fastText, высоты скрытых слоев могут быть произведением двух случайных переменных, таких как позиционные эмбеддинги и эмбеддинги слов (Mikolov et al.
Data Science
возможно ли найти целые числа в большом наборе данных (например, 4096 бит), где набор данных содержит как целые числа, так и десятичные?
00
Вопрос или проблема Я новичок здесь. Надеюсь, кто-то сможет помочь. Я независимый исследователь и столкнулся с проблемой анализа данных. Исследование здесь неуместно, но я дам необходимые детали касательно проблемы анализа данных.
Data Science
Функция потерь для вероятностной регрессии
00
Вопрос или проблема Я пытаюсь предсказать вероятность с помощью нейронной сети, но у меня возникают проблемы с тем, чтобы понять, какая функция потерь лучше. Первой мыслью для меня была перекрестная энтропия, но в других ресурсах всегда говорится об этом
Data Science
автоэнкодер многомерных временных рядов метаданных
00
Вопрос или проблема Каков лучший/правильный способ предоставления метаинформации автоэнкодеру или любой модели прогнозирования временных рядов. Пример Предположим, у меня есть данные о машине, и я хочу обнаружить аномалии в компонентах автомобиля.
Data Science
Базы данных министерства здравоохранения Израиля о количестве пациентов с Covid имеют более низкий порог для опубликованных данных о пациентах. Как это защищает конфиденциальность?
00
Вопрос или проблема Министерство здравоохранения Израиля публикует множество статистических данных о пациентах с Covid (число подтвержденных случаев, госпитализаций, людей на карантине – разделенные по возрасту и другим демографическим показателям)
Data Science
Почему не использовать линейную регрессию для дообучения последнего слоя нейронной сети?
00
Вопрос или проблема В трансферном обучении часто лишь последний слой сети перенастраивается с использованием градиентного спуска. Однако последний слой обычной нейронной сети выполняет только линейное преобразование, так почему мы используем градиентный
Data Science
Сходство изображений: Сходство смешанного вектора
00
Вопрос или проблема Чтобы определить схожесть между изображениями (продуктами), я хочу использовать подход нейронной сети, подобный TiefVision. Эта предобученная нейронная сеть по сути переводит изображения в векторы признаков, а затем создает меру схожести
Data Science
Ошибка в стекинговом ансамбле в TensorFlow
00
Вопрос или проблема densenet = tf.keras.models.load_model("/content/densenet169_model.keras") vgg19 = tf.keras.models.load_model("/content/VGG19_model .keras") xception = tf.keras.models.load_model("/content/xception_model.keras") effnet = tf.
Data Science
Создание модели логистической регрессии с коэффициентами
00
Вопрос или проблема Я пытаюсь понять детали моделей логистической регрессии и сейчас мне интересно, как создать модель, если у вас есть коэффициенты и перехваты. Я создал модель логистической регрессии на Python и извлек коэффициенты и перехваты.
Data Science
Является ли пакет plyr устаревшим или избыточным (если мы используем dplyr)?
00
Вопрос или проблема Мы используем пакет plyr в одном из наших курсов по манипуляциям с данными на R. У нас также есть материалы по пакету dplyr. Вы считаете, что пакет plyr устарел или избыточен? Нужно ли нам продолжать его преподавание?
Data Science
Как можно генерировать аномалии в наборе данных?
00
Вопрос или проблема Я создаю модель TensorFlow для выявления аномалий в данных смарт-метра электроэнергии и использую набор данных UK-DALE. Как я могу ввести аномалии в данные, чтобы протестировать модель? Аномалии обычно означают точки данных, которые
Data Science
Как реализовать пользовательскую функцию потерь с Keras для разреженного набора данных
00
Вопрос или проблема Мой набор данных состоит из бездействующей системы, которая в некоторые моменты времени получает запросы. Я пытаюсь предсказать эти моменты с помощью часов. Поскольку запросы распределены разряженно (я заставил их длиться некоторое
Data Science
Почему существует высокая корреляция, даже если диаграмма рассеяния этого не показывает?
00
Вопрос или проблема Я не могу понять, почему коэффициент корреляции так высок (r=0.9244), даже если в структуре разброса нет линейной зависимости. Я вычислил его с помощью MATLAB: r = corrcoef(x, y); Как я могу это интерпретировать?
Data Science
Вопрос относительно реализации выбора подмножества OLS
00
Вопрос или проблема На этом сайте я нашел реализацию на Python для выбора набора предикторов в обычной линейной регрессии, включающую Метод Лучшего Подмножества, Прямой Пошаговый Отбор и др. Это должно быть дополнением к книге An Introduction to Statistical
Data Science
GPU показывает 0% использование, даже когда тензоры и модель загружены на GPU?
00
Вопрос или проблема Я пытаюсь запустить некоторые скрипты PyTorch на удалённом сервере с GPU. При вызове скрипта в терминале Ubuntu я начинаю с: CUDA_VISIBLE_DEVICES=0(или тот, который доступен) python3 <script.py>. Также я использовал следующий
Data Science
Что означает большое O в оптимальных весах KNN?
00
Вопрос или проблема Вики дает это определение KNN В распознавании образов алгоритм k-ближайших соседей (k-NN) является непараметрическим методом, используемым для классификации и регрессии. В обоих случаях входные данные состоят из k ближайших обучающих
Data Science
Функции кодирования для многоклассовой классификации
00
Вопрос или проблема У меня есть вопрос о том, как настроить набор данных для моделирования. Допустим, у меня есть набор данных, представляющий, какую машину человек купит в зависимости от некоторых характеристик: Зависимые переменные – это отдельные автомобили
Data Science
Как обучить модель для предсказания, относятся ли 2 образца к одному и тому же?
00
Вопрос или проблема У меня есть две базы данных с около 60,000 примеров каждая. Обе имеют одинаковые характеристики (одинаковые названия столбцов), которые представляют собой определенные вещи с текстом или категориями (превращенными в числа).