Data Science
Data Science
Вопрос или проблема У меня есть модель верификации говорящего, производительность которой я хочу измерить с помощью метрики EER. У меня есть X говорящих, и каждый говорящий имеет несколько файлов речи. Я вычисляю EER следующим образом: Я вычисляю косинусное
Data Science
Вопрос или проблема Я вычисляю PCA по некоторым данным, используя 10 компонент и используя 3 из 10 следующим образом: transformer = PCA(n_components=10) trained=transformer.fit(train) one=numpy.matmul(train,numpy.transpose(trained.
Data Science
Вопрос или проблема В двухслойных персептронах, которые скользят по словам текста, таких как word2vec и fastText, высоты скрытых слоев могут быть произведением двух случайных переменных, таких как позиционные эмбеддинги и эмбеддинги слов (Mikolov et al.
Data Science
Вопрос или проблема Я новичок здесь. Надеюсь, кто-то сможет помочь. Я независимый исследователь и столкнулся с проблемой анализа данных. Исследование здесь неуместно, но я дам необходимые детали касательно проблемы анализа данных.
Data Science
Вопрос или проблема Я пытаюсь предсказать вероятность с помощью нейронной сети, но у меня возникают проблемы с тем, чтобы понять, какая функция потерь лучше. Первой мыслью для меня была перекрестная энтропия, но в других ресурсах всегда говорится об этом
Data Science
Вопрос или проблема Каков лучший/правильный способ предоставления метаинформации автоэнкодеру или любой модели прогнозирования временных рядов. Пример Предположим, у меня есть данные о машине, и я хочу обнаружить аномалии в компонентах автомобиля.
Data Science
Вопрос или проблема Министерство здравоохранения Израиля публикует множество статистических данных о пациентах с Covid (число подтвержденных случаев, госпитализаций, людей на карантине – разделенные по возрасту и другим демографическим показателям)
Data Science
Вопрос или проблема В трансферном обучении часто лишь последний слой сети перенастраивается с использованием градиентного спуска. Однако последний слой обычной нейронной сети выполняет только линейное преобразование, так почему мы используем градиентный
Data Science
Вопрос или проблема Чтобы определить схожесть между изображениями (продуктами), я хочу использовать подход нейронной сети, подобный TiefVision. Эта предобученная нейронная сеть по сути переводит изображения в векторы признаков, а затем создает меру схожести
Data Science
Вопрос или проблема densenet = tf.keras.models.load_model("/content/densenet169_model.keras") vgg19 = tf.keras.models.load_model("/content/VGG19_model .keras") xception = tf.keras.models.load_model("/content/xception_model.keras") effnet = tf.
Data Science
Вопрос или проблема Я пытаюсь понять детали моделей логистической регрессии и сейчас мне интересно, как создать модель, если у вас есть коэффициенты и перехваты. Я создал модель логистической регрессии на Python и извлек коэффициенты и перехваты.
Data Science
Вопрос или проблема Мы используем пакет plyr в одном из наших курсов по манипуляциям с данными на R. У нас также есть материалы по пакету dplyr. Вы считаете, что пакет plyr устарел или избыточен? Нужно ли нам продолжать его преподавание?
Data Science
Вопрос или проблема Я создаю модель TensorFlow для выявления аномалий в данных смарт-метра электроэнергии и использую набор данных UK-DALE. Как я могу ввести аномалии в данные, чтобы протестировать модель? Аномалии обычно означают точки данных, которые
Data Science
Вопрос или проблема Мой набор данных состоит из бездействующей системы, которая в некоторые моменты времени получает запросы. Я пытаюсь предсказать эти моменты с помощью часов. Поскольку запросы распределены разряженно (я заставил их длиться некоторое
Data Science
Вопрос или проблема Я не могу понять, почему коэффициент корреляции так высок (r=0.9244), даже если в структуре разброса нет линейной зависимости. Я вычислил его с помощью MATLAB: r = corrcoef(x, y); Как я могу это интерпретировать?
Data Science
Вопрос или проблема На этом сайте я нашел реализацию на Python для выбора набора предикторов в обычной линейной регрессии, включающую Метод Лучшего Подмножества, Прямой Пошаговый Отбор и др. Это должно быть дополнением к книге An Introduction to Statistical
Data Science
Вопрос или проблема Я пытаюсь запустить некоторые скрипты PyTorch на удалённом сервере с GPU. При вызове скрипта в терминале Ubuntu я начинаю с: CUDA_VISIBLE_DEVICES=0(или тот, который доступен) python3 <script.py>. Также я использовал следующий
Data Science
Вопрос или проблема Вики дает это определение KNN В распознавании образов алгоритм k-ближайших соседей (k-NN) является непараметрическим методом, используемым для классификации и регрессии. В обоих случаях входные данные состоят из k ближайших обучающих
Data Science
Вопрос или проблема У меня есть вопрос о том, как настроить набор данных для моделирования. Допустим, у меня есть набор данных, представляющий, какую машину человек купит в зависимости от некоторых характеристик: Зависимые переменные – это отдельные автомобили
Data Science
Вопрос или проблема У меня есть две базы данных с около 60,000 примеров каждая. Обе имеют одинаковые характеристики (одинаковые названия столбцов), которые представляют собой определенные вещи с текстом или категориями (превращенными в числа).