Data Science
Советы по улучшению многозадачного обучения на основе множественных выходов
00
Вопрос или проблема В настоящее время я пытаюсь использовать многозадачное обучение на основе модели с несколькими выходами, которая позволяет получать результаты как для классификации, так и для регрессии. Однако на данный момент точность составляет около 20%.
Data Science
Как сравнить производительность моделей SVM и Keras
00
Вопрос или проблема Я применил как SVM, так и CNN (используя Keras) на одном наборе данных. Теперь я хочу сравнить производительность обеих моделей. Функция Keras model.evaluate предсказывает выходные данные для данного ввода, а затем вычисляет заданную в model.
Data Science
Какой лучший\правильный метод разделения данных во времени для сравнения производительности предсказания будущих данных между регрессорами ML и DL?
00
Вопрос или проблема Предположим, у меня есть набор данных, который содержит временную метку (нестандартная колонка временной метки без формата даты и времени) в качестве одного признака и count в качестве метки/цели для предсказания в следующем формате
Data Science
Библиотека Python Trend многомерные временные ряды
00
Вопрос или проблема Наш csv содержит 36 колонок 1 колонка времени, собранная каждые 30 минут 3 переменные (количество, задержка, общее время) x 10 признаков (вход-выход пользователя, серверный вход-выход, параллелизм и т.д.) различных точек данных с сервера: пример –
Data Science
Как обучать NER LSTM на уровне отдельного предложения
00
Вопрос или проблема Мои документы представляют собой всего лишь одно предложение, содержащее одну аннотацию. Предложения с одинаковой именованной сущностью, конечно, похожи, но не по контексту. Примеры обучения NER (насколько мне известно) всегда имеют
Data Science
Теория функции оценки изолированного леса
00
Вопрос или проблема В настоящее время я читаю эту статью о изоляционных лесах. В разделе о функции счета они упоминают следующее. Для справки, $h(x)$ определяется как длина пути точки данных, проходящей через iTree, а $n$ — это размер выборки, используемый для роста iTree.
Data Science
Правильный способ сравнения результатов бинарных классификаторов с различной чувствительностью
00
Вопрос или проблема Я сравниваю 5 сторонних классификационных моделей на подмножестве результатов (в частности, ложно положительных, которые я исследую, чтобы найти общую причину). Все пять моделей выдают значения от 0 до 1, но, похоже, имеют разную общую чувствительность.
Data Science
Как применить другую функцию потерь к одной конкретной метке?
00
Вопрос или проблема Я создал рекуррентную нейронную сеть в Keras, которая классифицирует по 14 меткам. Первая метка является самой важной и должна предсказываться с наибольшей точностью. Остальные метки не обязательно должны быть очень точными, они должны
Data Science
Журналы для публикации доказательства математического результата, используемого для алгоритмов нейронных сетей
00
Вопрос или проблема Я хотел бы знать, какой журнал является подходящей площадкой для результатов, описанных ниже. Недавно я наткнулся на конкретный алгоритм обучения нейронных сетей. Алгоритм основан на результате из матричного анализа.
Data Science
Какой шаблон проектирования лучше для потоков данных: партиями или по одному?
00
Вопрос или проблема Я пришёл из области программной инженерии и хорошо знаком с лучшими паттернами проектирования в этой сфере, но в области науки о данных я чувствую, что совершаю элементарные ошибки в проектировании паттернов.
Data Science
Обучение вариационного автокодировщика (VAE) для генерации случайных чисел
00
Вопрос или проблема У меня есть сложное 20-мерное многомодальное распределение, и я рассматриваю обучение VAE для приближения его с помощью 2000 образцов. Однако, в частности, с целью впоследствии генерировать псевдослучайные числа, соответствующие структуре распределения.
Data Science
сравнение данных первого квартала за два года
00
Вопрос или проблема Как я могу сравнить данные за два квартала? Какое программное обеспечение я могу использовать, чтобы сделать это параллельно, сравнивая их бок о бок? Какие факторы я могу учесть, я прикрепляю пример изображения набора данных Я не уверен
Data Science
Распределение меток анализаSentiment
00
Вопрос или проблема Я работаю над моделью Анализа настроений. Набор данных, который у меня есть, имеет три метки: положительная, отрицательная и нейтральная. Но проблема в том, что данные не равномерны для меток. Например, из 100K: 75K нейтральные, 15K
Data Science
Порог дисперсии с проблемой на Python
00
Вопрос или проблема Я начинающий в scikit-learn, и у меня небольшая проблема при использовании модуля отбора признаков VarianceThreshold. Проблема в том, что когда я устанавливаю дисперсию Var[X]=.8*(1-.8) предполагается, что будут удалены все признаки
Data Science
Применение разниц кадров во времени в компьютерном зрении
00
Вопрос или проблема Учитывая входное изображение в градациях серого с течением времени, где интенсивность пикселей нормализована от 0 до 1, пусть $c$ — текущий кадр, а $p$ — предыдущие кадры. Пусть $diff$ определяется следующим образом: $ diff_0 = |c-p|=|p-c|
Data Science
Как установить точку останова внутри пользовательской функции метрики в Keras
00
Вопрос или проблема Я пытаюсь написать свои собственные функции метрик в Keras и хотел начать с тестовой функции, поэтому я реализовал функцию f1_score, используя sklearn. Далее мне нужно будет настроить расчет метрик в соответствии с моими оценочными
Data Science
Имеет ли смысл использовать важности признаков, основанные на индексе Джини, для других классификаторов?
00
Вопрос или проблема Мне хотелось бы узнать, имеет ли смысл запускать yellowbrick.features.FeatureImportances с моделью RandomForestClassifier, чтобы найти наиболее влиятельные признаки, а затем подгонять другую модель (например, MLPClassifier) с этими признаками.
Data Science
Что происходит с операторами (matmul и т.д.), когда модель квантизируется?
00
Вопрос или проблема Квантование параметров модели касается того, как снизить точность весов модели, таких как в Квантовании или Введении в квантование, приготовленном в 🤗 с 💗🧑‍🍳. Но что насчет операторных функций, таких как Matmul или Softmax или Cross Entropy Loss?
Data Science
Что может не работать в PyTorch при использовании квантованных моделей?
00
Вопрос или проблема Я полагаю, что не все инструменты и модули PyTorch работают с квантизированными (например, до int8) моделями. Но что может не работать и почему? Поддержка устройств и операторов Поддержка квантизации ограничена подмножеством доступных
Data Science
Можем ли мы добавить дополнительные слои поверх квантизированной модели для дообучения?
00
Вопрос или проблема Можно ли использовать квантизированную модель (например, int8) и добавлять слои (например, PyTorch Linear) для тонкой настройки в PyTorch? Если да, то как преобразовать выходные векторы квантизированной модели, чтобы подать их на добавленные слои?