Data Science
HuggingFace Transformers выдает потерю: nan – точность: 0.0000e+00
00
Вопрос или проблема Я новичок на HuggingFace и подгоняю модель BERT (distilbert-base-cased) с использованием библиотеки Transformers, но значение функции потерь не снижается, вместо этого я получаю loss: nan - accuracy: 0.0000e+00.
Data Science
Сомнения в градиенте, проблема исчезающего градиента в обратном распространении ошибок.
00
Вопрос или проблема Насколько мне известно, в обратном распространении ошибка или градиент используются для обновления весов. В обратном распространении веса становятся небольшими относительно градиентов, что приводит к проблеме исчезающих градиентов.
Data Science
Реализация вычитания фона с помощью Mask R-CNN
00
Вопрос или проблема В настоящее время я пытаюсь реализовать статью по обнаружению падений (https://ieeexplore.ieee.org/abstract/document/9186597). Для этого требуется алгоритм вычитания фона, называемый Mask R-CNN. Существуют ли текущие реализации этого
Data Science
Определите, как каждый элемент в векторе влияет на косинусное сходство при сравнении с другим вектором.
00
Вопрос или проблема У меня есть вектор, который представляет мой объект и выполняет задачу вычисления, какой объект похож на другой объект, используя косинусное сходство. Чтобы создать этот вектор, я объединил множество характеристик, которые могут представлять уникальный объект.
Data Science
Какие методы использовать для создания единой классификации контента из несоответствующей входящей информации?
00
Вопрос или проблема Я пытаюсь агрегировать информацию о профессиональных профилях из нескольких источников, устанавливая согласованную таксономию. В настоящее время главная проблема заключается в том, как установить предпочтительную таксономию для профилей
Data Science
Несинхронизированная визуализация временных рядов
00
Вопрос или проблема Я хотел бы визуализировать большое количество событий, состоящих из временных окон. Типичное событие будет выглядеть так: Проблема в том, что мои события не синхронизированы, и если я отложу их все, это будет выглядеть так: Вопрос
Data Science
Классификация текстов с очень короткими строками
00
Вопрос или проблема У меня есть набор данных с короткими названиями профессий (например, «менеджер по маркетингу», «системный администратор» и т. д.) и соответствующими кодами профессий по переписи (например, 1006 Аналитики компьютерных систем).
Data Science
Классификация отсканированных документов в pdf-файлах с использованием глубокого обучения или NLP
00
Вопрос или проблема Я умею классифицировать изображения с помощью CNN, но у меня есть проблема: у меня есть несколько типов отсканированных документов в PDF-файле на разных страницах. Некоторые типы отсканированных документов присутствуют на нескольких страницах внутри PDF.
Data Science
Существует ли способ сделать окно в df.rolling динамическим в зависимости от строки, для которой выполняется расчет?
00
Вопрос или проблема У меня есть набор данных о ценах акций, и я хочу добавить столбец с минимальными значениями за 52 недели для каждого дня. Однако для строк, в которых нет 365 дней выше, я просто хочу, чтобы в этом столбце было скользящее минимальное
Data Science
Визуализация с множеством линий, цветов и маркеров
00
Вопрос или проблема У меня есть множество графиков, подобно приведенному ниже. Данные получены из измерений, проведенных в разные моменты времени и в разные дни. На графике (который является кумулятивной функцией распределения, если это имеет значение)
Data Science
Стандартная нормализация после логарифмического преобразования
00
Вопрос или проблема У меня есть быстрый вопрос о том, нужно ли стандартизировать признаки после логарифмического преобразования. У меня есть один признак, который сильно скошен и требует логарифмического преобразования, для остальных признаков я применяю
Data Science
Изучение словаря для классификации изображений
00
Вопрос или проблема Мне интересно, сможет ли сработать подход, о котором я думаю. Я хочу использовать обучение словарю для классификации изображений. Первый шаг — это изучить словарь на наборе схожих, но разных изображений, чтобы иметь возможность извлекать фон из изображения.
Data Science
Как применить конвейер преобразования данных к неизвестным данным в задаче классификации временных рядов?
00
Вопрос или проблема Я работаю над задачей классификации человеческой активности на основе данных о позах. Из-за качества изображений при применении модели оценивания поз, в данных есть множество пропущенных значений. Мой конвейер преобразования данных
Data Science
Простая линейная регрессия и множественная линейная регрессия
00
Вопрос или проблема Я изучал простую линейную регрессию и многократную линейную регрессию. Я задумался над вопросом: получим ли мы одинаковые коэффициенты признаков, если проведем многократную линейную регрессию и Ответ или решение Вопрос о том, получаем
Data Science
Лучший подход к A/B тестированию двух разных систем рекомендаций
00
Вопрос или проблема У меня есть две рекомендательные системы для музыкальных предпочтений, которые составляют список рекомендаций для конкретного пользователя на основе песен, которые он сохранил в своей библиотеке. Затем пользователь оценивает, насколько
Data Science
Как ReLU вводит нелинейность и почему это не альтернатива dropout?
00
Вопрос или проблема Производная функции ReLU равна 1, когда входное значение больше 0, и 0, когда входное значение меньше или равно 0. В процессе обратного распространения она абсолютно не изменяет значение d(ошибка)/d(вес). Либо градиент умножается на 1, либо на 0.
Data Science
Машинное обучение на основе нескольких временных рядов
00
Вопрос или проблема У меня есть набор из 192 датчиков. Для измерения требуется 4 датчика (например, для измерения средней температуры между используемыми датчиками в сложном материале). Эти датчики распределены по определенному паттерну, чтобы получить
Data Science
Убедитесь, что обученные словесные вложения имеют высокую схожесть с конкретными словами.
00
Вопрос или проблема Я пробую свои силы в обучении модели Word2Vec с использованием gensim. Я создал простой файл для обучения, который по сути содержал одну и ту же строку, повторенную несколько раз развлечения фильмы Фильмы кино развлечения Фильмы развлечения
Data Science
Применение модели к невидимым данным
00
Вопрос или проблема Какие хорошие способы расширить модель машинного обучения новой классом без повторной маркировки всех предыдущих данных? Проблема с данными, представляющими классы, которые не были представлены во время контролируемого обучения Предположим
Data Science
Использование активаций на определенном слое в качестве входных данных для LLM, таких как OPT-350m
00
Вопрос или проблема Я работаю с моделью OPT-350m и стремлюсь использовать вложения из разных слоев в качестве входных данных для генерации. Я столкнулся с проблемами при попытке вернуть эти вложения в модель, используя предоставленные методы.