Вопросы и ответы
Как сделать мой класс Binarizer совместимым с pickle? (наследующий от torch.autograd.function)
00
Вопрос или проблема У меня есть этот класс, который я использую в своем RNN для бинаризации серии масок, которые я обучаю на своем GRU. Однако, когда я пытаюсь сохранить свои контрольные точки с помощью pickle, я всегда получаю ошибку, что этот объект
Data Science
Как использовать несколько адаптеров с предобученной моделью в Hugging Face Transformers для вывода?
00
Вопрос или проблема У меня есть предобученная модель Llama-2 в директории models_hf и два адаптера с дообучением: адаптер для обобщения в ./tmp/llama-output и чат-адаптер в ./tmp/chat_adapter. Подробности кода находятся в другом вопросе.
Вопросы и ответы
В чем разница между различными бэкендами в torch.nn.attention.SDPBackend и что они означают?
00
Вопрос или проблема В документации pytorch на SDPBackend есть несколько перечислений, которые можно использовать с менеджером контекста, ОШИБКА: Произошла ошибка при попытке определить бэкэнд. МАТЕМАТИКА: Математический бэкэнд для внимания с масштабированным скалярным произведением.
Data Science
Как передавать входные данные в модели глубокого обучения для задачи ответа на множественный выбор?
00
Вопрос или проблема В настоящее время я работаю над системой ответов на вопросы с множественным выбором. Обучающая выборка состоит из вопроса, ответа и 4 вариантов, и мне нужно предсказать правильный ответ среди 4 вариантов. Иногда есть и один абзац, например: 1.
Data Science
Убыток не уменьшается.
00
Вопрос или проблема Я строю проект на основе генерации текста с использованием архитектуры трансформера. Я использовал токенизатор Huggingface для токенизации, мой набор данных – daily-dialog, а архитектура моей модели следующая: class languageModel(nn.
Data Science
Якобиан по строкам с pytorch
00
Вопрос или проблема Предположим, у меня есть $f:\mathbb{R}^{d_i}\to\mathbb{R}^{d_o}$. Пусть $X \in \mathbb{R}^{n \times d_i}$, и я применяю $f$ к каждой строке $X$, получая $Y = f(X) \in \mathbb{R}^{n \times d_o}$. Я хотел бы вычислить тензор $Z$, который
Data Science
Является ли это подходящим способом для расчета диаграммы надежности многоклассовой модели для калибровки?
00
Вопрос или проблема Я пытаюсь обобщить диаграммы надежности [1] для многоклассового классификатора и реализовать это с использованием pytorch и pytorch-metrics. Пока все хорошо, но я немного запутан в определении точности и том, как это применимо к пересечению
Вопросы и ответы
Встраивания диффузора недостаточно значений для распаковки
00
Вопрос или проблема Я хотел сгенерировать изображение, используя текстовые эмбеддинги вместо текста в качестве входных данных, используя CLIP для токенизации и эмбеддингов. Код на данный момент: from transformers import AutoTokenizer, CLIPTextModelWithProjection
Data Science
Как получить значимые результаты от сети EncoderDecoder для прогнозирования временных рядов
00
Вопрос или проблема Я пытаюсь обучить сеть EncoderDecoder для многомерного временного ряда на входе и одномерного временного ряда на выходе. В частности, мой набор данных состоит из входных данных с 32 характеристиками на 600 секунд и должен производить 1 выход на 300 секунд.
Data Science
Pytorch CrossEntropyLoss ожидал long, но получил float.
00
Вопрос или проблема Вы провели исследование перед тем, как задать вопрос? Да. Я провел много поисков в интернете, и другие сталкивались с похожими проблемами. Их решением было использовать .float() при передаче в функцию потерь.
Data Science
Когда остановить обучение финальной модели?
00
Вопрос или проблема Предположим, я участвую в соревновании по распознаванию изображений на Kaggle. Во-первых, я создаю разделение на обучающую и валидационную выборки и нахожу хорошие гиперпараметры для своей модели. Здесь критерием остановки является
Вопросы и ответы
Размер представления несовместим с размером тензора входных данных и шагом.
00
Вопрос или проблема Я пытаюсь обучить F-RCNN на наборе данных coco на своих изображениях. Размер изображения 512X512. Я протестировал загрузчик данных отдельно, и он работает и выводит пакетные изображения и детали BB. Также я попытался вывести потери
Вопросы и ответы
Почему модель, обученная на графическом процессоре Apple, показывает худшие результаты, чем когда она обучена на центральном процессе Apple (M2)?
00
Вопрос или проблема Простая модель CNN была обучена на процессоре Apple и на графическом процессоре Apple, и производительность обеих моделей была оценена на тестовом наборе данных; модель, обученная на процессоре Apple, показала точность 98%, в то время
Вопросы и ответы
Предсказание реального времени с помощью ResNet
00
Вопрос или проблема Я обучил модель resnet50 на знаках рук от 0 до 5, и я пытаюсь развернуть ее для предсказания классов в реальном времени через веб-камеру ноутбука. Хотя модель имеет 98% точности, и я почти уверен, что ошибка не возникает из-за плохой
Data Science
Как дополнить пакет документов?
00
Вопрос или проблема Здравствуйте, эксперты PyTorch: Предложения и документы могут иметь переменную длину. Допустим, у нас есть следующие 2 документа: doc1=[torch.tensor([1,2,3,4]),torch.tensor([4,5,6]),torch.tensor([7,5])] doc2=[torch.
Вопросы и ответы
Как мне организовать свой набор данных, чтобы использовать его в качестве обучающей выборки в PyTorch?
00
Вопрос или проблема Я был бы признателен за советы по организации моего набора данных или рекомендации по его использованию в качестве входных данных для моей модели. Набор данных содержит внутридневные значения акций, и я хочу извлечь входные и выходные
Вопросы и ответы
Pytorch: Извлечение среза 3D тензора вдоль размерности 2 с использованием 1D тензора в качестве индекса
00
Вопрос или проблема Я хочу сделать срез 3D тензора в PyTorch. Размер 3D тензора src_tensor равен (batch, max_len, hidden_dim), и у меня есть 1D вектор индексов indices с размером (batch,). Я хочу сделать срез вдоль второго измерения src_tensor.
Data Science
Почему активация tanh работает лучше в Pytorch, чем в Keras?
00
Вопрос или проблема Я создаю нейронную сеть для распознавания написанных кириллических букв, и я выяснил, что, когда я использую активационную функцию tanh, это работает значительно лучше с PyTorch, чем с Keras. Код Keras: import tensorflow as tf from tensorflow.
Data Science
Почему функция активации “tanh” работает лучше с Pytorch, чем с Keras.
00
Вопрос или проблема Итак, я создаю нейронную сеть, которая должна распознавать написанные кириллические буквы, и я обнаружил, что по какой-то причине, когда я использую функцию tanh, она работает значительно лучше с PyTorch, чем с Keras.
Вопросы и ответы
Эффективная “псевдоконтинуальная” свертка в PyTorch
00
Вопрос или проблема У меня есть набор N точно дискретизированных 1D функций в тензоре размером (N, B), который я хочу сверткой с откликовой функцией и повторно дискретизировать на более грубом наборе точек, получая тензор размером (N, A).