pytorch
Вопросы и ответы
Вопрос или проблема У меня есть этот класс, который я использую в своем RNN для бинаризации серии масок, которые я обучаю на своем GRU. Однако, когда я пытаюсь сохранить свои контрольные точки с помощью pickle, я всегда получаю ошибку, что этот объект
Data Science
Как использовать несколько адаптеров с предобученной моделью в Hugging Face Transformers для вывода?
Вопрос или проблема У меня есть предобученная модель Llama-2 в директории models_hf и два адаптера с дообучением: адаптер для обобщения в ./tmp/llama-output и чат-адаптер в ./tmp/chat_adapter. Подробности кода находятся в другом вопросе.
Вопросы и ответы
Вопрос или проблема В документации pytorch на SDPBackend есть несколько перечислений, которые можно использовать с менеджером контекста, ОШИБКА: Произошла ошибка при попытке определить бэкэнд. МАТЕМАТИКА: Математический бэкэнд для внимания с масштабированным скалярным произведением.
Data Science
Вопрос или проблема В настоящее время я работаю над системой ответов на вопросы с множественным выбором. Обучающая выборка состоит из вопроса, ответа и 4 вариантов, и мне нужно предсказать правильный ответ среди 4 вариантов. Иногда есть и один абзац, например: 1.
Data Science
Вопрос или проблема Я строю проект на основе генерации текста с использованием архитектуры трансформера. Я использовал токенизатор Huggingface для токенизации, мой набор данных – daily-dialog, а архитектура моей модели следующая: class languageModel(nn.
Data Science
Вопрос или проблема Предположим, у меня есть $f:\mathbb{R}^{d_i}\to\mathbb{R}^{d_o}$. Пусть $X \in \mathbb{R}^{n \times d_i}$, и я применяю $f$ к каждой строке $X$, получая $Y = f(X) \in \mathbb{R}^{n \times d_o}$. Я хотел бы вычислить тензор $Z$, который
Data Science
Вопрос или проблема Я пытаюсь обобщить диаграммы надежности [1] для многоклассового классификатора и реализовать это с использованием pytorch и pytorch-metrics. Пока все хорошо, но я немного запутан в определении точности и том, как это применимо к пересечению
Вопросы и ответы
Вопрос или проблема Я хотел сгенерировать изображение, используя текстовые эмбеддинги вместо текста в качестве входных данных, используя CLIP для токенизации и эмбеддингов. Код на данный момент: from transformers import AutoTokenizer, CLIPTextModelWithProjection
Data Science
Вопрос или проблема Я пытаюсь обучить сеть EncoderDecoder для многомерного временного ряда на входе и одномерного временного ряда на выходе. В частности, мой набор данных состоит из входных данных с 32 характеристиками на 600 секунд и должен производить 1 выход на 300 секунд.
Data Science
Вопрос или проблема Вы провели исследование перед тем, как задать вопрос? Да. Я провел много поисков в интернете, и другие сталкивались с похожими проблемами. Их решением было использовать .float() при передаче в функцию потерь.
Data Science
Вопрос или проблема Предположим, я участвую в соревновании по распознаванию изображений на Kaggle. Во-первых, я создаю разделение на обучающую и валидационную выборки и нахожу хорошие гиперпараметры для своей модели. Здесь критерием остановки является
Вопросы и ответы
Вопрос или проблема Я пытаюсь обучить F-RCNN на наборе данных coco на своих изображениях. Размер изображения 512X512. Я протестировал загрузчик данных отдельно, и он работает и выводит пакетные изображения и детали BB. Также я попытался вывести потери
Вопросы и ответы
Вопрос или проблема Простая модель CNN была обучена на процессоре Apple и на графическом процессоре Apple, и производительность обеих моделей была оценена на тестовом наборе данных; модель, обученная на процессоре Apple, показала точность 98%, в то время
Вопросы и ответы
Вопрос или проблема Я обучил модель resnet50 на знаках рук от 0 до 5, и я пытаюсь развернуть ее для предсказания классов в реальном времени через веб-камеру ноутбука. Хотя модель имеет 98% точности, и я почти уверен, что ошибка не возникает из-за плохой
Data Science
Вопрос или проблема Здравствуйте, эксперты PyTorch: Предложения и документы могут иметь переменную длину. Допустим, у нас есть следующие 2 документа: doc1=[torch.tensor([1,2,3,4]),torch.tensor([4,5,6]),torch.tensor([7,5])] doc2=[torch.
Вопросы и ответы
Вопрос или проблема Я был бы признателен за советы по организации моего набора данных или рекомендации по его использованию в качестве входных данных для моей модели. Набор данных содержит внутридневные значения акций, и я хочу извлечь входные и выходные
Вопросы и ответы
Вопрос или проблема Я хочу сделать срез 3D тензора в PyTorch. Размер 3D тензора src_tensor равен (batch, max_len, hidden_dim), и у меня есть 1D вектор индексов indices с размером (batch,). Я хочу сделать срез вдоль второго измерения src_tensor.
Data Science
Вопрос или проблема Я создаю нейронную сеть для распознавания написанных кириллических букв, и я выяснил, что, когда я использую активационную функцию tanh, это работает значительно лучше с PyTorch, чем с Keras. Код Keras: import tensorflow as tf from tensorflow.
Data Science
Вопрос или проблема Итак, я создаю нейронную сеть, которая должна распознавать написанные кириллические буквы, и я обнаружил, что по какой-то причине, когда я использую функцию tanh, она работает значительно лучше с PyTorch, чем с Keras.
Вопросы и ответы
Вопрос или проблема У меня есть набор N точно дискретизированных 1D функций в тензоре размером (N, B), который я хочу сверткой с откликовой функцией и повторно дискретизировать на более грубом наборе точек, получая тензор размером (N, A).