Data Science
Использование активаций на определенном слое в качестве входных данных для LLM, таких как OPT-350m
00
Вопрос или проблема Я работаю с моделью OPT-350m и стремлюсь использовать вложения из разных слоев в качестве входных данных для генерации. Я столкнулся с проблемами при попытке вернуть эти вложения в модель, используя предоставленные методы.
Data Science
Различие между слоями внимания и полностью связанными слоями в глубоком обучении
01
Вопрос или проблема За последние несколько лет было несколько публикаций по так называемому механизму “Внимания” в глубоком обучении (например, 1 2). Концепция заключается в том, что мы хотим, чтобы нейронная сеть сосредоточилась или обратила
Data Science
Настройка RandLA-Net для меньших облаков точек: KNN, подвыборка точек и ошибки изменения формы
00
Вопрос или проблема Я работаю с глубокой архитектурой RandLA-Net для сегментации облаков точек наземного лазерного сканирования (TLS) на классы листьев и древесины. Мой проект включает обработку меньшего набора данных (около 1-2 миллионов точек) по сравнению
Data Science
Преобразование модели Keras в PyTorch
00
Вопрос или проблема У меня есть файл Keras h5, который я хочу загрузить в ту же модель, но эта модель создана с использованием PyTorch. Является ли ONNX приемлемым промежуточным вариантом? Что еще я могу использовать? Извините, что это не точное решение
Data Science
Как скопировать и обрезать карту признаков в Unet?
00
Вопрос или проблема Я запутался в принципе копирования и обрезки в U-net, как показано серой линией выше. Например, первая серая линия, как преобразовать (64, 568, 568)(C,W,H) в (128, 392, 392), использовал ли автор свертку или обрезал карту признаков
Data Science
CNN не может предсказать изображения за пределами набора данных.
00
Вопрос или проблема Я использую набор данных CelebA для обучения своей модели CNN для обнаружения ключевых точек на лицах. Вот моя модель class LandmarkModel: def __init__(self, inp_shape): self.model = models.Sequential() self.
Data Science
Подход к классификации блоков временных рядов
00
Вопрос или проблема Мне интересно, существует ли подход к классификации блоков временных рядов, а не конкретно отдельных временных рядов. Если да, можете ли вы указать мне работы/статьи/учебники, в которых классифицируются такие типы данных?
Data Science
Огромная вариативность в моделях прогнозирования временных рядов. Как бы вы с этим справились?
00
Вопрос или проблема Я работаю над сложной моделью прогнозирования временных рядов с использованием TensorFlow. Модель является бинарным классификатором с примерно 100 признаками, и в основном состоит из 4 слоев LSTM (входной + 2 скрытых + выходной), с
Data Science
Какое минимальное количество раз слово должно появиться в корпусе для обучения word2vec для получения качественных результатов?
00
Вопрос или проблема При обучении модели word2vec с использованием, например, gensim, вы можете указать минимальное количество раз, которое должно быть увидено слово (параметр min_count). Значение по умолчанию для этого, похоже, равно 5.
Data Science
Какой тип GAN будет подходящим для регрессии?
00
Вопрос или проблема Я разработал cGAN для задачи регрессии и предсказания некоторых значений, таких как масса. Я попробовал разные функции активации, оптимизаторы и функции потерь, но моя модель нестабильна, и я не могу получить значимые результаты предсказания.
Data Science
Каков размер порога, который обычно используется для определения сходимости значений потерь в глубокому обучении?
00
Вопрос или проблема В глубоком обучении одним из способов определить, сошлась ли модель, является наблюдение за изменением значений потерь на протяжении итераций или эпох. Можно выбрать любое значение $\epsilon$ и любую метрику.
Data Science
Какой тип GAN будет подходящим для регрессии?
00
Вопрос или проблема Я разработал cGAN для регрессионной задачи и предсказания некоторых значений, таких как масса. Я пробовал разные функции активации и оптимизаторы, а также функции потерь, но моя модель нестабильна, и я не могу получить значимые результаты предсказания.
Data Science
Модель Keras CNN выдает сообщение об ошибке: ‘ValueError: Слой ‘conv1d_12′ ожидал 2 переменные, но получил 0 переменных при загрузке’
00
Вопрос или проблема Надеюсь, у вас всё хорошо и вы в порядке. Я пытаюсь реализовать модель CNN для прогнозирования камней в почках. Эта модель работает как ожидается на моем локальном компьютере, но когда я пытаюсь развернуть приложение в Streamlit Cloud
Вопросы и ответы
Ошибка ключа при попытке извлечь активацию слоя в последовательной модели TensorFlow
00
Вопрос или проблема Я работаю над моделью TensorFlow и пытаюсь визуализировать активации из конкретного слоя. Модель компилируется и обучается успешно, но когда я пытаюсь извлечь активации из скрытого ReLU-слоя, я сталкиваюсь с ошибкой KeyError.
Data Science
Как добавить слова в список слов английской модели в движке распознавания речи Julius?
00
Вопрос или проблема Я хочу добавить несколько английских слов в модель, но как я могу это сделать? https://github.com/julius-speech/julius Это, вероятно, невозможно, поскольку эта модель предназначена только для предсказания. Она не предназначена для обучения.
Data Science
Работа с изменчивостью моделей прогнозирования временных рядов
00
Вопрос или проблема Я работаю над сложной моделью прогнозирования временных рядов с использованием TensorFlow. Модель является бинарным классификатором с примерно 100 признаками, который в основном состоит из 4 слоев LSTM (входной + 2 скрытых + выходной)
Data Science
Лучший способ загрузить данные в блокнот Colab
00
Вопрос или проблема Я работаю одновременно с несколькими очень большими наборами данных (десятки – сотни гигабайт). Я подписался на Colab Pro+, полагая, что это лучший вариант. Однако я сталкиваюсь с серьезной проблемой при загрузке данных в Colab.
Data Science
Работа с нестабильностью подгонки в прогнозировании временных рядов
00
Вопрос или проблема Я работаю над сложной моделью прогнозирования временных рядов с использованием tensorflow. Модель является бинарным классификатором с примерно 100 признаками, которая в основном состоит из 4 слоев LSTM (входной + 2 скрытых + выходной)
Data Science
Проектирование предобученной глубоконейронной сети для сравнения изображений
00
Вопрос или проблема Я довольно нов в области глубокого обучения и действительно надеюсь, что вы сможете мне помочь. Я хочу написать программу на Python, которая позволит мне выбрать область на эталонном изображении. Этот подизображение переменного размера
Data Science
Модель CNN недостаточно обучается. Точность остается на одном уровне.
00
Вопрос или проблема Я работаю над моделью глубокого обучения, которая поможет мне предсказывать глубокие фальшивые голоса. Для предварительной обработки данных я сделал все согласно литературе, которая уже была опубликована. Но проблема, с которой я сталкиваюсь