embeddings - ответы на вопросы

Data Science

Встроенные представления для нескольких категориальных признаков с различной кардинальностью

00

Вопрос или проблема Если у меня есть несколько категориальных признаков, каждый из которых имеет свою уникальную кардинальность, и я хочу использовать слой эмбеддингов для уменьшения размерности, которые подаются в MLP. Должен ли я использовать одну большую

Data Science

Где я могу найти документацию или статью, упоминающую предобученную модель distilbert-base-nli-mean-tokens?

00

Вопрос или проблема Я пытаюсь найти больше информации о предварительно обученной модели distilbert-base-nli-mean-tokens. Может кто-нибудь, пожалуйста, указать мне на ее статью или документацию? Основана ли она на DistilBERT, дистиллированной версии BERT

Data Science

Какой лучший подход к созданию слоя эмбеддинга для комбинации двух категориальных переменных?

00

Вопрос или проблема У меня есть две категориальные переменные с целочисленным кодированием, одна индексируется с 0, а другая – с 1. Какой лучший способ встраивания уникальных кортежей (Категория A, Категория B), учитывая, что в будущем могут быть

Data Science

Кто-нибудь знает, откуда взялось это правило? Правило таково: размерность векторного представления должна быть четвертой коренной из числа категорий.

00

Вопрос или проблема Я проходил онлайн-курс по машинному обучению, и лектор сказал, что общее правило для выбора числа размерностей при внедрении категориальных данных следующее размерность векторного внедрения должна быть 4-м корнем из числа категорий

Data Science

Обсуждение X-векторов

00

Вопрос или проблема Я задаю этот вопрос, чтобы задать несколько вопросов о встраивании X-векторов, предложенном Снайдером и др. Статья называется X-VECTORS: ROBUST DNN EMBEDDINGS FOR SPEAKER RECOGNITION. Ссылаясь на следующую таблицу, сеть была построена

Data Science

Объединить два тензора разной формы

00

Вопрос или проблема У меня есть два тензора: a.shape = (1, 30, 1220) # представляет вектор встраивания текста (30 интервалов, каждый с размером встраивания 1220) b.shape = (1, 128, 256) # представляет признаки изображения, полученные от предварительно

Data Science

Слой внедрения перед слоем LSTM

00

Вопрос или проблема Я экспериментирую с фреймворком кластеризации и предсказания оттока, cluschurn, который был развернут в производственной среде в Snap, Inc. В их исследовательской работе paper_link они используют 14 дней данных пользователей и рассматривают их как временной ряд.

Data Science

Объедините несколько эмбеддингов для создания пользовательского представления.

01

Вопрос или проблема Я разрабатываю систему рекомендаций, в которой каждый пользователь взаимодействует с сессиями (темами с заголовком и описанием). Я хочу представить каждого пользователя, используя их последние 5 взаимодействий сессиями, создавая вектор пользователя.

Data Science

Проблемы с объединением вложенных категориальных и числовых переменных для использования в LSTM

00

Вопрос или проблема Я новичок здесь и в глубоких обучения, поэтому заранее прошу прощения за неправильно форматированный код или формулировки. У меня есть набор данных, где я отслеживаю 4 переменные с 2 категориальными и 3 числовыми полями на 4 временных этапах.

Data Science

Понимание размеров входных и выходных данных для Embeddings

00

Вопрос или проблема Я пытался разобраться в размерности векторов представлений в нейронных сетях, и, похоже, наконец, у меня что-то щелкнуло в голове. Тем не менее, мне хотелось бы проверить, правильно ли я понимаю. Векторы представлений — это эффективный

Data Science

Существуют ли методы для представления целых графов знаний с помощью одного векторного встраивания?

00

Вопрос или проблема В графе знаний векторы эмбеддинга могут быть изучены для узлов (эмбеддинг узлов) и рёбер (эмбеддинги рёбер). Существует ли метод для обучения единого вектора эмбеддинга для всей графа знаний? Ответ: операция считывания графа может

Data Science

Являются ли GNN/GCN жизнеспособными для графов без признаков узлов, только с уникальными идентификаторами узлов? Отличаются ли они от DeepWalk в этом случае?

00

Вопрос или проблема Я начал изучать GNN (графовые нейронные сети) впервые и у меня возникли трудности с пониманием их преимуществ по сравнению с методами эмбеддинга, вдохновленными NLP, такими как DeepWalk и node2vec. GNN действительно показывают лучшие

Data Science

Проектирование системы RAG: контекстно-осведомленная поддержка клиентов для управления недвижимостью с использованием смешанной информации, специфичной для объектов, и глобальной информации.

00

Вопрос или проблема Контекст Я управляю портфелем объектов недвижимости на таких платформах, как Airbnb, осуществляя поддержку клиентов на протяжении всего пребывания гостей (от предварительного бронирования до завершения проживания).

Data Science

Неясно относительно смещения относительной позиции.

00

Вопрос или проблема Я читал статью о Swin Transformer и наткнулся на концепцию относительного позиционного смещения. Я не могу понять, почему это более эффективно, чем позиционные эмбеддинги. Надеюсь, кто-то сможет объяснить это интуитивно. Заранее спасибо!

Data Science

Встраивания товаров

00

Вопрос или проблема Привет, у меня есть список корзин покупок от клиентов, и я хотел бы создать эмбеддинги для продуктов. Например: КОРЗИНА1 = [‘ПРОДУКТ234’, ‘ПРОДУКТ214’, ‘ПРОДУКТ768’] КОРЗИНА2 = [‘

Data Science

Какую предобученную модель выбрать для генерации векторов из названий магазинов, написанных на английском языке?

00

Вопрос или проблема Добрый день! У меня есть набор данных с тысячами названий магазинов на английском языке. Несколько названий магазинов могут принадлежать одной бизнес-единице, например, магазины с названиями “KFC 001”

Data Science

Как использовать виджеты без передачи данных или как использовать оранжевый без интернета.

00

Вопрос или проблема Есть ли способ использовать виджеты, не отправляя данные на серверы, или полностью использовать оранжевый без интернета? Я уже использовал оранжевый в прошлом и сейчас нахожусь в ситуации, когда не могу отправить данные.

Data Science

Обработка очень коротких и очень длинных последовательностей с помощью нейронной сети

00

Вопрос или проблема Я работаю над задачей многоклассовой классификации последовательностей. Мой набор данных состоит из последовательностей данных различной длины. Например, 1500 размеченных образцов: 500 точек данных принадлежат классу A, 500 классу B и 500 классу C.

Data Science

как обучить пользовательские векторы слов word2vec для поиска связанных статей?

00

Вопрос или проблема Я начинающий в машинном обучении. Мой проект заключается в создании поисковой системы на основе ИИ, которая показывает связанные статьи, когда мы ищем на сайте. Для этого я решил обучить свое собственное встраивание.

Data Science

Способ инициализации векторного представления предложений для несп supervised кластеризации текста, лучше чем GloVe wordvec?

00

Вопрос или проблема Для неконтролируемой кластеризации текста ключевым моментом является начальноеembedding для текста. Если мы хотим использовать deepcluster для текста, проблема для текста заключается в том, как получить начальноеembedding из глубокой модели.