Data Science
Где я могу найти документацию или статью, упоминающую предобученную модель distilbert-base-nli-mean-tokens?
00
Вопрос или проблема Я пытаюсь найти больше информации о предварительно обученной модели distilbert-base-nli-mean-tokens. Может кто-нибудь, пожалуйста, указать мне на ее статью или документацию? Основана ли она на DistilBERT, дистиллированной версии BERT
Data Science
Какой лучший подход к созданию слоя эмбеддинга для комбинации двух категориальных переменных?
00
Вопрос или проблема У меня есть две категориальные переменные с целочисленным кодированием, одна индексируется с 0, а другая – с 1. Какой лучший способ встраивания уникальных кортежей (Категория A, Категория B), учитывая, что в будущем могут быть
Data Science
Кто-нибудь знает, откуда взялось это правило? Правило таково: размерность векторного представления должна быть четвертой коренной из числа категорий.
00
Вопрос или проблема Я проходил онлайн-курс по машинному обучению, и лектор сказал, что общее правило для выбора числа размерностей при внедрении категориальных данных следующее размерность векторного внедрения должна быть 4-м корнем из числа категорий
Data Science
Обсуждение X-векторов
00
Вопрос или проблема Я задаю этот вопрос, чтобы задать несколько вопросов о встраивании X-векторов, предложенном Снайдером и др. Статья называется X-VECTORS: ROBUST DNN EMBEDDINGS FOR SPEAKER RECOGNITION. Ссылаясь на следующую таблицу, сеть была построена
Data Science
Объединить два тензора разной формы
00
Вопрос или проблема У меня есть два тензора: a.shape = (1, 30, 1220) # представляет вектор встраивания текста (30 интервалов, каждый с размером встраивания 1220) b.shape = (1, 128, 256) # представляет признаки изображения, полученные от предварительно
Data Science
Слой внедрения перед слоем LSTM
00
Вопрос или проблема Я экспериментирую с фреймворком кластеризации и предсказания оттока, cluschurn, который был развернут в производственной среде в Snap, Inc. В их исследовательской работе paper_link они используют 14 дней данных пользователей и рассматривают их как временной ряд.
Data Science
Объедините несколько эмбеддингов для создания пользовательского представления.
01
Вопрос или проблема Я разрабатываю систему рекомендаций, в которой каждый пользователь взаимодействует с сессиями (темами с заголовком и описанием). Я хочу представить каждого пользователя, используя их последние 5 взаимодействий сессиями, создавая вектор пользователя.
Data Science
Проблемы с объединением вложенных категориальных и числовых переменных для использования в LSTM
00
Вопрос или проблема Я новичок здесь и в глубоких обучения, поэтому заранее прошу прощения за неправильно форматированный код или формулировки. У меня есть набор данных, где я отслеживаю 4 переменные с 2 категориальными и 3 числовыми полями на 4 временных этапах.
Data Science
Понимание размеров входных и выходных данных для Embeddings
00
Вопрос или проблема Я пытался разобраться в размерности векторов представлений в нейронных сетях, и, похоже, наконец, у меня что-то щелкнуло в голове. Тем не менее, мне хотелось бы проверить, правильно ли я понимаю. Векторы представлений — это эффективный
Data Science
Существуют ли методы для представления целых графов знаний с помощью одного векторного встраивания?
00
Вопрос или проблема В графе знаний векторы эмбеддинга могут быть изучены для узлов (эмбеддинг узлов) и рёбер (эмбеддинги рёбер). Существует ли метод для обучения единого вектора эмбеддинга для всей графа знаний? Ответ: операция считывания графа может
Data Science
Являются ли GNN/GCN жизнеспособными для графов без признаков узлов, только с уникальными идентификаторами узлов? Отличаются ли они от DeepWalk в этом случае?
00
Вопрос или проблема Я начал изучать GNN (графовые нейронные сети) впервые и у меня возникли трудности с пониманием их преимуществ по сравнению с методами эмбеддинга, вдохновленными NLP, такими как DeepWalk и node2vec. GNN действительно показывают лучшие
Data Science
Проектирование системы RAG: контекстно-осведомленная поддержка клиентов для управления недвижимостью с использованием смешанной информации, специфичной для объектов, и глобальной информации.
00
Вопрос или проблема Контекст Я управляю портфелем объектов недвижимости на таких платформах, как Airbnb, осуществляя поддержку клиентов на протяжении всего пребывания гостей (от предварительного бронирования до завершения проживания).
Data Science
Неясно относительно смещения относительной позиции.
00
Вопрос или проблема Я читал статью о Swin Transformer и наткнулся на концепцию относительного позиционного смещения. Я не могу понять, почему это более эффективно, чем позиционные эмбеддинги. Надеюсь, кто-то сможет объяснить это интуитивно. Заранее спасибо!
Data Science
Встраивания товаров
00
Вопрос или проблема Привет, у меня есть список корзин покупок от клиентов, и я хотел бы создать эмбеддинги для продуктов. Например: КОРЗИНА1 = [‘ПРОДУКТ234’, ‘ПРОДУКТ214’, ‘ПРОДУКТ768’] КОРЗИНА2 = [‘
Data Science
Какую предобученную модель выбрать для генерации векторов из названий магазинов, написанных на английском языке?
00
Вопрос или проблема Добрый день! У меня есть набор данных с тысячами названий магазинов на английском языке. Несколько названий магазинов могут принадлежать одной бизнес-единице, например, магазины с названиями “KFC 001”
Data Science
Как использовать виджеты без передачи данных или как использовать оранжевый без интернета.
00
Вопрос или проблема Есть ли способ использовать виджеты, не отправляя данные на серверы, или полностью использовать оранжевый без интернета? Я уже использовал оранжевый в прошлом и сейчас нахожусь в ситуации, когда не могу отправить данные.
Data Science
Обработка очень коротких и очень длинных последовательностей с помощью нейронной сети
00
Вопрос или проблема Я работаю над задачей многоклассовой классификации последовательностей. Мой набор данных состоит из последовательностей данных различной длины. Например, 1500 размеченных образцов: 500 точек данных принадлежат классу A, 500 классу B и 500 классу C.
Data Science
как обучить пользовательские векторы слов word2vec для поиска связанных статей?
00
Вопрос или проблема Я начинающий в машинном обучении. Мой проект заключается в создании поисковой системы на основе ИИ, которая показывает связанные статьи, когда мы ищем на сайте. Для этого я решил обучить свое собственное встраивание.
Data Science
Способ инициализации векторного представления предложений для несп supervised кластеризации текста, лучше чем GloVe wordvec?
00
Вопрос или проблема Для неконтролируемой кластеризации текста ключевым моментом является начальноеembedding для текста. Если мы хотим использовать deepcluster для текста, проблема для текста заключается в том, как получить начальноеembedding из глубокой модели.
Data Science
Как выполнять кластеризацию с использованием эмбеддингов OpenAI наряду с другими переменными?
00
Вопрос или проблема Я работаю над проектом кластеризации, в котором мой набор данных включает как традиционные переменные (числовые и категориальные признаки), так и встраивания нескольких переменных, сгенерированных моделями OpenAI. Моя цель –