embeddings
Data Science
Вопрос или проблема Я пытаюсь найти больше информации о предварительно обученной модели distilbert-base-nli-mean-tokens. Может кто-нибудь, пожалуйста, указать мне на ее статью или документацию? Основана ли она на DistilBERT, дистиллированной версии BERT
Data Science
Вопрос или проблема У меня есть две категориальные переменные с целочисленным кодированием, одна индексируется с 0, а другая – с 1. Какой лучший способ встраивания уникальных кортежей (Категория A, Категория B), учитывая, что в будущем могут быть
Data Science
Вопрос или проблема Я проходил онлайн-курс по машинному обучению, и лектор сказал, что общее правило для выбора числа размерностей при внедрении категориальных данных следующее размерность векторного внедрения должна быть 4-м корнем из числа категорий
Data Science
Вопрос или проблема Я задаю этот вопрос, чтобы задать несколько вопросов о встраивании X-векторов, предложенном Снайдером и др. Статья называется X-VECTORS: ROBUST DNN EMBEDDINGS FOR SPEAKER RECOGNITION. Ссылаясь на следующую таблицу, сеть была построена
Data Science
Вопрос или проблема У меня есть два тензора: a.shape = (1, 30, 1220) # представляет вектор встраивания текста (30 интервалов, каждый с размером встраивания 1220) b.shape = (1, 128, 256) # представляет признаки изображения, полученные от предварительно
Data Science
Вопрос или проблема Я экспериментирую с фреймворком кластеризации и предсказания оттока, cluschurn, который был развернут в производственной среде в Snap, Inc. В их исследовательской работе paper_link они используют 14 дней данных пользователей и рассматривают их как временной ряд.
Data Science
Вопрос или проблема Я разрабатываю систему рекомендаций, в которой каждый пользователь взаимодействует с сессиями (темами с заголовком и описанием). Я хочу представить каждого пользователя, используя их последние 5 взаимодействий сессиями, создавая вектор пользователя.
Data Science
Вопрос или проблема Я новичок здесь и в глубоких обучения, поэтому заранее прошу прощения за неправильно форматированный код или формулировки. У меня есть набор данных, где я отслеживаю 4 переменные с 2 категориальными и 3 числовыми полями на 4 временных этапах.
Data Science
Вопрос или проблема Я пытался разобраться в размерности векторов представлений в нейронных сетях, и, похоже, наконец, у меня что-то щелкнуло в голове. Тем не менее, мне хотелось бы проверить, правильно ли я понимаю. Векторы представлений — это эффективный
Data Science
Вопрос или проблема В графе знаний векторы эмбеддинга могут быть изучены для узлов (эмбеддинг узлов) и рёбер (эмбеддинги рёбер). Существует ли метод для обучения единого вектора эмбеддинга для всей графа знаний? Ответ: операция считывания графа может
Data Science
Вопрос или проблема Я начал изучать GNN (графовые нейронные сети) впервые и у меня возникли трудности с пониманием их преимуществ по сравнению с методами эмбеддинга, вдохновленными NLP, такими как DeepWalk и node2vec. GNN действительно показывают лучшие
Data Science
Вопрос или проблема Контекст Я управляю портфелем объектов недвижимости на таких платформах, как Airbnb, осуществляя поддержку клиентов на протяжении всего пребывания гостей (от предварительного бронирования до завершения проживания).
Data Science
Вопрос или проблема Я читал статью о Swin Transformer и наткнулся на концепцию относительного позиционного смещения. Я не могу понять, почему это более эффективно, чем позиционные эмбеддинги. Надеюсь, кто-то сможет объяснить это интуитивно. Заранее спасибо!
Data Science
Вопрос или проблема Привет, у меня есть список корзин покупок от клиентов, и я хотел бы создать эмбеддинги для продуктов. Например: КОРЗИНА1 = [‘ПРОДУКТ234’, ‘ПРОДУКТ214’, ‘ПРОДУКТ768’] КОРЗИНА2 = [‘
Data Science
Вопрос или проблема Добрый день! У меня есть набор данных с тысячами названий магазинов на английском языке. Несколько названий магазинов могут принадлежать одной бизнес-единице, например, магазины с названиями “KFC 001”
Data Science
Вопрос или проблема Есть ли способ использовать виджеты, не отправляя данные на серверы, или полностью использовать оранжевый без интернета? Я уже использовал оранжевый в прошлом и сейчас нахожусь в ситуации, когда не могу отправить данные.
Data Science
Вопрос или проблема Я работаю над задачей многоклассовой классификации последовательностей. Мой набор данных состоит из последовательностей данных различной длины. Например, 1500 размеченных образцов: 500 точек данных принадлежат классу A, 500 классу B и 500 классу C.
Data Science
Вопрос или проблема Я начинающий в машинном обучении. Мой проект заключается в создании поисковой системы на основе ИИ, которая показывает связанные статьи, когда мы ищем на сайте. Для этого я решил обучить свое собственное встраивание.
Data Science
Вопрос или проблема Для неконтролируемой кластеризации текста ключевым моментом является начальноеembedding для текста. Если мы хотим использовать deepcluster для текста, проблема для текста заключается в том, как получить начальноеembedding из глубокой модели.
Data Science
Вопрос или проблема Я работаю над проектом кластеризации, в котором мой набор данных включает как традиционные переменные (числовые и категориальные признаки), так и встраивания нескольких переменных, сгенерированных моделями OpenAI. Моя цель –