Data Science
Понимание размеров входных и выходных данных для Embeddings
00
Вопрос или проблема Я пытался разобраться в размерности векторов представлений в нейронных сетях, и, похоже, наконец, у меня что-то щелкнуло в голове. Тем не менее, мне хотелось бы проверить, правильно ли я понимаю. Векторы представлений — это эффективный
Data Science
Существуют ли методы для представления целых графов знаний с помощью одного векторного встраивания?
00
Вопрос или проблема В графе знаний векторы эмбеддинга могут быть изучены для узлов (эмбеддинг узлов) и рёбер (эмбеддинги рёбер). Существует ли метод для обучения единого вектора эмбеддинга для всей графа знаний? Ответ: операция считывания графа может
Data Science
Являются ли GNN/GCN жизнеспособными для графов без признаков узлов, только с уникальными идентификаторами узлов? Отличаются ли они от DeepWalk в этом случае?
00
Вопрос или проблема Я начал изучать GNN (графовые нейронные сети) впервые и у меня возникли трудности с пониманием их преимуществ по сравнению с методами эмбеддинга, вдохновленными NLP, такими как DeepWalk и node2vec. GNN действительно показывают лучшие
Data Science
Проектирование системы RAG: контекстно-осведомленная поддержка клиентов для управления недвижимостью с использованием смешанной информации, специфичной для объектов, и глобальной информации.
00
Вопрос или проблема Контекст Я управляю портфелем объектов недвижимости на таких платформах, как Airbnb, осуществляя поддержку клиентов на протяжении всего пребывания гостей (от предварительного бронирования до завершения проживания).
Data Science
Неясно относительно смещения относительной позиции.
00
Вопрос или проблема Я читал статью о Swin Transformer и наткнулся на концепцию относительного позиционного смещения. Я не могу понять, почему это более эффективно, чем позиционные эмбеддинги. Надеюсь, кто-то сможет объяснить это интуитивно. Заранее спасибо!
Data Science
Встраивания товаров
00
Вопрос или проблема Привет, у меня есть список корзин покупок от клиентов, и я хотел бы создать эмбеддинги для продуктов. Например: КОРЗИНА1 = [‘ПРОДУКТ234’, ‘ПРОДУКТ214’, ‘ПРОДУКТ768’] КОРЗИНА2 = [‘
Data Science
Какую предобученную модель выбрать для генерации векторов из названий магазинов, написанных на английском языке?
00
Вопрос или проблема Добрый день! У меня есть набор данных с тысячами названий магазинов на английском языке. Несколько названий магазинов могут принадлежать одной бизнес-единице, например, магазины с названиями “KFC 001”
Data Science
Как использовать виджеты без передачи данных или как использовать оранжевый без интернета.
00
Вопрос или проблема Есть ли способ использовать виджеты, не отправляя данные на серверы, или полностью использовать оранжевый без интернета? Я уже использовал оранжевый в прошлом и сейчас нахожусь в ситуации, когда не могу отправить данные.
Data Science
Обработка очень коротких и очень длинных последовательностей с помощью нейронной сети
00
Вопрос или проблема Я работаю над задачей многоклассовой классификации последовательностей. Мой набор данных состоит из последовательностей данных различной длины. Например, 1500 размеченных образцов: 500 точек данных принадлежат классу A, 500 классу B и 500 классу C.
Data Science
как обучить пользовательские векторы слов word2vec для поиска связанных статей?
00
Вопрос или проблема Я начинающий в машинном обучении. Мой проект заключается в создании поисковой системы на основе ИИ, которая показывает связанные статьи, когда мы ищем на сайте. Для этого я решил обучить свое собственное встраивание.
Data Science
Способ инициализации векторного представления предложений для несп supervised кластеризации текста, лучше чем GloVe wordvec?
00
Вопрос или проблема Для неконтролируемой кластеризации текста ключевым моментом является начальноеembedding для текста. Если мы хотим использовать deepcluster для текста, проблема для текста заключается в том, как получить начальноеembedding из глубокой модели.
Data Science
Как выполнять кластеризацию с использованием эмбеддингов OpenAI наряду с другими переменными?
00
Вопрос или проблема Я работаю над проектом кластеризации, в котором мой набор данных включает как традиционные переменные (числовые и категориальные признаки), так и встраивания нескольких переменных, сгенерированных моделями OpenAI. Моя цель –
Data Science
Какую модель векторного представления слов (без контекста) выбрать в 2024 году?
00
Вопрос или проблема Мне нужны векторные представления слов, чтобы построить латентное пространство слов (английский). У меня есть около 2500 слов для встраивания и затем около 9000, чтобы вывести, основываясь на некоторой модели, которую я создам.
Data Science
Как получить векторные представления (или эмбеддинги) временных рядов?
00
Вопрос или проблема Даже если временной ряд состоит только из чисел, поиск абстрактного фиксированного векторного представления был бы интересен для целей классификации/кластеризации. Поскольку мы можем обучать и находить абстрактные представления/встраивания
Data Science
Дискриминатор условной GAN с непрерывными метками
00
Вопрос или проблема Хорошо, предположим, у нас есть хорошо помеченные изображения с недискретными метками, такими как яркость или размер, и мы хотим генерировать изображения на их основе. Если бы это было сделано с дискретной меткой, это могло бы выглядеть
Data Science
Керас: Вывод Softmax в слой вложений
00
Вопрос или проблема Я пытаюсь создать сеть кодировщик-декодировщик в Keras для генерации предложения определённого стиля. Так как моя задача является неконтролируемой, то есть у меня нет эталонных данных для сгенерированных предложений, я использую классификатор
Data Science
Использование текстовых векторных представлений напрямую для вычисления схожести против использования их в качестве признаков для модели, предсказывающей схожесть.
00
Вопрос или проблема Представьте, что у вас есть задача, где у вас есть запрос и набор документов с результатами, и вы хотите ранжировать документы с учетом запроса. Также предположим, что у вас есть векторные представления (эмбеддинги) для запроса и для документов.
Data Science
Потеря триплета – какой порог использовать для определения сходства между двумя встраиваниями?
00
Вопрос или проблема Я обучил свою модель с использованием функции потерь тройки, используя архитектуру FaceNet. Я использовал набор данных 11k hands. Теперь я хочу оценить, насколько хорошо работает моя модель, поэтому я подаю ей 2 изображения одного
Data Science
Как извлечь векторные представления категориальных переменных
00
Вопрос или проблема Я немного запутался с кодированием категориальных переменных. Есть другие посты/блог-посты по этой теме, но ни один из них не обсуждает проблему, с которой я сталкиваюсь. У меня есть набор данных со смешанными переменными (то есть
Data Science
Найдите корреляцию между двумя списками текстов.
00
Вопрос или проблема Допустим, у меня есть несколько списков текстов, такие как: A = ["девочка", "женщина", "королева"] B = ["мальчик", "мужчина", "король"] C = ["пожарный", "строительный рабочий", "механик"] D = ["медсестра", "учитель начальных классов"