embeddings
Data Science
Вопрос или проблема Я пытался разобраться в размерности векторов представлений в нейронных сетях, и, похоже, наконец, у меня что-то щелкнуло в голове. Тем не менее, мне хотелось бы проверить, правильно ли я понимаю. Векторы представлений — это эффективный
Data Science
Вопрос или проблема В графе знаний векторы эмбеддинга могут быть изучены для узлов (эмбеддинг узлов) и рёбер (эмбеддинги рёбер). Существует ли метод для обучения единого вектора эмбеддинга для всей графа знаний? Ответ: операция считывания графа может
Data Science
Вопрос или проблема Я начал изучать GNN (графовые нейронные сети) впервые и у меня возникли трудности с пониманием их преимуществ по сравнению с методами эмбеддинга, вдохновленными NLP, такими как DeepWalk и node2vec. GNN действительно показывают лучшие
Data Science
Вопрос или проблема Контекст Я управляю портфелем объектов недвижимости на таких платформах, как Airbnb, осуществляя поддержку клиентов на протяжении всего пребывания гостей (от предварительного бронирования до завершения проживания).
Data Science
Вопрос или проблема Я читал статью о Swin Transformer и наткнулся на концепцию относительного позиционного смещения. Я не могу понять, почему это более эффективно, чем позиционные эмбеддинги. Надеюсь, кто-то сможет объяснить это интуитивно. Заранее спасибо!
Data Science
Вопрос или проблема Привет, у меня есть список корзин покупок от клиентов, и я хотел бы создать эмбеддинги для продуктов. Например: КОРЗИНА1 = [‘ПРОДУКТ234’, ‘ПРОДУКТ214’, ‘ПРОДУКТ768’] КОРЗИНА2 = [‘
Data Science
Вопрос или проблема Добрый день! У меня есть набор данных с тысячами названий магазинов на английском языке. Несколько названий магазинов могут принадлежать одной бизнес-единице, например, магазины с названиями “KFC 001”
Data Science
Вопрос или проблема Есть ли способ использовать виджеты, не отправляя данные на серверы, или полностью использовать оранжевый без интернета? Я уже использовал оранжевый в прошлом и сейчас нахожусь в ситуации, когда не могу отправить данные.
Data Science
Вопрос или проблема Я работаю над задачей многоклассовой классификации последовательностей. Мой набор данных состоит из последовательностей данных различной длины. Например, 1500 размеченных образцов: 500 точек данных принадлежат классу A, 500 классу B и 500 классу C.
Data Science
Вопрос или проблема Я начинающий в машинном обучении. Мой проект заключается в создании поисковой системы на основе ИИ, которая показывает связанные статьи, когда мы ищем на сайте. Для этого я решил обучить свое собственное встраивание.
Data Science
Вопрос или проблема Для неконтролируемой кластеризации текста ключевым моментом является начальноеembedding для текста. Если мы хотим использовать deepcluster для текста, проблема для текста заключается в том, как получить начальноеembedding из глубокой модели.
Data Science
Вопрос или проблема Я работаю над проектом кластеризации, в котором мой набор данных включает как традиционные переменные (числовые и категориальные признаки), так и встраивания нескольких переменных, сгенерированных моделями OpenAI. Моя цель –
Data Science
Вопрос или проблема Мне нужны векторные представления слов, чтобы построить латентное пространство слов (английский). У меня есть около 2500 слов для встраивания и затем около 9000, чтобы вывести, основываясь на некоторой модели, которую я создам.
Data Science
Вопрос или проблема Даже если временной ряд состоит только из чисел, поиск абстрактного фиксированного векторного представления был бы интересен для целей классификации/кластеризации. Поскольку мы можем обучать и находить абстрактные представления/встраивания
Data Science
Вопрос или проблема Хорошо, предположим, у нас есть хорошо помеченные изображения с недискретными метками, такими как яркость или размер, и мы хотим генерировать изображения на их основе. Если бы это было сделано с дискретной меткой, это могло бы выглядеть
Data Science
Вопрос или проблема Я пытаюсь создать сеть кодировщик-декодировщик в Keras для генерации предложения определённого стиля. Так как моя задача является неконтролируемой, то есть у меня нет эталонных данных для сгенерированных предложений, я использую классификатор
Data Science
Вопрос или проблема Представьте, что у вас есть задача, где у вас есть запрос и набор документов с результатами, и вы хотите ранжировать документы с учетом запроса. Также предположим, что у вас есть векторные представления (эмбеддинги) для запроса и для документов.
Data Science
Вопрос или проблема Я обучил свою модель с использованием функции потерь тройки, используя архитектуру FaceNet. Я использовал набор данных 11k hands. Теперь я хочу оценить, насколько хорошо работает моя модель, поэтому я подаю ей 2 изображения одного
Data Science
Вопрос или проблема Я немного запутался с кодированием категориальных переменных. Есть другие посты/блог-посты по этой теме, но ни один из них не обсуждает проблему, с которой я сталкиваюсь. У меня есть набор данных со смешанными переменными (то есть
Data Science
Вопрос или проблема Допустим, у меня есть несколько списков текстов, такие как: A = ["девочка", "женщина", "королева"] B = ["мальчик", "мужчина", "король"] C = ["пожарный", "строительный рабочий", "механик"] D = ["медсестра", "учитель начальных классов"