Data Science
Матрица различий неметрических данных близости
00
Вопрос или проблема В настоящее время у нас есть упражнение по кодированию, в котором нас просят реализовать Постоянное Сдвиговое Встраивание (Статья). Это само по себе не является большой проблемой. Для алгоритма все, что вам нужно, это симметричная
Data Science
Анализ классификации текста на основе сходства
00
Вопрос или проблема Я прочитал много литературы по классификации текстов и различным подходам/моделям, особенно с использованием языка Python, но, вероятно, я все еще не понимаю, как построить модели и какие шаги для этого нужны.
Data Science
Мера схожести смоделированных временных рядов и наблюдаемых временных рядов
00
Вопрос или проблема В моей работе у меня есть наблюдаемая временная серия и смоделированные. Я хочу сравнить кривые света и проверить на сходство, чтобы выяснить, какая смоделированная кривая лучше всего соответствует, и какие параметры лучше всего моделируют кривую света.
Data Science
Метрика оценки для системы рекомендаций
00
Вопрос или проблема Я работаю над проектом, связанным с созданием системы рекомендации новостей. Я дошел до того, что количественно оценил взаимодействие пользователей с различными статьями на сайте, используя байесовскую функцию для определения склонности
Data Science
Преобразование значения сходства в значение несходства
00
Вопрос или проблема Предположим, у нас есть значения сходства между некоторой точкой данных в интервале $[0, 1]$. Как я могу преобразовать эти значения сходства в значения несходства в интервале $[0, ∞]$? Вы можете использовать $-\ln x$ в качестве преобразования.
Data Science
Выбор количества хешей для мин-генерации? Работа с очень разреженными данными и желание получить больше коллизий.
00
Вопрос или проблема Я пытаюсь использовать minhash для генерации кластеров и определения сходств, и в основном полагаюсь на идеи из этих источников. http://www2007.org/papers/paper570.pdf https://chrisjmccormick.wordpress.com/2015/06/12/minhash-tutorial-with-python-code/
Data Science
Общий подход к сравнению сходства согласных и согласных кластеров с первых принципов?
00
Вопрос или проблема Я недавно задавал несколько вопросов на StackOverflow, последний из которых был Что не так с этими вычислениями взвешенной суммы Жаккара для сравнения произношения согласных кластеров? В чем я совершенно запутался, так это в основах
Data Science
Как сгруппировать признаки и написать пользовательскую “функцию расчета схожести”? Как к этому подойти?
00
Вопрос или проблема Я пытаюсь разобраться, как мне следует разработать “функцию вычисления аналогии”, которая будет вычислять сходство между двумя согласными или согласными кластеров. Текущий вопрос, который вы читаете, не о том, как на практике
Data Science
Совершенные пакеты Python, которые могут оценивать сходство языков
00
Вопрос или проблема Я пытаюсь оценить вероятность генерации конкретного предложения из большого набора предложений. Для этого я начинаю с простого подхода: обучения пользовательской n-gram языковой модели и расчета значений перплексии для списка предложений.
Data Science
Семантический поиск
00
Вопрос или проблема Мы пытаемся решить проблему, связанную с семантическим поиском в нашем наборе данных, т.е. у нас есть данные, специфичные для конкретной области (например: предложения, касающиеся автомобилей) Наши данные представляют собой просто
Data Science
Сходство изображений: Сходство смешанного вектора
00
Вопрос или проблема Чтобы определить схожесть между изображениями (продуктами), я хочу использовать подход нейронной сети, подобный TiefVision. Эта предобученная нейронная сеть по сути переводит изображения в векторы признаков, а затем создает меру схожести
Data Science
Использование текстовых векторных представлений напрямую для вычисления схожести против использования их в качестве признаков для модели, предсказывающей схожесть.
00
Вопрос или проблема Представьте, что у вас есть задача, где у вас есть запрос и набор документов с результатами, и вы хотите ранжировать документы с учетом запроса. Также предположим, что у вас есть векторные представления (эмбеддинги) для запроса и для документов.
Data Science
Алгоритм сопоставления сходства
00
Вопрос или проблема Я ищу помощь в определении класса алгоритма. Если у меня есть обучающая и тестовая выборка в табличном формате, я хочу узнать сходство строк на основе некоторых числовых признаков. Обучающие данные будут размечены так, что строки будут
Data Science
Как мне рассчитать матрицу сходства с использованием ядра Стюдента-t?
00
Вопрос или проблема Как указано в заглавии, как мне рассчитать матрицу сходства с ненормализованным ядром Стюдента? Я пытаюсь рассчитать дивергенцию Кульбака-Лейблера для различных запусков t-SNE, но для этого мне нужна матрица Q.
Data Science
Извлечение изображений из (возможно) испорченной репродукции
00
Вопрос или проблема Я ищу алгоритмы извлечения признаков в литературе (либо в обычной компьютерной зрении, либо в нейронных сетях) или готовые движки индексации, подходящие для поиска оригинальных изображений в базе данных при условии, что воспроизведение
Data Science
Как измерить схожесть между двумя медицинскими изображениями разных методов визуализации на основе схожих объектов в них?
00
Вопрос или проблема У меня есть две серии медицинских изображений, каждая из которых получена из разных методов визуализации. Согласно этому, я сегментировал область интереса (объект, который появляется в обеих модальностях) с помощью U-net в этих двух