Data Science
Возникает ошибка ‘ValueError: setting an array element with a sequence.’ при попытке обработать данные смешанного типа.
00
Вопрос или проблема Я уже видел это, это и это вопрос, но ни одно из предложений не помогло решить мою проблему (поэтому я отменил их). У меня есть следующий код: nlp = spacy.load('en_core_web_sm') parser = English() class CleanTextTransformer(TransformerMixin)
Data Science
Как представить документ в тестовых данных с помощью матрицы документов и терминов, созданной на основе обучающего набора?
00
Вопрос или проблема Я создаю классификатор документов, используя векторное представление каждого документа в обучающем наборе (т.е. строку в матрице документов-терминов). Теперь мне нужно протестировать модель на тестовых данных.
Data Science
Как мы можем использовать формулу косинусного сходства на векторе признаков документа без направления?
00
Вопрос или проблема В математике вектор имеет как величину, так и направление. В области Data Science для определения схожести документов мы преобразуем документ в вектор признаков. Затем применяем формулу косинусного угла между вектором признаков исходного и целевого документа.
Data Science
Как найти векторное представление для каждого дескриптора?
00
Вопрос или проблема Данные кубов хорошо известны в области экстремальной классификации. Каждое изображение имеет набор дескрипторов. В общей сложности набор данных содержит 312 дескрипторов. Вы можете найти список дескрипторов в этом файле.
Data Science
Как я могу обучить модель изменять вектор, поощряя модель на основе ближайших соседей измененных векторов?
00
Вопрос или проблема Я провожу эксперимент с системой извлечения документов, в которой документы представлены в виде векторов. Когда поступают запросы, они преобразуются в векторы тем же методом, который используется для документов.
Data Science
Общий подход к сравнению сходства согласных и согласных кластеров с первых принципов?
00
Вопрос или проблема Я недавно задавал несколько вопросов на StackOverflow, последний из которых был Что не так с этими вычислениями взвешенной суммы Жаккара для сравнения произношения согласных кластеров? В чем я совершенно запутался, так это в основах
Data Science
Как сгруппировать признаки и написать пользовательскую “функцию расчета схожести”? Как к этому подойти?
00
Вопрос или проблема Я пытаюсь разобраться, как мне следует разработать “функцию вычисления аналогии”, которая будет вычислять сходство между двумя согласными или согласными кластеров. Текущий вопрос, который вы читаете, не о том, как на практике
Data Science
Доказательство перпендикулярного расстояния наблюдения от гиперплоскости максимального отступа
00
Вопрос или проблема Я читал о классификаторах с максимальным отступом в “Вводном курсе статистического обучения” и не мог понять, как рассчитывается перпендикулярное расстояние наблюдения (которое является вектором) от гиперплоскости?