Data Science
Классификация многомерных данных в многомерные кластеры с изменяющейся структурой подкластеров.
00
Вопрос или проблема У меня есть большой набор данных со смешанными (числовыми, категориальными, текстовыми) данными, которые мне нужно классифицировать. Кластеры хорошо определены, но многомерны (т.е. имеют векторное значение) и имеют различную структуру
Data Science
Как справиться с отсутствующими данными для наивного байесовского классификатора Бернулли?
00
Вопрос или проблема Я работаю с набором данных категориальных данных, который выглядит так: content_1 content_2 content_4 content_5 content_6 0 NaN 0.0 0.0 0.0 NaN 1 NaN 0.0 0.0 0.0 NaN 2 NaN NaN NaN NaN NaN 3 0.0 NaN 0.0 NaN 0.
Data Science
Проектирование классификатора для скриншотов веб-сайтов
00
Вопрос или проблема Я работаю над проектом, который требует определить, доступна ли страница, представляющая загруженный файл на сторонней платформе (такой как rapidgator или nitroflare), или нет. Например, вот файл, который все еще доступен.
Data Science
Как заставить логистическую регрессию придавать некоторым наблюдениям большее значение/вес?
00
Вопрос или проблема У меня есть задача бинарной классификации с набором данных, состоящим из нескольких признаков. Когда я обучаю LogisticRegression на этом наборе данных, я получаю большое количество ложноположительных и ложноотрицательных результатов.
Data Science
Иллюстрация уменьшения размерности, выполненного моделью классификации или регрессии.
00
Вопрос или проблема Кратко: Вы можете предсказать что-то, но как объяснить предсказание? Редактирование: Я создал веб-сайт, который пытается ответить на этот вопрос с помощью внедрения / визуальной кластеризации данных в соответствии с путями, которые
Data Science
Двоичная классификация с временными рядами
00
Вопрос или проблема У меня есть следующие временные характеристики: диастолическое артериальное давление, систолическое артериальное давление, частота сердечных сокращений, вариабельность RR и артериальное давление. Каждый из этих клинических параметров
Data Science
Как правильно обучаться на расширенном наборе данных
00
Вопрос или проблема Я обучил свой классификатор на изображениях с смесью нескольких классов на каждом изображении, например, A-F. Классификатор способен (почти) правильно сегментировать эти классы на изображениях. Теперь у меня есть больше данных с изображениями, показывающими класс G.
Data Science
Обучающие метки в классификационных моделях в контексте больших языковых моделей.
00
Вопрос или проблема Я прохожу курс по LLM, и наш преподаватель сказал нечто, что привело меня к идее и вопросу. На тему дообучения с использованием инструкций он сказал: Обучающая выборка должна содержать множество пар «подсказка-ответ», каждая из которых
Data Science
Правило хорошего числа признаков при работе с группированными данными
00
Вопрос или проблема У меня есть задача классификации на клинических данных, где у каждого пациента есть несколько образцов. Таким образом, образцы, относящиеся к одному пациенту, в какой-то степени зависимы друг от друга. Я знаю, что невозможно заранее
Data Science
Классификация продукции по иерархическим категориям на основе множества параметров и нестандартных описаний.
00
Вопрос или проблема Я хочу начать проект по машинному обучению в своей компании, и для аналитиков затрат большая проблема заключается в классификации продуктов, которые покупатели заказывают для обслуживания, инструментов, сырья и тому подобного, так
Data Science
Методы опорных векторов в R: Поиск уравнения гиперплоскости (в 6 измерениях) и демонстрация его корректности
00
Вопрос или проблема lin.6d<-read.csv("D:/Documents/Linear-6d.csv", header=TRUE) View(lin.6d) plot(lin.6d,col = ifelse(lin.6d$Class == 1, "red","blue")) library(e1071) # Пакет для поддержки векторных машин svm.lin.6d <- svm(Class ~ .
Data Science
Как выполнить сопоставление шаблонов без OpenCV?
00
Вопрос или проблема Как выполнить шаблонное matching без OpenCV? У меня есть счет-фактура документов, принадлежащих Amazon, eBay, Flipkart, SnapDeal, и я хочу извлечь меньше информации из счета-фактуры. Поскольку такие поля, как номер заказа, имя клиента
Data Science
Низкая точность на тестовом наборе
00
Вопрос или проблема У меня есть набор данных с 16 признаками и 32 метками классов, который демонстрирует следующее поведение: Классификация нейронной сетью: высокая точность на обучающих данных 100%, но низкая точность на тестовом наборе 3% (почти как
Data Science
Кластеризация DBSCAN с использованием алгоритма классификации внутри каждого образованного кластера.
00
Вопрос или проблема Я использую алгоритм DBSCAN на данных “диабет индийцев пима”, но не могу правильно кластеризовать данные. Также я хочу использовать алгоритм классификации в каждом кластере и сравнить точность каждого кластера и предсказать большинство.
Вопросы и ответы
Функция потерь Хаверсина: Градиенты не предоставлены для любых переменных?
00
Вопрос или проблема Я пытаюсь реализовать пользовательскую функцию потерь, потерю Хаверсина, которая вычисляет расстояние между двумя точками на сфере. Координаты классов сохраняются в csv-файле, поэтому мне нужно преобразовать истинный и предсказанный
Вопросы и ответы
нужна помощь для классификатора текстов на родном языке
00
Вопрос или проблема Я недавно подал заявление на стажировку, и они назначили мне задачу автоматизировать классификацию и маршрутизацию общественных жалоб с помощью НЛП и МЛ моделей. Входные данные – это отсканированный PDF-документ, содержащий рукописный текст на малаялам.
Data Science
Оценщик Scikit-learn не изменяет предсказания при изменении переменной random_state.
00
Вопрос или проблема Я пытаюсь вычислить интервалы предсказаний для классификатора, который я обучил в scikit-learn. Даже после установки нового параметра random_state в моем конвейере, это, похоже, не изменяет результаты при повторной подгонке на данных.
Data Science

Ошибка: В операции градиент имеет None для categorical_crossentropy

00
Вопрос или проблема Я пытаюсь обучить свою дискриминаторную сеть, используя Keras с задним планом TensorFlow. Сеть предназначена для классификации входных данных на один из 9 выходных меток. Я передаю 2D вход (высота, ширина, без каналов) и вектор one-hot для вывода.
Data Science
Как извлечь и классифицировать данные из столбца в Excel?
00
Вопрос или проблема У меня есть столбец в Excel, который содержит много данных, разделенных разделителями ||. Данные можно классифицировать по некоторым классам, таким как сущности, коды IFSC, идентификаторы транзакций и т. д.
Data Science
Является ли набор данных линейно разделимым, если его можно разделить только с помощью нескольких гиперпланов?
00
Вопрос или проблема Например, в статье Википедии о линейной разделимости приведен следующий пример: Говорится: “Следующий пример требует двух прямых линий и, следовательно, не является линейно разделимым”. С другой стороны, в книге Бишопа “