classification
Data Science
Вопрос или проблема У меня есть большой набор данных со смешанными (числовыми, категориальными, текстовыми) данными, которые мне нужно классифицировать. Кластеры хорошо определены, но многомерны (т.е. имеют векторное значение) и имеют различную структуру
Data Science
Вопрос или проблема Я работаю с набором данных категориальных данных, который выглядит так: content_1 content_2 content_4 content_5 content_6 0 NaN 0.0 0.0 0.0 NaN 1 NaN 0.0 0.0 0.0 NaN 2 NaN NaN NaN NaN NaN 3 0.0 NaN 0.0 NaN 0.
Data Science
Вопрос или проблема Я работаю над проектом, который требует определить, доступна ли страница, представляющая загруженный файл на сторонней платформе (такой как rapidgator или nitroflare), или нет. Например, вот файл, который все еще доступен.
Data Science
Вопрос или проблема У меня есть задача бинарной классификации с набором данных, состоящим из нескольких признаков. Когда я обучаю LogisticRegression на этом наборе данных, я получаю большое количество ложноположительных и ложноотрицательных результатов.
Data Science
Вопрос или проблема Кратко: Вы можете предсказать что-то, но как объяснить предсказание? Редактирование: Я создал веб-сайт, который пытается ответить на этот вопрос с помощью внедрения / визуальной кластеризации данных в соответствии с путями, которые
Data Science
Вопрос или проблема У меня есть следующие временные характеристики: диастолическое артериальное давление, систолическое артериальное давление, частота сердечных сокращений, вариабельность RR и артериальное давление. Каждый из этих клинических параметров
Data Science
Вопрос или проблема Я обучил свой классификатор на изображениях с смесью нескольких классов на каждом изображении, например, A-F. Классификатор способен (почти) правильно сегментировать эти классы на изображениях. Теперь у меня есть больше данных с изображениями, показывающими класс G.
Data Science
Вопрос или проблема Я прохожу курс по LLM, и наш преподаватель сказал нечто, что привело меня к идее и вопросу. На тему дообучения с использованием инструкций он сказал: Обучающая выборка должна содержать множество пар «подсказка-ответ», каждая из которых
Data Science
Вопрос или проблема У меня есть задача классификации на клинических данных, где у каждого пациента есть несколько образцов. Таким образом, образцы, относящиеся к одному пациенту, в какой-то степени зависимы друг от друга. Я знаю, что невозможно заранее
Data Science
Вопрос или проблема Я хочу начать проект по машинному обучению в своей компании, и для аналитиков затрат большая проблема заключается в классификации продуктов, которые покупатели заказывают для обслуживания, инструментов, сырья и тому подобного, так
Data Science
Вопрос или проблема lin.6d<-read.csv("D:/Documents/Linear-6d.csv", header=TRUE) View(lin.6d) plot(lin.6d,col = ifelse(lin.6d$Class == 1, "red","blue")) library(e1071) # Пакет для поддержки векторных машин svm.lin.6d <- svm(Class ~ .
Data Science
Вопрос или проблема Как выполнить шаблонное matching без OpenCV? У меня есть счет-фактура документов, принадлежащих Amazon, eBay, Flipkart, SnapDeal, и я хочу извлечь меньше информации из счета-фактуры. Поскольку такие поля, как номер заказа, имя клиента
Data Science
Вопрос или проблема У меня есть набор данных с 16 признаками и 32 метками классов, который демонстрирует следующее поведение: Классификация нейронной сетью: высокая точность на обучающих данных 100%, но низкая точность на тестовом наборе 3% (почти как
Data Science
Кластеризация DBSCAN с использованием алгоритма классификации внутри каждого образованного кластера.
Вопрос или проблема Я использую алгоритм DBSCAN на данных “диабет индийцев пима”, но не могу правильно кластеризовать данные. Также я хочу использовать алгоритм классификации в каждом кластере и сравнить точность каждого кластера и предсказать большинство.
Вопросы и ответы
Вопрос или проблема Я пытаюсь реализовать пользовательскую функцию потерь, потерю Хаверсина, которая вычисляет расстояние между двумя точками на сфере. Координаты классов сохраняются в csv-файле, поэтому мне нужно преобразовать истинный и предсказанный
Вопросы и ответы
Вопрос или проблема Я недавно подал заявление на стажировку, и они назначили мне задачу автоматизировать классификацию и маршрутизацию общественных жалоб с помощью НЛП и МЛ моделей. Входные данные – это отсканированный PDF-документ, содержащий рукописный текст на малаялам.
Data Science
Вопрос или проблема Я пытаюсь вычислить интервалы предсказаний для классификатора, который я обучил в scikit-learn. Даже после установки нового параметра random_state в моем конвейере, это, похоже, не изменяет результаты при повторной подгонке на данных.
Data Science
Вопрос или проблема Я пытаюсь обучить свою дискриминаторную сеть, используя Keras с задним планом TensorFlow. Сеть предназначена для классификации входных данных на один из 9 выходных меток. Я передаю 2D вход (высота, ширина, без каналов) и вектор one-hot для вывода.
Data Science
Вопрос или проблема У меня есть столбец в Excel, который содержит много данных, разделенных разделителями ||. Данные можно классифицировать по некоторым классам, таким как сущности, коды IFSC, идентификаторы транзакций и т. д.
Data Science
Вопрос или проблема Например, в статье Википедии о линейной разделимости приведен следующий пример: Говорится: “Следующий пример требует двух прямых линий и, следовательно, не является линейно разделимым”. С другой стороны, в книге Бишопа “