k-nn
Data Science
Вопрос или проблема Допустим, у меня есть 100 значений в моем наборе данных, и я разделяю их: 80% для обучения и 20% для теста. Когда я предсказываю последнее значение, основан ли прогноз на предыдущих 99 (80 тестовых + 19 уже предсказанных значений)
Data Science
Вопрос или проблема У меня есть большой набор данных о действиях, выполняемых несколькими сотрудниками на фабрике в течение длительного времени – с 01/01/2017 до настоящего времени. Действия, выполняемые различными сотрудниками, фиксируются в каждый
Data Science
Вопрос или проблема Я использую книгу и видео, чтобы научиться использовать метод KNN для классификации фильмов по их жанрам. Вот мой код: import numpy as np import pandas as pd r_cols = ['user_id', 'movie_id', 'rating'] ratings = pd.
Data Science
Вопрос или проблема У меня есть вопрос, связанный с параллельной работой на Python. Как я могу использовать Processors =1,2,3… в алгоритме k ближайших соседей, когда K=1, 2, 3,.. для нахождения изменения времени, затраченного на выполнение, ускорения и эффективности.
Data Science
Вопрос или проблема Я изучаю KNN и машинное обучение в целом. Я знаю, что KNN обычно использует расстояние Минковского второго порядка (евклидово расстояние), но я предполагаю, что он также может использовать и другие порядки.
Data Science
Вопрос или проблема Я продолжаю пытаться запустить новый набор данных через свой классификатор KNN, но получаю сообщение: ValueError: размерность данных запроса должна совпадать с размерностью обучающих данных Затем я использовал: x_new = pd.
Data Science
Вопрос или проблема Это для многоклассовой классификации. Перед настройкой n_neighbors для KNN результаты были следующие: Точность на обучающей выборке: 99.54% Точность на тестовой выборке: 99.58% ROC AUC: 99.86% После поиска оптимального n_neighbors
Data Science
Вопрос или проблема У меня есть набор данных под названием full_weather.csv с различными признаками. Я удалил некоторые столбцы, которые не коррелируют с прогнозированием ветра, и я нашел много NaN (нулевых значений в некоторых столбцах).
Data Science
Вопрос или проблема Начнем с следующих гипотетических предварительных условий: Есть трафик: нормальный и аномальный. Каждый образец трафика содержит список событий (переменного размера) События происходят в определенном порядке, возможный размер набора
Data Science
Вопрос или проблема Вики дает это определение KNN В распознавании образов алгоритм k-ближайших соседей (k-NN) является непараметрическим методом, используемым для классификации и регрессии. В обоих случаях входные данные состоят из k ближайших обучающих
Data Science
Вопрос или проблема Я работаю с глубокой архитектурой RandLA-Net для сегментации облаков точек наземного лазерного сканирования (TLS) на классы листьев и древесины. Мой проект включает обработку меньшего набора данных (около 1-2 миллионов точек) по сравнению
Data Science
Вопрос или проблема Я работаю над задачей машинного обучения, связанной с инвентаризацией (то есть физическим запасом в розничной торговле), однако в процессе очистки (удаления выбросов) некоторые товары (через соответствующие транзакции) будут удалены.