Проблемы с размерами при обучении и прогнозировании вывода

Question

Я пытаюсь предсказать данные о погоде, используя алгоритм quantum svm. Код работает нормально до предсказания модели, но когда я пытаюсь предсказать выход, возникает следующая ошибка.

ValueError: x_vec и y_vec имеют несовместимые размеры. x_vec имеет 8 измерений, но y_vec имеет 7.

Я сделал признаки обученной модели похожими на признаки нового ввода, но ошибка все равно сохраняется. Что я должен сделать, чтобы решить эту проблему?

Вот полный код.

df = pd.read_csv(file_path)
df.head()
df.describe()
df[‘Formatted Date’] = pd.to_datetime(df[‘Formatted Date’], utc=True)
df1 = df.copy()
df1[‘Year’] = df1[‘Formatted Date’].dt.year
df1[‘Month’] = df1[‘Formatted Date’].dt.month
df1[‘Day’] = df1[‘Formatted Date’].dt.day
df1[‘Hour’] = df1[‘Formatted Date’].dt.hour
df1[‘Minute’] = df1[‘Formatted Date’].dt.minute
df1[‘Second’] = df1[‘Formatted Date’].dt.second
df1.drop(columns=[‘Formatted Date’], inplace=True)
column_order = [‘Year’, ‘Month’, ‘Day’, ‘Hour’, ‘Minute’, ‘Second’] + [col for col in df1.columns if col not in [‘Year’, ‘Month’, ‘Day’, ‘Hour’, ‘Minute’, ‘Second’]]
df1 = df1[column_order]
print(df1)
LE = LabelEncoder()
SS = StandardScaler()

categorical_cols = [‘Summary’, ‘Precip Type’, ‘Daily Summary’]
numerical_cols = [col for col in df1.columns if col not in categorical_cols and col not in [“Year”, “Month”, “Day”, “Hour”, “Minute”, “Second”]]

if len(numerical_cols) > 0:
df1[numerical_cols] = SS.fit_transform(df1[numerical_cols])

for col in categorical_cols:
categorical_data = df1[col]
df1[col] = LE.fit_transform(categorical_data)

Определите признаки и цель

X = df1[[‘Temperature (C)’, ‘Pressure (millibars)’, ‘Daily Summary’, ‘Visibility (km)’,’Wind Bearing (degrees)’,’Wind Speed (km/h)’,’Humidity’]]
y = df1[‘Precip Type’]

Разделите данные на обучающую и тестовую выборки

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.20, random_state=42)

Определите квантовую отображение признаков

feature_map = ZZFeatureMap(feature_dimension=X_train.shape[1], reps=2, entanglement=”linear”)

train_size = 260
X_train = X_train[:train_size]
y_train = y_train[:train_size]
test_size = 70
X_test = X_test[:test_size]
y_test = y_test[:test_size]

Определите квантовое ядро

backend = Aer.get_backend(‘statevector_simulator’)

sampler = Sampler()
fidelity = ComputeUncompute(sampler=sampler)

quantum_kernel = FidelityQuantumKernel(fidelity=fidelity,feature_map=feature_map, sampler=CustomSampler())
quantum_kernel = FidelityQuantumKernel(fidelity=fidelity,feature_map=feature_map, enforce_psd=True, evaluate_duplicates=”off_diagonal”, max_circuits_per_job=None)

Инициализируйте и обучите QSVM

qsvc = QSVC(quantum_kernel=quantum_kernel)
qsvc.fit(X_train, y_train)

Сделайте предсказания на тестовой выборке

y_pred = qsvc.predict(X_test)

Оцените модель

accuracy = np.mean(y_pred == y_test)
print(f’Accuracy: {accuracy}’)

import joblib

Сохраните модель в файл

joblib.dump(qsvc, ‘qsvc_model.pkl’)
print(“Модель сохранена в qsvc_model.pkl”)

Загрузите модель из файла

qsvc_loaded = joblib.load(‘qsvc_model.pkl’)
print(“Модель загружена из qsvc_model.pkl”)

Сбор данных пользователя для 8 признаков

Temperature(C) = float(input(“Введите температуру (C): “))
Humidity = float(input(“Введите влажность: “))
Pressure = float(input(“Введите давление (миллибар): “))
Wind Speed = float(input(“Введите скорость ветра (км/ч): “))
Wind Bearing = float(input(“Введите направление ветра (градусы): “))
Daily Summary = float(input(“Введите закодированное ежедневное описание (0/1/2…): “)) # Пример, кодируйте правильно
Visibility = float(input(“Введите видимость (км): “)) # Включите видимость в ввод

Подготовьте входной массив с 8 признаками

input_features = np.array([[Temperature (C), Pressure (millibars), Daily Summary, Visibility (km),
Wind Bearing (degrees), Wind Speed (km/h), Humidity]])

Убедитесь, что входные признаки имеют правильную форму

print(input_features.shape) # Должно быть (1, 8) для одного предсказания

‘Temperature (C)’, ‘Pressure (millibars)’, ‘Daily Summary’, ‘Visibility (km)’,’Wind Bearing (degrees)’,’Wind Speed (km/h)’,’Humidity’

Примените то же масштабирование, что и при обучении модели

input_features_scaled = SS.transform(input_features) # Используйте SS из обучения

Сделайте предсказание, используя обученную модель

prediction = qsvc.predict(input_features_scaled)

Выведите предсказание

if prediction[0] == 1: # Предполагаем, что 1 означает ‘дождь’ на основе вашего кодирования
print(“Предсказание: Будет дождь ☔”)
else:
print(“Предсказание: Дождя не будет 🌤️”)