Как настроить гиперпараметры оценщика в инструменте Orange

Вопрос или проблема

Привет, я хочу настроить/поискать гиперпараметры SVM в инструменте Orange. Как я могу это сделать?

Я хочу применить исчерпывающий поиск по сетке к SVM

http://scikit-learn.org/stable/modules/grid_search.html

Дааааааааа, копаю золото там, где его нет, нельзя использовать механики! Ты, должно быть, шутишь, программное обеспечение абсолютно бесполезно, если ты не можешь делать автонастройку! Я попробовал это – это как летать вслепую в туманном болоте! Ты никогда этого не найдешь! Ты можешь частично найти некоторые гиперпараметры для некоторых значений оценки, но вскоре, когда ты перейдешь к оценке следующего, AUC падает. Делать это вручную стоит лишь нервов, бесполезно и отнимает время. Кроме того, ты не можешь использовать AUC на предсказательном наборе данных. Для этого тебе нужно кодировать это самому в Excel или аналогичном. Даже еще более бесполезно, так как ты только узнаешь, что не можешь найти ничего полезного. На данный момент у нас есть решения ИИ, быстрые и простые в использовании, но не с открытым исходным кодом. Открытый исходный код не так прост в использовании, так как в основном работает в командной строке. Самым простым является Orange, но программное обеспечение не хватает основных функций, что делает его урезанным и очень медленным, даже без параллельной обработки, даже на ЦП. Падает при работе с матричными наборами данных 1000×1000 многое!

Ответ или решение

Чтобы настроить гиперпараметры классификатора SVM в инструментах Orange, выполните следующие шаги. Осуществляя этот процесс, вы сможете оптимально настроить алгоритм, что повысит точность моделей и улучшит их производительность.

1. Установка Orange

Если вы еще не установили Orange, вам необходимо сделать это, заглянув на официальный сайт Orange и следуя инструкциям по загрузке и установке.

2. Загрузка данных

  • Запустите Orange и выберите виджет "File" для загрузки вашего набора данных. Поддерживаются различные форматы: CSV, Excel и др.
  • После загрузки данных, убедитесь, что вы правильно настроили атрибуты данных и выбрали целевую переменную.

3. Разделение на обучающую и тестовую выборки

  • Используйте виджет "Data Sampler" для разделения данных на обучающую и тестовую выборки. Это важно, чтобы ваши решения по выбору гиперпараметров были обоснованными и непредвзятыми.

4. Выбор модели SVM

  • Добавьте виджет “SVM” (Support Vector Machine) в вашу рабочую область. Этот виджет позволяет настраивать различные гиперпараметры SVM, такие как ядро, параметр регуляризации C и другие.

5. Настройка гиперпараметров

Для реализации Exhaustive Grid Search вам потребуется выполнить несколько шагов:

  • Создайте виджет “Grid Search”. Соедините его с виджетом SVM и виджетом, содержащим вашу обучающую выборку.
  • Настройте параметры. В виджете Grid Search вы сможете указать диапазоны для гиперпараметров, таких как C, kernel, gamma для различных типов ядер (например, RBF, линейное и др.).
  • Обратите внимание, что важно указать разумные пределы и шаги для поиска гиперпараметров, иначе обучение может занять много времени.

6. Настройка метрики оценки

  • Вам также потребуется выбрать метрику для оценки качества модели. Для ССУ (сравнительной системы угла) можно использовать AUC или ROC, добавив виджет “Test & Score”.
  • Соедините выходные данные от Grid Search с входными данными "Test & Score", где вы сможете оценить и сравнить результаты различных комбинаций гиперпараметров.

7. Запуск и анализ результатов

  • После настройки всех параметров, запустите процесс.

  • Результаты Grid Search можно проанализировать в виджете "Test & Score", который покажет, какие настройки гиперпараметров привели к наилучшим результатам в виде графиков, метрик и таблиц.

8. Сохранение модели

  • Если результаты вас удовлетворяют, вы можете сохранить оптимально настроенную модель с помощью виджета "Save", чтобы использовать её в дальнейшем.

Заключение

Процесс автоматической настройки гиперпараметров в Orange может показаться сложным, однако он позволяет значительно ускорить работу и достичь лучших результатов. Подход с использованием Exhaustive Grid Search даст вам возможность обеспечить высокую производительность вашего SVM, что является важным аспектом в области машинного обучения. Важно помнить, что использование оптимизированных гиперпараметров может существенно изменить поведение модели, поэтому не упускайте этот шаг из виду.

Оцените материал
Добавить комментарий

Капча загружается...