Виджет конструктора признаков в Orange 3.13

Вопрос или проблема

Я работаю с Orange для своей дипломной работы, используя журналы и основные данные; однако, так как я новичок, я немного застрял с виджетом построения признаков. В конечном итоге я хотел бы комбинировать разные признаки, чтобы сравнить их.

Какую информацию мне следует вставить в поле “Значения” для категориального признака?

Если у вас есть какие-либо примеры на эту тему, я был бы очень признателен (те, что предоставлены в Orange, не помогли мне).

Согласно документации по виджету построения признаков, поле выражения должно возвращать значения из $[0, n]$, а поле Значения должно содержать $n+1$ меток, разделённых запятыми.

Ответ или решение

Конструктор признаков в Orange 3.13: Рекомендации по использованию

Если вы являетесь новичком в использовании Orange для анализа данных, и у вас возникли трудности с виджетом "Конструктор признаков", вы не одиноки. В данном ответе разберем, как правильно заполнить поля в этом виджете, особенно поле "Values" для категориальных признаков.

Понимание виджета "Конструктор признаков"

Виджет "Конструктор признаков" в Orange позволяет создавать новые признаки на основе существующих. Это дает возможность комбинировать разные признаки для более глубокого анализа данных и их дальнейшего использования в моделях обучения.

Содержание поля "Values"

Поле "Values" предназначено для указания меток (labels), которые соответствуют значениям, возвращаемым выражением в поле "Expression". В частности, если ваше выражение возвращает значения из диапазона $[0, n]$, вам необходимо указать $n + 1$ меток, разделенных запятыми.

Пример использования

Рассмотрим конкретный пример. Допустим, у вас есть два категориальных признака: "Цвет" и "Размер". Вы хотите создать новый категориальный признак, который объединяет эти два признака.

  1. Признаки:

    • Цвет: "Красный", "Синий", "Зеленый"
    • Размер: "Маленький", "Средний", "Большой"
  2. Определите диапазон значений:

    • Допустим, вы решили присвоить значения для "Цвета":
      • "Красный" = 0
      • "Синий" = 1
      • "Зеленый" = 2

    Для признака "Размер":

    • "Маленький" = 0
    • "Средний" = 1
    • "Большой" = 2
  3. Формулировка выражения:
    Допустим, вы хотите создать новый признак, который объединяет эти два. Вы можете использовать следующее выражение:

    (Color * 3) + Size

    Здесь мы предполагаем, что у нас 3 цвета, и мы умножаем здесь на 3, чтобы избежать конфликтов при комбинировании с размерами.

  4. Заполнение поля "Values":
    В этом случае ваш диапазон значений будет от 0 до 8 (так как у нас 3 цвета и 3 размера). Получается, у нас 9 уникальных комбинаций:

    • 0 = "Красный, Маленький"
    • 1 = "Красный, Средний"
    • 2 = "Красный, Большой"
    • 3 = "Синий, Маленький"
    • 4 = "Синий, Средний"
    • 5 = "Синий, Большой"
    • 6 = "Зеленый, Маленький"
    • 7 = "Зеленый, Средний"
    • 8 = "Зеленый, Большой"

    В поле "Values" вы заполняете следующее:

    Красный, Маленький, Красный, Средний, Красный, Большой, Синий, Маленький, Синий, Средний, Синий, Большой, Зеленый, Маленький, Зеленый, Средний, Зеленый, Большой

Заключение

Конструктор признаков в Orange — это мощный инструмент для обработки и подготовки данных. Заполнение поля "Values" для категориальных признаков требует четкого понимания связей между признаками и их значениями. Надеемся, что данная информация поможет вам в вашей работе над диссертацией и избавит от трудностей при использовании виджета.

Если у вас появятся дополнительные вопросы или необходимость в дальнейшем разъяснении, не стесняйтесь обратиться за поддержкой в сообщества разработчиков Orange или другие специализированные форумы. Удачи в вашем проекте!

Оцените материал
Добавить комментарий

Капча загружается...