Вопрос или проблема
Я работаю с Orange для своей дипломной работы, используя журналы и основные данные; однако, так как я новичок, я немного застрял с виджетом построения признаков. В конечном итоге я хотел бы комбинировать разные признаки, чтобы сравнить их.
Какую информацию мне следует вставить в поле “Значения” для категориального признака?
Если у вас есть какие-либо примеры на эту тему, я был бы очень признателен (те, что предоставлены в Orange, не помогли мне).
Согласно документации по виджету построения признаков, поле выражения должно возвращать значения из $[0, n]$, а поле Значения должно содержать $n+1$ меток, разделённых запятыми.
Ответ или решение
Конструктор признаков в Orange 3.13: Рекомендации по использованию
Если вы являетесь новичком в использовании Orange для анализа данных, и у вас возникли трудности с виджетом "Конструктор признаков", вы не одиноки. В данном ответе разберем, как правильно заполнить поля в этом виджете, особенно поле "Values" для категориальных признаков.
Понимание виджета "Конструктор признаков"
Виджет "Конструктор признаков" в Orange позволяет создавать новые признаки на основе существующих. Это дает возможность комбинировать разные признаки для более глубокого анализа данных и их дальнейшего использования в моделях обучения.
Содержание поля "Values"
Поле "Values" предназначено для указания меток (labels), которые соответствуют значениям, возвращаемым выражением в поле "Expression". В частности, если ваше выражение возвращает значения из диапазона $[0, n]$, вам необходимо указать $n + 1$ меток, разделенных запятыми.
Пример использования
Рассмотрим конкретный пример. Допустим, у вас есть два категориальных признака: "Цвет" и "Размер". Вы хотите создать новый категориальный признак, который объединяет эти два признака.
-
Признаки:
- Цвет: "Красный", "Синий", "Зеленый"
- Размер: "Маленький", "Средний", "Большой"
-
Определите диапазон значений:
- Допустим, вы решили присвоить значения для "Цвета":
- "Красный" = 0
- "Синий" = 1
- "Зеленый" = 2
Для признака "Размер":
- "Маленький" = 0
- "Средний" = 1
- "Большой" = 2
- Допустим, вы решили присвоить значения для "Цвета":
-
Формулировка выражения:
Допустим, вы хотите создать новый признак, который объединяет эти два. Вы можете использовать следующее выражение:(Color * 3) + Size
Здесь мы предполагаем, что у нас 3 цвета, и мы умножаем здесь на 3, чтобы избежать конфликтов при комбинировании с размерами.
-
Заполнение поля "Values":
В этом случае ваш диапазон значений будет от 0 до 8 (так как у нас 3 цвета и 3 размера). Получается, у нас 9 уникальных комбинаций:- 0 = "Красный, Маленький"
- 1 = "Красный, Средний"
- 2 = "Красный, Большой"
- 3 = "Синий, Маленький"
- 4 = "Синий, Средний"
- 5 = "Синий, Большой"
- 6 = "Зеленый, Маленький"
- 7 = "Зеленый, Средний"
- 8 = "Зеленый, Большой"
В поле "Values" вы заполняете следующее:
Красный, Маленький, Красный, Средний, Красный, Большой, Синий, Маленький, Синий, Средний, Синий, Большой, Зеленый, Маленький, Зеленый, Средний, Зеленый, Большой
Заключение
Конструктор признаков в Orange — это мощный инструмент для обработки и подготовки данных. Заполнение поля "Values" для категориальных признаков требует четкого понимания связей между признаками и их значениями. Надеемся, что данная информация поможет вам в вашей работе над диссертацией и избавит от трудностей при использовании виджета.
Если у вас появятся дополнительные вопросы или необходимость в дальнейшем разъяснении, не стесняйтесь обратиться за поддержкой в сообщества разработчиков Orange или другие специализированные форумы. Удачи в вашем проекте!