Data Science
Почему мы используем информационный прирост вместо точности в качестве критерия разделения в решающем дереве?
00
Вопрос или проблема В классификаторе на основе дерева решений большинство алгоритмов используют Прибыль информации в качестве критерия разбиения. Мы выбираем признак с максимальной прибылью информации для разбиения. Я думаю, что использование точности
Data Science
Как вычислить информацию, переданную в сообщении для данной выборки данных
00
Вопрос или проблема Данные наборы. Тестовый набор Место,цвет,Модель,Категория,Локация,вес,Разновидность,Материал,Объем 1,6,4,4,4,1,1,1,6 2,5,4,4,4,2,6,1,1 1,6,2,1,4,1,4,2,4 1,6,2,1,4,1,2,1,2 2,6,5,5,5,2,2,1,2 1,5,4,4,4,1,6,2,2 1,3,3,3,3,1,6,2,2 Обучающий
Data Science
Суммирование самовнимания и потеря информации
00
Вопрос или проблема В самовнимании внимание для слова вычисляется следующим образом: $$ A(q, K, V) = \sum_{i} \frac{exp(q.k^{<i>})}{\sum_{j} exp(q.k^{<j>})}v^{<i>} $$ Мой вопрос: почему мы суммируем векторы множественночности * Значение.
Data Science
Потеря энтропии при слиянии двух категорий
00
Вопрос или проблема Предположим, я считаю количество случайных событий в последовательности. Для классического примера скажем, что я считаю, сколько различных моделей автомобилей проезжают по шоссе. После некоторых подсчетов я вижу, что моделей тысячами.