Data Science
Как учесть неопределенность коэффициентов модели в интервале прогнозирования множественной линейной регрессии
00
Вопрос или проблема Я имею дело с моделированием небольших экспериментальных наборов данных. Поскольку большинство экспериментальных работ не генерируют тысячи образцов, а скорее всего лишь несколько, мне нужно быть изобретательным в том, как справляться
Data Science
Гипотеза против гиперплоскости в машинном обучении
00
Вопрос или проблема Мне трудно понять четкое различие между гипотезой и гиперплоскостью. Я знаю, что гипотеза — это кандидат в модель, которая соотносит входы с выходами после обучения. А гиперплоскость — это граница принятия решений в алгоритме классификации.
Data Science
Обратное распространение с тренировочным набором другого размера?
00
Вопрос или проблема Я пытаюсь создать нейронную сеть, входными данными которой является массив 3D-векторов длины m $$\vec{x}_i = [x_{i,1},x_{i,2},x_{i,3}], \hspace{5mm}i=1:m $$ а выходными данными – массив аналогичного размера: $$\vec{h}_{\theta,i}
Data Science
Реализация формулы градиентного спуска на Python
00
Вопрос или проблема Недавно я начал курс по машинному обучению от Эндрю Нга, и вот формула, которую Эндрю приводит для расчета градиентного спуска на линейной модели. $$ \theta_j = \theta_j – \alpha \frac{1}{m} \sum_{i=1}^m \left( h_\theta(x^{(i)}) –
Data Science
Что (в мире) такое хорошо обусловленный против низкозначного многопрофильного сингулярного распределения?
00
Вопрос или проблема В Scikit learn есть генератор данных make_regression. Можете кто-нибудь объяснить мне, как будто мне 5 лет, что имеется в виду в документации под “Набор входных данных может быть хорошо обусловленным (по умолчанию) или иметь
Data Science
Насколько эффективен псевдообратный оператор Мура-Пенроуза для решения задач регрессии с переопределенной системой уравнений?
00
Вопрос или проблема Для регрессионных задач с #Предикторами > #наблюдений я недавно читал о псевдообратной матрице Мура-Пенроуза, которая решает проблему невозвратимой матрицы в МНК для регрессионных задач. Насколько хорошо это “
Data Science
О последнем декодирующем уровне в архитектуре трансформера
00
Вопрос или проблема Итак, в слое декодера трансформера, предположим, я предсказал 3 слова до сих пор, включая начальный токен, тогда последний слой декодера будет производить 3 вектора размера d-model, и только последний вектор пройдет через слой встраивания
Data Science
Линейная регрессия с фиксированным перехватом, всё в логарифмах
00
Вопрос или проблема У меня есть набор значений для поверхности (в пикселях), который со временем увеличивается (экспоненциально). Поверхность состоит из клеток, которые делятся со временем. После моделирования я пришел к следующей формуле: $$S(t)=S_{initial}2^{t/a_d},$$
Data Science
Доказательство перпендикулярного расстояния наблюдения от гиперплоскости максимального отступа
00
Вопрос или проблема Я читал о классификаторах с максимальным отступом в “Вводном курсе статистического обучения” и не мог понять, как рассчитывается перпендикулярное расстояние наблюдения (которое является вектором) от гиперплоскости?