Data Science
Data Science
Вопрос или проблема Я тестирую многомерный наивный байесовский классификатор и бернуллиевский наивный байесовский классификатор на своем наборе данных и использую оценку кросс-валидации, чтобы лучше понять, какой из двух алгоритмов работает лучше.
Data Science
Вопрос или проблема Мне нужно реализовать кастомный DataLoader, который наследуется от torch.data.utils.DataLoader. Я искал полчаса, но не нашел ни примеров, ни документации об этом. Какие методы мне нужно реализовать? И какие типы данных мне следует
Data Science
Вопрос или проблема У меня есть текст твитов в файле Excel: каждая строка — это один твит. Как мне посмотреть этот корпус в Orange3? Я не понимаю, почему я не могу просто увидеть этот корпус. Как видно на изображении ниже, канал красный, и в Просмотре
Data Science
Вопрос или проблема Из этой статьи: В модели vanilla skip gram функция softmax является вычислительно очень затратной, так как требует сканирования всей матрицы выходных эмбеддингов (W_output) для вычисления вероятностного распределения всех V слов, где
Data Science
Вопрос или проблема Я новичок в глубоком обучении в области обработки изображений. Вот фрагмент кода, который я использую для генераторов данных для обучения и тестирования classes = ['глиома', 'менингиома', 'аденома', 'нетопухоли'] train_dirs = [ 'Data/Training/glioma'
Data Science
Вопрос или проблема Я отвечаю за создание регистра пациентов (более 100 000 пациентов) для некоммерческого проекта с ограниченным бюджетом. Этот регистр должен стать основой для будущей работы с данными. Я не уверен, как хорошее решение для базы данных
Data Science
Вопрос или проблема Сводка вопроса: Как можно выполнить задачу классификации индивидуумов по их данным о движении/позиции? У меня нет набора данных (в голове), но я буду делать вид, что он у меня есть, чтобы сделать мой вопрос немного более конкретным
Data Science
Вопрос или проблема Следуя этой лекции fast.ai, я пытаюсь понять механизм переноса обучения (Transfer Learning) в обработке естественного языка (NLP) от общего языкового моделирования (LM) к задаче классификации. Что именно берется из обучения языковой модели?
Data Science
Вопрос или проблема У меня есть два списка предложений A=["Astring1", "Astring2",...,"AstringN"] B=["Bstring1", "Bstring2",...,"BstringN"] Я использовал модель встраивания, такую как BERT, чтобы получить векторные представления всех моих строк в каждом
Data Science
Вопрос или проблема Контекст Я пытаюсь применить обучение с подкреплением к трансформеру. У меня есть следующие токены: ["<sos>", "<eos>", "roses", "are", "red"]. Моя цель – использовать основанную на трансформере политику сети для генерации токенов ["<
Data Science
Вопрос или проблема Я пытаюсь создать график для ранжирования каждой страны с 2002 по 2023 год. Я создал этот набор данных, загрузив каждый файл csv за соответствующий год, который содержит столбцы Страны и Ранжирование, и объединив эти отдельные наборы
Data Science
Вопрос или проблема Рейтингующий дискриминатор D(z1, z2, z3 ) ∈ [0, 1] должен быть высоким, если _z1 ∼ p1 , z2 ∼ p2 , z3 ∼ p3 _ и низким в противном случае. Для нахождения потерь и оптимального дискриминатора D(z1 , z2 , z3 ) следует ли мне изменить потери
Data Science
Вопрос или проблема Существует возможность назначения весов классов при обучении классификаторов, например, CatBoost. Насколько мне известно, это добавляет вес объектам при вычислении функции потерь, тем самым пенализируя ошибки на них больше или меньше.
Data Science
Вопрос или проблема Я работаю над задачей прогнозирования, где целевая переменная 𝑦 извлекается из нормального распределения, а связь между непрерывным пространством признаков 𝑋 и 𝑦 остается стабильной со временем. Однако целевые значения (например, среднее
Data Science
Вопрос или проблема Я изучаю скрытую модель Маркова и её реализацию для прогнозирования цен на акции. Я пытаюсь реализовать алгоритм прямого прохода в соответствии с этой работой. Здесь я нашел реализацию алгоритма прямого прохода на Python.
Data Science
Вопрос или проблема Я работаю над обучением модели RNN для генерации подписей с помощью алгоритма REINFORCE. Я применяю стратегию самокритики (см. статью Self-critical Sequence Training for Image Captioning), чтобы уменьшить дисперсию.
Data Science
Вопрос или проблема Предположим, что у нас есть прямой нейронной сети с двумя слоями, и веса каждого слоя ограничены таким образом, что сумма весов является постоянным значением в каждом слое и их значения неотрицательны. Вы можете задаться вопросом
Data Science
Вопрос или проблема Я использую DTW из mlpy, чтобы проверить схожесть между временными рядами. Нужно ли нормализовать ряды перед их обработкой с помощью DTW? Или он в чем-то терпим и я могу использовать ряды как есть? Все временные ряды хранятся в DataFrame
Data Science
Вопрос или проблема Я прочитал несколько статей о современных моделях семантической сегментации, и во всех из них авторы используют для сравнения метрику F1-меры, но не указали, используют ли они “микро” или “
Data Science
Вопрос или проблема В настоящее время я использую алгоритм случайного леса One vs Rest для задачи многоклассовой классификации на Python и хочу найти оптимальный порог для каждого класса. Как я могу сделать это с помощью подхода OVR (One-Vs-Rest)?