classification
Data Science
Вопрос или проблема Я хотел использовать CNN в качестве извлекателя признаков для моих изображений, а затем передать эти признаки некоторым классификаторам машинного обучения, таким как SVM, дерево решений и KNN. Однако, когда я пытался использовать SVM
Data Science
Вопрос или проблема У меня есть вопрос о том, как настроить набор данных для моделирования. Допустим, у меня есть набор данных, представляющий, какую машину человек купит в зависимости от некоторых характеристик: Зависимые переменные – это отдельные автомобили
Data Science
Вопрос или проблема В настоящее время я прохожу курс по LLM, и наш преподаватель сказал что-то, что привело меня к идее и вопросу. На тему тонкой настройки инструкций он сказал: “Учебный набор данных должен содержать множество пар запросов и завершений
Data Science
Вопрос или проблема Можно ли использовать модели фундамента временных рядов, такие как timesFM (https://github.com/google-research/timesfm?tab=readme-ov-file), которые предназначены для прогнозирования временных рядов, для классификации временных рядов?
Data Science
Вопрос или проблема У меня есть 21 наблюдение с более чем 10000 признаков. Проблема заключается в бинарной классификации, и данные сбалансированы. Используя метод выбора признаков, я нашел 5 признаков. Теперь у меня есть 21 наблюдение с 5 признаками.
Data Science
Вопрос или проблема Я пытаюсь агрегировать информацию о профессиональных профилях из нескольких источников, устанавливая согласованную таксономию. В настоящее время главная проблема заключается в том, как установить предпочтительную таксономию для профилей
Data Science
Вопрос или проблема У меня есть набор данных с короткими названиями профессий (например, «менеджер по маркетингу», «системный администратор» и т. д.) и соответствующими кодами профессий по переписи (например, 1006 Аналитики компьютерных систем).
Data Science
Вопрос или проблема Я работаю над задачей классификации человеческой активности на основе данных о позах. Из-за качества изображений при применении модели оценивания поз, в данных есть множество пропущенных значений. Мой конвейер преобразования данных
Data Science
Вопрос или проблема Какие хорошие способы расширить модель машинного обучения новой классом без повторной маркировки всех предыдущих данных? Проблема с данными, представляющими классы, которые не были представлены во время контролируемого обучения Предположим
Data Science
Вопрос или проблема Я работаю над созданием модели для классификации типа касания, которое делает пользователь (долгое нажатие, смахивание влево, смахивание вправо и так далее). У меня есть данные с характеристиками, которые описывают касание пользователя
Data Science
Вопрос или проблема Предположим, я хочу определить вероятности победы в категории лучший фильм на Оскарах. Я знаю следующие правила: В каждом году есть только 1 победитель. Логически, сумма предсказанных вероятностей для каждого года должна составлять 1.
Data Science
Вопрос или проблема Один из вопросов недавнего онлайн-теста, на который я не смог ответить, выглядит следующим образом (я не смог скопировать точный вопрос, поэтому это полностью из памяти. Прошу прощения за возможные неточности в формулировке.
Data Science
Вопрос или проблема Какие существуют хорошие способы расширить модель машинного обучения новой классом без переобучения всех предыдущих данных? Проблема с данными, представляющими классы, которые не были представлены во время supervised обучения Предположим
Data Science
Вопрос или проблема У меня есть модель, которая выполняет бинарную классификацию. Мой набор данных сильно несбалансирован, поэтому я подумал, что мне следует отбалансировать его с помощью недовыборки перед обучением модели. Итак, сбалансировать набор
Data Science
Вопрос или проблема Я работаю с двумя наборами текстовых данных, один из которых содержит 68 тысяч образцов текста, а другой – 100 тысяч образцов. Я закодировал текстовые наборы в векторы BERT. Образец текста > 'Я работаю с NLP' ==>
Data Science
Вопрос или проблема Мне интересно, существует ли подход к классификации блоков временных рядов, а не конкретно отдельных временных рядов. Если да, можете ли вы указать мне работы/статьи/учебники, в которых классифицируются такие типы данных?
Data Science
Вопрос или проблема Я написал следующий код для классификации диалектов на основе набора данных TIMIT, используя .wav файлы. По какой-то причине моя модель не обучается и классифицирует все в один и тот же класс. Обязательно ли конвертировать в спектрограмму?
Data Science
Вопрос или проблема Я работаю с реальными данными пациентов. У меня есть набор данных с информацией о 10 миллионах пациентов, собранный за разный период времени (от 5 до 20 лет). Что я предсказываю, так это бинарный риск (или, возможно, вероятность этого
Data Science
Вопрос или проблема У меня есть около 5 лет данных индекса, содержащего много признаков на ежедневной основе. Я хочу классифицировать, будет ли индекс двигаться вверх или вниз в следующий торговый день (движение вверх или вниз определяется по ценам открытия/закрытия следующего дня).
Data Science
Вопрос или проблема Я работаю над моделью глубокого обучения, которая поможет мне предсказывать глубокие фальшивые голоса. Для предварительной обработки данных я сделал все согласно литературе, которая уже была опубликована. Но проблема, с которой я сталкиваюсь