Data Science
Высокие потери и высокая точность на валидационном наборе данных на раннем этапе обучения бинарного классификатора
00
Вопрос или проблема Я обучаю сеть ResNet50 на симуляционных данных, а мой валидационный набор данных — это экспериментальные данные. Симуляционные данные не являются на 100% точным представлением экспериментальных данных. Цель этой сети — двойная классификация.
Data Science
Каковы возможные значения фильтра в сверточной нейронной сети?
01
Вопрос или проблема Я пытаюсь написать свёрточную нейронную сеть (CNN) с нуля на Python, но я немного нов в CNN, особенно в свёрточных слоях, так как мне удобнее работать с полносвязными слоями. Я читал Есть ли у фильтров разные веса для каждого входного
Data Science
Вопрос о грид-поиске и KFold
00
Вопрос или проблема Я пробую пример, над которым я тренируюсь на огромном наборе данных в 5 миллионов (только 4 признака) строк с помощью Cudf и CUml, и я использую SGD логистическую регрессию, потому что я должен предсказать, болен ли пациент или нет.
Data Science
Как можно оценить стоимость составной части, зная только стоимость целого?
00
Вопрос или проблема Я не уверен, как правильно сформулировать этот вопрос и с чего начать. Я новичок в области аналитики данных, но стремлюсь развить свои навыки и знания. Пример того, о чем я спрашиваю, заключается в том, если у вас есть данные о продажах
Data Science
Классификация с множеством классов
00
Вопрос или проблема Я пытаюсь создать модель, которая будет классифицировать текст примерно на 500 разных классов. Я думаю, что мне нужно настроить архитектуру Pooling Classifier, которая сейчас выглядит следующим образом: (1): PoolingLinearClassifier(
Data Science
Предобучение модели RoBERTa на новых данных с использованием библиотеки PyTorch
00
Вопрос или проблема Я предварительно обучил модель RoBERTa на новых данных, используя библиотеку ‘simpletransformers‘: from simpletransformers.classification import ClassificationModel OUTPUT_DIR = 'roberta_output/' model = ClassificationModel('roberta'
Data Science
Как я могу улучшить точность своей регрессионной модели?
00
Вопрос или проблема Для университетского проекта я пытаюсь подогнать последовательную модель Keras к нескольким тысячам данных, которые находятся примерно в диапазоне $y \in [-0.03,0.03]$ и имеют область $x \in (0, 409.6)$. Я использую следующую модель
Data Science
Какие методы выбора признаков для обработки естественного языка это представляет?
00
Вопрос или проблема У меня есть набор данных, полученный из НЛП для технических документов. Мой набор данных содержит 60 000 записей. В наборе данных имеется 30 000 признаков. Значение – это количество повторений, сколько раз слово/признак появлялось.
Data Science
Правильно ли удалять большой объем данных для модели временных рядов?
00
Вопрос или проблема У меня есть временные данные, в которых почти 90% значений равны нулю или отсутствуют. Верно ли удалять эти значения? После их удаления в наборе данных не будет постоянного временного интервала между выборками. Краткий ответ –
Data Science
Поиск советов по снижению вариации ежедневного паттерна и оптимизации разрыва между производством и потреблением для использования GN2
00
Вопрос или проблема Вопрос: Привет всем, Я в настоящее время работаю над проектом, связанным с ежедневными паттернами использования GN2 (азота). Моя основная цель — снизить вариацию ежедневных паттернов и минимизировать разрыв между производством и потреблением
Data Science
Как улучшить классификацию документов между двумя похожими документами
00
Вопрос или проблема У меня есть задача классификации документов, где мне нужно определить, связан ли определённый документ с недвижимостью или нет. Я получаю URL веб-страницы, из которой извлекаю весь текст, а затем с помощью своей обученной модели, основанной
Data Science
Почему в сглаживании n-грам модели в NLP мы не учитываем токены начала и конца предложения?
00
Вопрос или проблема Изучая сглаживание Add-1, я заметил, что мы каким-то образом добавляем 1 к каждому слову в нашем словаре, но не учитываем начало и конец предложения как два слова в словаре. Позвольте мне привести пример для объяснения.
Data Science
Как использовать метаданные точности измерений в классификаторе
00
Вопрос или проблема Учитывая, что нужно приписать класс группам измерений с помощью классификационной модели, каким образом можно включить информацию о точности измерений? Более конкретно, существует ли стратегия инженерии признаков для включения информации
Data Science
Обучение с подкреплением, примененное к задаче оптимизации
00
Вопрос или проблема Устранение проблемы: Нам дана задача оптимизации; с производственными центрами, исходным аэропортом, аэропортами назначения, пунктами пересадки и, наконец, доставкой клиентам. Это лучше объясняется на следующем изображении.
Data Science
Учитывая модель регрессии с множеством переменных признаков, какие инструменты вы бы использовали, чтобы определить, какие переменные признаков добавляют наибольшую дисперсию?
00
Вопрос или проблема Предположим, что у нас есть гипотетический набор данных {S} с 100 переменными признаков X и 10 предсказанными переменными Y. X1 … X100 Y1 …. Y10 1 .. 2 3 .. 4 4 .. 3 2 .. 1 Предположим, я хочу повысить точность Y1.
Data Science
Лучший способ решения проблемы с займом
00
Вопрос или проблема У меня есть данные о кредитах, которые мне нужно классифицировать в зависимости от причин получения кредитов, и использовать их для прогнозирования причин, по которым люди всегда обращаются за кредитом. Есть ли у вас предложения?
Data Science
Классификация запросов на обслуживание, заполнение анкеты и регистрация звонков
00
Вопрос или проблема Я совсем новичок в машинном обучении. Я только что прошел несколько учебников в Azure и завершил один практический рабочий процесс (предсказание цены на автомобиль). Надеюсь, что смогу задать здесь базовые вопросы.
Data Science
Сравнение наборов данных – Нужно ли использовать один и тот же тестовый набор данных?
01
Вопрос или проблема Я обучаю модель ML CNN. Я хочу сравнить различные наборы изображений. Эти наборы имеют разные характеристики (переведенные или нет, повернутые или нет и т.д.). Я не изменяю модель ML между обучением на разных наборах данных.
Data Science
Извлечение вывода из строк на основе обучающего набора
00
Вопрос или проблема Предупреждение Я не специалист по данным. У меня есть ощущение, что я упускаю что-то очевидное или не знаю чего-то, и если это так, пожалуйста, будьте ко мне снисходительны! Я хотел бы иметь возможность идентифицировать и извлекать
Data Science
Keras, DNN с сигмоидой – model.predict выдает значения < 0.5. Это указывает на...?
00
Вопрос или проблема Я пытаюсь сделать простой проект на Keras с полносвязными слоями для бинарной классификации. Примерно 300000 строк данных, метки такие training_set['TARGET'].value_counts() 0 282686 1 24825 Моя модель выглядит следующим образом def