data-augmentation
Data Science
Вопрос или проблема Предположим, есть ML-сеть, которая принимает серые изображения в качестве входных данных. У меня есть изображения в формате RGB. Поэтому, вместо того чтобы конвертировать эти RGB-изображения в градации серого, я рассматриваю каждую
Data Science
Вопрос или проблема Я работаю над задачей генерации синтетических данных, чтобы помочь обучению моей модели. Это означает, что обучение проводится на синтетических + реальных данных, а тестирование — на реальных данных. Мне сказали, что слои пакетной
Data Science
Вопрос или проблема Я тренирую модель Unet для сегментации клеток на изображениях микроскопии. Чтобы помочь модели лучше обобщать данные с разных микроскопов, я попытался применить увеличение яркости к обучающим данным, случайным образом умножая изображения
Data Science
Вопрос или проблема При классификации изображений с использованием Keras я могу достичь точности валидации около 90-95%, однако я пытаюсь улучшить результат с помощью аугментации, поэтому перешел от image_dataset_from_directory к flow_from_directory
Data Science
Вопрос или проблема Удаление выбросов из одноберных данных можно легко выполнить, убирая точки, которые находятся за пределами диапазона IQR. Но как должен проходить процесс обнаружения и удаления выбросов, если набор данных состоит из нескольких измерений?
Data Science
Вопрос или проблема У меня есть небольшой набор данных (около 100 образцов) с примерно 20 признаками, которые в основном бинарные, и несколько из них числовые (около 5). Я хотел использовать методы для увеличения обучающего набора и посмотреть, смогу
Data Science
Вопрос или проблема Мой главный вопрос касается аугментации. если я применяю аугментацию, я считаю, что это всегда лучше, чем меньше данных но в моем случае точность валидации снижается обучение: 7000 изображений, валидация: 3000 изображений: точность валидации: 0.
Data Science
Вопрос или проблема Я запутался, когда добавляю аугментацию данных, должен ли я получить больше данных или те же данные? Я протестировал длину x_train, чтобы это подтвердить, но получил ту же длину до аугментации и после аугментации, это правильно или
Data Science
Вопрос или проблема У меня есть набор данных, который содержит около 87000 изображений в директории, причем каждый класс находится в отдельной подпапке. Я попробовал класс ImageDataGenerator() и функцию flow_from_directory() для генерации изображений