Data Science
Как обрабатывать категориальную инженерную характеристику в производстве ML?
00
Вопрос или проблема У меня есть классификационный набор данных, где много категориальных столбцов. У меня есть один кодированный, т.е. фиктивные переменные в моем обучении. Как с этим справиться на стороне продакшна в машинном обучении?
Data Science
Использование ImageNet в Keras?
00
Вопрос или проблема Керас упоминает, что предоставил модели, предобученные на ImageNet. Однако не уточняется, что они имеют в виду под “ImageNet” – имеется ли в виду определённый поднабор ImageNet из полного набора изображений?
Data Science
Определите тот же продукт
00
Вопрос или проблема Я новичок в машинном обучении и все еще его изучаю. Моя проблема заключается в идентификации дублирующихся продуктов. У меня есть датасет, содержащий детали продуктов, такие как название, цвет, размер, описание, характеристики и т.
Data Science
Случайный лес всегда прогнозирует класс большинства
00
Вопрос или проблема Я предсказываю исход болезни, используя биологические данные (метаболиты плюс ковариаты: возраст, пол и ИМТ). Исход является бинарной переменной и умеренно несбалансирован (~12% положительных случаев). У меня относительно большое число
Data Science
Бинарная классификация текста с помощью SpaCy
00
Вопрос или проблема У меня есть набор данных из двух папок. Одна из них содержит документы (текст, PDF), связанные с личной информацией (например, имя, электронная почта, адрес и т. д.), другая содержит неперсонализированную информацию.
Data Science
P-значение с использованием гауссовского дискриминантного анализа
00
Вопрос или проблема Я задумался, в модели Гауссовского дискриминантного анализа (GDA), скажем, у нас есть два класса для классификации y=0 и y=1 После подгонки гауссианы по наборам данных y=0 и y=1, когда мы пытаемся предсказать класс для новой тестовой
Data Science
Обучение макета страницы документа и классификация хороших/плохих макетов
00
Вопрос или проблема У меня есть случай использования, в котором мне нужно получить координаты каждого блочного элемента на странице (будь то параграф, изображение, таблица), где я обучаю модель, чтобы понять, как они располагаются на данной странице
Data Science
Уравнения линейной регрессии и градиентного спуска
00
Вопрос или проблема Я довольно нов в МЛ и начинал с линейной регрессии, сочетая её с градиентным спуском. Вот уравнение, к которому я пытался прийти, используя JavaScript – А вот что у меня получилось на JS – function algorithmify(){ let sumHDiff=hypotheses();
Data Science
Как просто обучить модель машинного обучения для определения наличия покрытия на грузовике по фотографиям с камеры.
00
Вопрос или проблема Я обучил модель классификации изображений ML.NET с помощью этого проекта на GitHub https://github.com/quocthang0507/ImageClassificationWebAppWithML.NET Она использует ML.NET TensorFlow и выбранную предобученную модель для классификации изображений.
Data Science
Как мы можем создать детектор метки и значения?
00
Вопрос или проблема Я пытаюсь реализовать детектор текста с использованием MaskRCNN, чтобы модель могла обнаруживать метку и значение, как показано на изображении ниже. Обнаружить это легче для таких полей, как дата страницы и номер заказа, но не удается
Вопросы и ответы
AWS Sagemaker ClientError: не указан канал обучения (ошибка файла манифеста)
00
Вопрос или проблема В качестве теста я запускаю train_manifest и validation_manifest, которые идентичны и содержат только один файл… {"source-ref": "s3://<имя_бакета>/bad_ofs/Images_final/Crushing/iO/A_2208040CA2_1430_220804-205516.
Data Science
Метрика оценки для системы рекомендаций
00
Вопрос или проблема Я работаю над проектом, связанным с созданием системы рекомендации новостей. Я дошел до того, что количественно оценил взаимодействие пользователей с различными статьями на сайте, используя байесовскую функцию для определения склонности
Data Science
Как просто обучить модель машинного обучения для определения накрытого грузового автомобиля на снимках с камеры.
00
Вопрос или проблема Я обучил модель классификации изображений ML.NET с помощью этого проекта на GitHub https://github.com/quocthang0507/ImageClassificationWebAppWithML.NET Она использует ML.NET TensorFlow и выбранную предобученную модель классификации изображений.
Вопросы и ответы
Как я могу узнать, какую модель эмбеддинга использует существующая коллекция chromadb?
00
Вопрос или проблема Я учусь на chromadb. Когда я работаю с некоторой существующей коллекцией, я всегда сталкиваюсь с ошибкой: chromadb.errors.InvalidDimensionException: Размерность вложения 384 не соответствует размерности коллекции 4096 Я знаю, что это
Data Science
Как предварительно обработать файлы Json в табличный формат для задачи классификации файлов.
00
Вопрос или проблема У меня есть файлы json, каждый из которых помечен конкретной меткой от A до C. Ниже приведен образец выходного JSON-файла. Каждый json-файл имеет: p = количество процессов metric = время выполнения (в данных это метрика) callpath представляет
Data Science
Поиск рекомендаций по моделированию ограниченных входных данных для коррекции влажности почвы с использованием данных наблюдений за осадками
00
Вопрос или проблема Я погружен в тонкости работы с 2D моделируемыми полями (изображениями), представляющими влажность почвы в регионах, где, к сожалению, отсутствуют прямые наблюдения. Однако есть и положительная сторона — у меня есть данные наблюдений
Data Science
PCA и K-средние в контексте машинного обучения
00
Вопрос или проблема У меня есть вопрос относительно машинного обучения. Я в основном занимаюсь исследовательским анализом данных (EDA) больших наборов данных ‘омиков’. Я недавно подал рукопись, основанную на метаболомике, и один из рецензентов
Data Science
Кривая потерь теста глубокого обучения не снижается.
00
Вопрос или проблема Я работаю над проектами глубокого обучения для текущего проекта, над которым я сейчас работаю, и это в основном задача классификации временных рядов. Дано множество временных рядов данных, мне нужно классифицировать клиентов как честных или нечестных.
Data Science
Понимание доверительного интервала
00
Вопрос или проблема Я пытаюсь понять концепцию доверительных интервалов. Каково значение точечных оценок и доверительных интервалов? Я понял, что точечная оценка в доверительном интервале по сути является статистикой распределения выборки.
Data Science
Почему 100%-ная точность на тестовых данных не является хорошей?
00
Вопрос или проблема Мне задали этот вопрос на собеседовании, и я не смог дать удовлетворительный ответ не только по ожиданиям интервьюеров, но и по своим собственным. Вопрос был как выше, только он позже привел пример, почему, если моя модель предсказала