Data Science
Правильно ли давать RNN более длинный контекст, чем у него был во время обучения?
00
Вопрос или проблема RNN предоставляют возможность генерировать бесконечное количество токенов. Но если я обучу его на временной длине 25, будет ли он хорошо работать, когда длина контекста составляет 50? Мне показалось, что если я обрезаю контекст во
Data Science
Использование ImageNet в Keras?
00
Вопрос или проблема Керас упоминает, что предоставил модели, предобученные на ImageNet. Однако не уточняется, что они имеют в виду под “ImageNet” – имеется ли в виду определённый поднабор ImageNet из полного набора изображений?
Data Science
Может ли модель Online DQN переобучаться?
00
Вопрос или проблема Я нов в области RL и в настоящее время пытаюсь обучить онлайн модель DQN. Может ли онлайн модель переобучиться, поскольку она всегда учится? Как я могу понять, если это происходит? Переобучение – это значительное снижение производительности
Data Science
Определите тот же продукт
00
Вопрос или проблема Я новичок в машинном обучении и все еще его изучаю. Моя проблема заключается в идентификации дублирующихся продуктов. У меня есть датасет, содержащий детали продуктов, такие как название, цвет, размер, описание, характеристики и т.
Data Science
Архитектуры, которые принимают входные данные с разными частотами дискретизации
00
Вопрос или проблема Предположим, что модель обучается на нескольких наборах данных одномерных временных рядов. Эти наборы данных были собраны с разными частотами выборки. Я планирую использовать сверточную нейросеть для обработки этих временных рядов для классификации.
Data Science
NN быстро сходится, но является ли это проблемой, если производительность хороша на тестовом наборе?
00
Вопрос или проблема У меня есть модель LSTM, которую я использую для прогнозирования временных рядов. В процессе обучения она сходится уже после 3 эпох. Модель показывает довольно хорошие результаты на тестовых данных, но стоит ли мне по-прежнему беспокоиться
Data Science
Правильно ли давать RNN более длинный контекст, чем у нее был во время обучения?
00
Вопрос или проблема РНН обеспечивают возможность генерировать бесконечное количество токенов. Но если я обучу его на длине 25, будет ли он хорошо работать, когда длина контекста составляет 50? Мне показалось, что если я обрежу контекст до той длины, на
Data Science
Данные: Orange для добычи данных
00
Вопрос или проблема Я пытаюсь использовать виджеты из Orange Data Mining в практическом мире. Когда вы используете Data Info в наборе данных Orange Data Mining? Поздравляю с тем, что вы начали работать с реальными данными в области науки о данных!
Data Science
Как использовать функцию из другого файла Colab?
00
Вопрос или проблема Я пришёл из области математики и изучаю некоторые аспекты науки о данных. Я очень нов в некоторых деталях этого дела. Работая с colab, я пытаюсь организовать свои функции симуляции так, чтобы я мог получить к ним доступ даже в разных
Data Science
Предварительная обработка многомерных данных
00
Вопрос или проблема Я пытаюсь понять, как работает предобработка многомерных данных, но у меня есть несколько вопросов. Например, я могу выполнять сглаживание данных, преобразование (бокс-кокс, дифференцирование), удаление шума в одномерных данных (для
Data Science
Случайный лес всегда прогнозирует класс большинства
00
Вопрос или проблема Я предсказываю исход болезни, используя биологические данные (метаболиты плюс ковариаты: возраст, пол и ИМТ). Исход является бинарной переменной и умеренно несбалансирован (~12% положительных случаев). У меня относительно большое число
Data Science
Бинарная классификация текста с помощью SpaCy
00
Вопрос или проблема У меня есть набор данных из двух папок. Одна из них содержит документы (текст, PDF), связанные с личной информацией (например, имя, электронная почта, адрес и т. д.), другая содержит неперсонализированную информацию.
Data Science
Как использовать CIFAR 10 и CIFAR 100 для оценки производительности вне распределения (OOD)?
00
Вопрос или проблема CIFAR 10 против CIFAR 100 — это самый популярный эталонный набор данных для оценки производительности вне распределения (OOD). Google в своем посте 2022 года “по направлению к надежности в глубоких обучениях”
Data Science
Количество слоев извлечения признаков в СКСН
00
Вопрос или проблема На курсе, который я проходил по машинному обучению, мы обычно использовали около 2 слоев извлечения признаков для задач классификации изображений, используя, например, наборы данных MNIST или CIFAR. Однако, когда я проверял пример
Data Science
Как мне подавать данные в мою модель Keras партиями?
00
Вопрос или проблема Я пытаюсь подать последовательную модель по батчам. Для воспроизводимости моего примера предположим, что мои данные следующие: X=np.random.rand(24,432) Y=np.random.rand(24,432) Моя цель – подавать модель по батчам.
Data Science
P-значение с использованием гауссовского дискриминантного анализа
00
Вопрос или проблема Я задумался, в модели Гауссовского дискриминантного анализа (GDA), скажем, у нас есть два класса для классификации y=0 и y=1 После подгонки гауссианы по наборам данных y=0 и y=1, когда мы пытаемся предсказать класс для новой тестовой
Data Science
Включает ли загрязнение превращение изолированного леса в контролируемый?
00
Вопрос или проблема В необучаемом обнаружении аномалий, превращает ли включение процента загрязнения изолирующий лес в обучаемый, а не необучаемый, когда я подгоняю данные после этого? Изолирующий лес является по сути необучаемым алгоритмом.
Data Science
Подсчет значений из разных столбцов
00
Вопрос или проблема Я работаю с dataframe pandas, который содержит такие столбцы: Col1 Col2 Col3 Col4 Да Нет Возможно Не уверен Возможно Да Нет Нет Да Я пытаюсь подсчитать значения в каждом столбце, а затем сложить их, чтобы получить общие количества этих значений.
Data Science
Интеграция данных с течением времени в lightgbm
00
Вопрос или проблема Итак, я в ситуации, когда я знаю, что именно я пытаюсь найти, но не знаю терминологии для этого, и думаю, что именно поэтому многие мои поиски в Google идут не в том направлении, поэтому прошу прощения, если часть этого объяснения окажется избыточной.
Data Science
Обучение макета страницы документа и классификация хороших/плохих макетов
00
Вопрос или проблема У меня есть случай использования, в котором мне нужно получить координаты каждого блочного элемента на странице (будь то параграф, изображение, таблица), где я обучаю модель, чтобы понять, как они располагаются на данной странице