Data Science
Data Science
Вопрос или проблема RNN предоставляют возможность генерировать бесконечное количество токенов. Но если я обучу его на временной длине 25, будет ли он хорошо работать, когда длина контекста составляет 50? Мне показалось, что если я обрезаю контекст во
Data Science
Вопрос или проблема Керас упоминает, что предоставил модели, предобученные на ImageNet. Однако не уточняется, что они имеют в виду под “ImageNet” – имеется ли в виду определённый поднабор ImageNet из полного набора изображений?
Data Science
Вопрос или проблема Я нов в области RL и в настоящее время пытаюсь обучить онлайн модель DQN. Может ли онлайн модель переобучиться, поскольку она всегда учится? Как я могу понять, если это происходит? Переобучение – это значительное снижение производительности
Data Science
Вопрос или проблема Я новичок в машинном обучении и все еще его изучаю. Моя проблема заключается в идентификации дублирующихся продуктов. У меня есть датасет, содержащий детали продуктов, такие как название, цвет, размер, описание, характеристики и т.
Data Science
Вопрос или проблема Предположим, что модель обучается на нескольких наборах данных одномерных временных рядов. Эти наборы данных были собраны с разными частотами выборки. Я планирую использовать сверточную нейросеть для обработки этих временных рядов для классификации.
Data Science
NN быстро сходится, но является ли это проблемой, если производительность хороша на тестовом наборе?
Вопрос или проблема У меня есть модель LSTM, которую я использую для прогнозирования временных рядов. В процессе обучения она сходится уже после 3 эпох. Модель показывает довольно хорошие результаты на тестовых данных, но стоит ли мне по-прежнему беспокоиться
Data Science
Вопрос или проблема РНН обеспечивают возможность генерировать бесконечное количество токенов. Но если я обучу его на длине 25, будет ли он хорошо работать, когда длина контекста составляет 50? Мне показалось, что если я обрежу контекст до той длины, на
Data Science
Вопрос или проблема Я пытаюсь использовать виджеты из Orange Data Mining в практическом мире. Когда вы используете Data Info в наборе данных Orange Data Mining? Поздравляю с тем, что вы начали работать с реальными данными в области науки о данных!
Data Science
Вопрос или проблема Я пришёл из области математики и изучаю некоторые аспекты науки о данных. Я очень нов в некоторых деталях этого дела. Работая с colab, я пытаюсь организовать свои функции симуляции так, чтобы я мог получить к ним доступ даже в разных
Data Science
Вопрос или проблема Я пытаюсь понять, как работает предобработка многомерных данных, но у меня есть несколько вопросов. Например, я могу выполнять сглаживание данных, преобразование (бокс-кокс, дифференцирование), удаление шума в одномерных данных (для
Data Science
Вопрос или проблема Я предсказываю исход болезни, используя биологические данные (метаболиты плюс ковариаты: возраст, пол и ИМТ). Исход является бинарной переменной и умеренно несбалансирован (~12% положительных случаев). У меня относительно большое число
Data Science
Вопрос или проблема У меня есть набор данных из двух папок. Одна из них содержит документы (текст, PDF), связанные с личной информацией (например, имя, электронная почта, адрес и т. д.), другая содержит неперсонализированную информацию.
Data Science
Вопрос или проблема CIFAR 10 против CIFAR 100 — это самый популярный эталонный набор данных для оценки производительности вне распределения (OOD). Google в своем посте 2022 года “по направлению к надежности в глубоких обучениях”
Data Science
Вопрос или проблема На курсе, который я проходил по машинному обучению, мы обычно использовали около 2 слоев извлечения признаков для задач классификации изображений, используя, например, наборы данных MNIST или CIFAR. Однако, когда я проверял пример
Data Science
Вопрос или проблема Я пытаюсь подать последовательную модель по батчам. Для воспроизводимости моего примера предположим, что мои данные следующие: X=np.random.rand(24,432) Y=np.random.rand(24,432) Моя цель – подавать модель по батчам.
Data Science
Вопрос или проблема Я задумался, в модели Гауссовского дискриминантного анализа (GDA), скажем, у нас есть два класса для классификации y=0 и y=1 После подгонки гауссианы по наборам данных y=0 и y=1, когда мы пытаемся предсказать класс для новой тестовой
Data Science
Вопрос или проблема В необучаемом обнаружении аномалий, превращает ли включение процента загрязнения изолирующий лес в обучаемый, а не необучаемый, когда я подгоняю данные после этого? Изолирующий лес является по сути необучаемым алгоритмом.
Data Science
Вопрос или проблема Я работаю с dataframe pandas, который содержит такие столбцы: Col1 Col2 Col3 Col4 Да Нет Возможно Не уверен Возможно Да Нет Нет Да Я пытаюсь подсчитать значения в каждом столбце, а затем сложить их, чтобы получить общие количества этих значений.
Data Science
Вопрос или проблема Итак, я в ситуации, когда я знаю, что именно я пытаюсь найти, но не знаю терминологии для этого, и думаю, что именно поэтому многие мои поиски в Google идут не в том направлении, поэтому прошу прощения, если часть этого объяснения окажется избыточной.
Data Science
Вопрос или проблема У меня есть случай использования, в котором мне нужно получить координаты каждого блочного элемента на странице (будь то параграф, изображение, таблица), где я обучаю модель, чтобы понять, как они располагаются на данной странице