Data Science
Почему трансформерам нужны позиционные кодировки?
00
Вопрос или проблема По крайней мере, в первом слое самовнимания в кодировщике входные данные имеют соответствие с выходными, у меня есть следующие вопросы. Неужели порядок уже неявно захватывается векторами запросов, которые сами по себе являются просто
Data Science
Как выполнять кластеризацию с использованием эмбеддингов OpenAI наряду с другими переменными?
00
Вопрос или проблема Я работаю над проектом кластеризации, в котором мой набор данных включает как традиционные переменные (числовые и категориальные признаки), так и встраивания нескольких переменных, сгенерированных моделями OpenAI. Моя цель –
Вопросы и ответы
Как действовать, чтобы подогнать модель, когда набор данных содержит некоторые текстовые строки и числовые данные.
00
Вопрос или проблема Я пытаюсь подогнать набор данных к модели. После масштабирования и удаления ненужных данных набор данных выглядит примерно так: seconds_log minutes_log country_enc changing description Другие переменные признаков 14.
Data Science
Что именно означает “переобучение” в линейной регрессии?
00
Вопрос или проблема Я пытался понять концепцию переобучения. Я знаю, что когда обучающий R^2 больше 95%, это означает, что модель переобучена, и после некоторого исследования я пришел к следующему пониманию: Модель, которая захватывает шум и случайные
Data Science
Добавление признаков с высоким p-значением и низким R-квадратом в линейную регрессию для улучшения результата.
00
Вопрос или проблема Я работаю над задачей линейной регрессии. Признаки для моего анализа были выбраны с использованием p-значений и знаний в области. После выбора этих признаков производительность $R^2$ и $RMSE$ улучшилась с 0.
Data Science
Получение матрицы ошибок с помощью Keras flow_from_directory
00
Вопрос или проблема Для домашнего задания мне нужно проанализировать набор изображений. Для этого я планирую использовать свёрточную нейронную сеть. Изображения разделены на определенные папки: Тестовый набор с 624 фотографиями dataset/test/normal (234
Data Science
Линейный дискриминант – метод наименьших квадратов классификации Бишоп 4.1.3
00
Вопрос или проблема Пожалуйста, смотрите раздел 4.1.3 в “Распознавании образов” – Бишоп: “Метод наименьших квадратов для классификации”: В линейной дискриминантной системе с 2 классами мы классифицируем вектор $\mathbf{x}$
Data Science
Интерпретация кривой обучения – нейронная сеть
00
Вопрос или проблема Когда я запускаю свои три разные нейронные сети, я получаю следующие кривые обучения, используя MSE. Я считаю, что моя базовая модель в порядке и не переобучается и не недообучается. Более того, я считаю, что моя маленькая модель недообучается
Data Science
Keras очень низкая точность, насыщается после нескольких эпох во время обучения.
00
Вопрос или проблема Я совсем новичок в области науки о данных и сразу же начал работать с моделями TensorFlow. Ранее я работал с примерами, представленными на сайте. Это моя первая попытка реализовать проект с его использованием.
Вопросы и ответы
Я работаю в Google Colab, и моя ячейка с кодом для доступа к данным из Earth Data работает бесконечно.
00
Вопрос или проблема Я довольно новый программист и пытался получить доступ к данным из данных Земли. Вот документация https://disc.gsfc.nasa.gov/information/howto?keywords=python&title=How%20to%20Access%20GES%20DISC%20Data%20Using%20Python.
Data Science
Классификация продукции по иерархическим категориям на основе множества параметров и нестандартных описаний.
00
Вопрос или проблема Я хочу начать проект по машинному обучению в своей компании, и для аналитиков затрат большая проблема заключается в классификации продуктов, которые покупатели заказывают для обслуживания, инструментов, сырья и тому подобного, так
Data Science
Рабочее поведение BERT по сравнению с Transformers, Self-Attention+LSTM и Attention+LSTM на задаче классификации научных STEM данных?
00
Вопрос или проблема Я использовал предобученный BERT с Focal Loss для классификации физики, химии, биологии и математики и получил хороший макрос F-1 0.91. Это неплохо, учитывая, что ему нужно было искать токены, такие как triangle, reaction, mitochondria и newton и т.
Data Science
Плохая форма ввода — как интерпретировать и диагностировать; Также вопрос по машинному обучению.
00
Вопрос или проблема Извините, я новичок в машинном обучении, но я пытаюсь научиться. Я создаю классификатор на основе этого набора данных, чтобы предсказать психические расстройства на основе признаков. Я хотел запустить очень простую модель классификатора
Data Science
Расчет стоимости модели Gemini 1.0 Pro
00
Вопрос или проблема Представьте, что вы готовитесь к тонкой настройке модели Gemini. Пока вы планируете, вы начинаете задумываться о различных расходах, которые вам нужно будет учесть. Вы знаете, что ценообразование Gemini часто подчеркивает расходы
Программное обеспечение
Лучшее программное обеспечение для увеличения изображений, возможно, с интегрированной функцией ИИ / МЛ в 2022 году?
00
Вопрос или проблема У меня есть несколько старых документов и фотографий, на которых есть текст на диаграммах, который нужно улучшить. Различные попытки в Adobe Photoshop 2022 оказались неудачными, и я задавался вопросом, есть ли сейчас какие-либо проверенные
Data Science
Разница между показателями производительности
00
Вопрос или проблема Мне нужна помощь, чтобы понять значение этих различных значений. В настоящее время я решаю задачи классификации с использованием машинного обучения, и я получил результаты классификации, как показано на изображении ниже.
Data Science
Правило обучения перцептрона
00
Вопрос или проблема Я новичок в машинном обучении и Data Science. Проведя некоторое время в сети, я смог довольно хорошо понять правило обучения восприятия. Но я все еще не понимаю, как применять его к набору данных. Например, у нас могут быть следующие
Data Science
Низкая точность на тестовом наборе
00
Вопрос или проблема У меня есть набор данных с 16 признаками и 32 метками классов, который демонстрирует следующее поведение: Классификация нейронной сетью: высокая точность на обучающих данных 100%, но низкая точность на тестовом наборе 3% (почти как
Data Science
делая логические выводы на основе данных, сгенерированных симуляцией
00
Вопрос или проблема У меня есть данные, собранные из компьютерной симуляции футбольных матчей, которые, похоже, имеют повторяющиеся паттерны следующего типа. если мадрид играет с арсеналом и матч заканчивается менее чем на 3 гола, то в следующем матче
Data Science
Как классифицировать упорядоченные метки (ординальные данные)?
00
Вопрос или проблема У меня есть данные, похожие на рейтинги фильмов, и метки расположены в порядке, например, от 1 до 10. Поскольку целевая метка не является номинальной, а порядковой переменной, какие типы моделей мне следует использовать для классификации таких данных?