Data Science
Data Science
Вопрос или проблема Есть ли способ получить конкретную сущность на основе контекста, в котором она находится? Например: Температура сегодня 35°C. Храните таблетку рисперидона при 20°C. Обе фразы говорят о температуре. В первом предложении я хотел бы
Data Science
Вопрос или проблема Я работаю с набором данных, который содержит 30 столбцов (29 числовых и 1 ненумеративный категориальный). Я применил метод one-hot кодирования для категориальной переменной и в итоге получил 35 столбцов. Чтобы улучшить эффективность
Data Science
Вопрос или проблема Я унаследовал решение, которое работает на Databricks Runtime 7.3 и использует scikit-learn 0.21. Databricks Runtime необходимо обновить, и поэтому существующая версия scikit-learn несовместима с версией Python в более новых Databricks Runtime.
Data Science
Вопрос или проблема У меня нет проблем с импортом данных формата Excel в R/R Studio и использованием всех других пакетов R, которые я использую. Но, когда я хочу использовать пакет glmnet для разработки модели регуляризации, я неизменно сталкиваюсь со
Data Science
Вопрос или проблема Если я использую XGBoost с GridSearchCV, как мне выбрать набор для оценки? Обратите внимание, что я имею в виду eval_set в параметрах модели. Моя текущая реализация использует GridSearchCV для оптимизации гиперпараметров, однако, если
Data Science
Вопрос или проблема У меня есть данные, где каждая основная инстанция имеет несколько независимых переменных и одну числовую целевую переменную. Кроме того, к каждой основной инстанции связаны от 1 до k многомерных векторов. В основном, существуют две
Data Science
Вопрос или проблема У меня есть неориентированный взвешенный граф, где веса ребер представляют собой вероятности. Большинство весов ребер равны 1 (они встречаются в 7 раз чаще, чем вторая по величине группа весов). Я использую этот граф для обучения векторного
Data Science
Вопрос или проблема Не могли бы вы объяснить, как мы получаем выходной слой в этой архитектуре (векторы [0.2, 0.8, -1.4, 1.2] и [-0.3, 0.2, -0.7, 0.1]). Я понимаю, что предыдущий слой — это встраивания слова “коричневый”
Data Science
Вопрос или проблема Мне нужно создать задачу в Airflow, которая загружает данные из одной базы данных Postgres и загружает их в другую. Мой код выглядит следующим образом: def task_data_upload(): postgres_sql_download = PostgresHook(postgres_conn_id="a"
Data Science
Вопрос или проблема Я новичок в Deep Learning. Мне не очень хорошо удается понимать и комментировать графики. Можете помочь мне с этими графиками Вопросы, которые я задаю себе, когда вижу графики обучения, следующие: Уменьшается ли потеря и увеличивается ли точность?
Data Science
Вопрос или проблема Я обучил свой классификатор на изображениях с смесью нескольких классов на каждом изображении, например, A-F. Классификатор способен (почти) правильно сегментировать эти классы на изображениях. Теперь у меня есть больше данных с изображениями, показывающими класс G.
Data Science
Вопрос или проблема Это то, что кажется очень простым для решения, но я не смог найти никаких подсказок – возможно, я задаю неправильный вопрос в Google. Допустим, вы владеете интернет-компанией. У вас есть общий объем потребления вашего клиента
Data Science
Вопрос или проблема У меня есть ежемесячные снимки (3 года) всех данных контрактов. Они включают следующую информацию: Статус контракта [Категориальный]: Предложен, отслеживается, отправлен, выигран, проигран и т.д. Этапы контракта [Категориальный]: Поиск
Data Science
Вопрос или проблема Моя цель – предсказать наиболее подходящий ответ на высказывание из группы из 21 потенциального ответа. (Я не уверен, что “вопрос” называется высказыванием, хотя.) Пример: Высказывание: Как ты сегодня? Ответы: Ответ1, 2, …
Data Science
Вопрос или проблема Я читал о классификаторах с максимальным отступом в “Вводном курсе статистического обучения” и не мог понять, как рассчитывается перпендикулярное расстояние наблюдения (которое является вектором) от гиперплоскости?
Data Science
Вопрос или проблема Мой набор данных содержит около 29 признаков с 3 метками классов в качестве результата. Среди этих 29 признаков около 24 признаков являются категориальными, я не могу преобразовать каждую категорию в числа, так как в некоторых признаках их более 30.
Data Science
Вопрос или проблема У нас есть много специфических для домена данных (более 200 миллионов данных, каждый документ содержит от ~100 до ~500 слов), и мы хотели получить модель языка, специфическую для домена. Мы взяли несколько образцов данных (более 2
Data Science
Вопрос или проблема Я сейчас делаю свои первые попытки с Pytorch. Я пытаюсь решить простое уравнение с помощью нейронной сети. Аналитически решенное уравнение должно выглядеть так: $$ y = \frac{x_5}{x_2} – \frac{x_1-x_2}{2 x_3 x_4}\frac{x_2}{x_1}
Data Science
Вопрос или проблема Я прохожу курс по LLM, и наш преподаватель сказал нечто, что привело меня к идее и вопросу. На тему дообучения с использованием инструкций он сказал: Обучающая выборка должна содержать множество пар «подсказка-ответ», каждая из которых
Data Science
Вопрос или проблема В настоящее время я углубляюсь в изучение аномалий в данных транспортных средств, генерируемых датчиками. Похоже, что нет подходящей книги или статьи, которые более детально охватывают эту тему. Надеюсь получить помощь в том, где и