Data Science
Распознавание сущностей с контекстом/отношением
00
Вопрос или проблема Есть ли способ получить конкретную сущность на основе контекста, в котором она находится? Например: Температура сегодня 35°C. Храните таблетку рисперидона при 20°C. Обе фразы говорят о температуре. В первом предложении я хотел бы
Data Science
Как выполнить отбор признаков в наборе данных с категориальными и числовыми признаками?
00
Вопрос или проблема Я работаю с набором данных, который содержит 30 столбцов (29 числовых и 1 ненумеративный категориальный). Я применил метод one-hot кодирования для категориальной переменной и в итоге получил 35 столбцов. Чтобы улучшить эффективность
Data Science
обновление scikit-learn – как исправить разрывное изменение?
00
Вопрос или проблема Я унаследовал решение, которое работает на Databricks Runtime 7.3 и использует scikit-learn 0.21. Databricks Runtime необходимо обновить, и поэтому существующая версия scikit-learn несовместима с версией Python в более новых Databricks Runtime.
Data Science
Импорт данных в формате Excel в R/R Studio и использование пакета glmnet?
00
Вопрос или проблема У меня нет проблем с импортом данных формата Excel в R/R Studio и использованием всех других пакетов R, которые я использую. Но, когда я хочу использовать пакет glmnet для разработки модели регуляризации, я неизменно сталкиваюсь со
Data Science
XGBoost CV путаница в том, как выбрать оценочный набор
00
Вопрос или проблема Если я использую XGBoost с GridSearchCV, как мне выбрать набор для оценки? Обратите внимание, что я имею в виду eval_set в параметрах модели. Моя текущая реализация использует GridSearchCV для оптимизации гиперпараметров, однако, если
Data Science
Объяснимая многократная регрессия с экземплярами?
00
Вопрос или проблема У меня есть данные, где каждая основная инстанция имеет несколько независимых переменных и одну числовую целевую переменную. Кроме того, к каждой основной инстанции связаны от 1 до k многомерных векторов. В основном, существуют две
Data Science
Как обрабатывать неим сбалансированные веса ребер в графе для встраивания узлов и предсказания весов ребер?
00
Вопрос или проблема У меня есть неориентированный взвешенный граф, где веса ребер представляют собой вероятности. Большинство весов ребер равны 1 (они встречаются в 7 раз чаще, чем вторая по величине группа весов). Я использую этот граф для обучения векторного
Data Science
Как мы получаем выходной слой в скип-грам?
00
Вопрос или проблема Не могли бы вы объяснить, как мы получаем выходной слой в этой архитектуре (векторы [0.2, 0.8, -1.4, 1.2] и [-0.3, 0.2, -0.7, 0.1]). Я понимаю, что предыдущий слой — это встраивания слова “коричневый”
Data Science
Как загрузить DataFrame Pandas в таблицу Postgres в Airflow?
00
Вопрос или проблема Мне нужно создать задачу в Airflow, которая загружает данные из одной базы данных Postgres и загружает их в другую. Мой код выглядит следующим образом: def task_data_upload(): postgres_sql_download = PostgresHook(postgres_conn_id="a"
Data Science
Кривая обучения и валидации
00
Вопрос или проблема Я новичок в Deep Learning. Мне не очень хорошо удается понимать и комментировать графики. Можете помочь мне с этими графиками Вопросы, которые я задаю себе, когда вижу графики обучения, следующие: Уменьшается ли потеря и увеличивается ли точность?
Data Science
Как правильно обучаться на расширенном наборе данных
00
Вопрос или проблема Я обучил свой классификатор на изображениях с смесью нескольких классов на каждом изображении, например, A-F. Классификатор способен (почти) правильно сегментировать эти классы на изображениях. Теперь у меня есть больше данных с изображениями, показывающими класс G.
Data Science
Что делать, когда вы разрабатываете функцию, а знаменатель равен нулю?
00
Вопрос или проблема Это то, что кажется очень простым для решения, но я не смог найти никаких подсказок – возможно, я задаю неправильный вопрос в Google. Допустим, вы владеете интернет-компанией. У вас есть общий объем потребления вашего клиента
Data Science
Какие хорошие методы прогнозирования будущих доходов на основе категориальных и значения данных?
00
Вопрос или проблема У меня есть ежемесячные снимки (3 года) всех данных контрактов. Они включают следующую информацию: Статус контракта [Категориальный]: Предложен, отслеживается, отправлен, выигран, проигран и т.д. Этапы контракта [Категориальный]: Поиск
Data Science
NLP – Модель на основе извлечения
00
Вопрос или проблема Моя цель – предсказать наиболее подходящий ответ на высказывание из группы из 21 потенциального ответа. (Я не уверен, что “вопрос” называется высказыванием, хотя.) Пример: Высказывание: Как ты сегодня? Ответы: Ответ1, 2, …
Data Science
Доказательство перпендикулярного расстояния наблюдения от гиперплоскости максимального отступа
00
Вопрос или проблема Я читал о классификаторах с максимальным отступом в “Вводном курсе статистического обучения” и не мог понять, как рассчитывается перпендикулярное расстояние наблюдения (которое является вектором) от гиперплоскости?
Data Science
Как делать предсказания по данным, закодированным метками, если конечный пользователь будет вводить категориальные данные?
00
Вопрос или проблема Мой набор данных содержит около 29 признаков с 3 метками классов в качестве результата. Среди этих 29 признаков около 24 признаков являются категориальными, я не могу преобразовать каждую категорию в числа, так как в некоторых признаках их более 30.
Data Science
Тонко настроенная MLM на основе RoBERTa не улучшает производительность.
00
Вопрос или проблема У нас есть много специфических для домена данных (более 200 миллионов данных, каждый документ содержит от ~100 до ~500 слов), и мы хотели получить модель языка, специфическую для домена. Мы взяли несколько образцов данных (более 2
Data Science
Нейронная сеть не может выучить простое аналитическое уравнение.
00
Вопрос или проблема Я сейчас делаю свои первые попытки с Pytorch. Я пытаюсь решить простое уравнение с помощью нейронной сети. Аналитически решенное уравнение должно выглядеть так: $$ y = \frac{x_5}{x_2} – \frac{x_1-x_2}{2 x_3 x_4}\frac{x_2}{x_1}
Data Science
Обучающие метки в классификационных моделях в контексте больших языковых моделей.
00
Вопрос или проблема Я прохожу курс по LLM, и наш преподаватель сказал нечто, что привело меня к идее и вопросу. На тему дообучения с использованием инструкций он сказал: Обучающая выборка должна содержать множество пар «подсказка-ответ», каждая из которых
Data Science
обнаружение аномалий в данных датчиков автомобиля
00
Вопрос или проблема В настоящее время я углубляюсь в изучение аномалий в данных транспортных средств, генерируемых датчиками. Похоже, что нет подходящей книги или статьи, которые более детально охватывают эту тему. Надеюсь получить помощь в том, где и