Data Science
Data Science
Вопрос или проблема Я хотел бы сравнить изображения двух веб-страниц, используя техники компьютерного зрения. Покажите, какие части не уникальны при сравнении обоих изображений. Какая часть изображения 1 отсутствует в изображении 2, и наоборот.
Data Science
Вопрос или проблема Я читал Главу 14 Ответы на вопросы, Поиск информации и RAG книги Юрафски, конкретно раздел о оценке документов, где упоминался Okapi BM25. Я понял предыдущее вычисление и объяснение tf-idf, но не понимаю эту фразу, выделенную магентовым цветом. …
Data Science
Вопрос или проблема У меня есть следующий датафрейм df атлетов (индексированный по Athlete_ID) и их рангу (индексированный по Rank), вот слайд датафрейма с конкретным атлетом: Rank Athlete_ID Date 13 143 25/4/2021 1 143 5/4/2021 6 143 24/2/2021 11 143
Data Science
Вопрос или проблема У меня есть данные для насосов, которые имеют один или несколько датчиков для записи давления воздуха. Помимо sensor_id и timestamp, есть три числовых переменных: current_air_pressure, min_air_pressure и max_air_pressure, и показания
Data Science
Вопрос или проблема Я работаю над прогнозированием многомерного временного ряда, используя несколько алгоритмов машинного обучения (нейронные сети, метод опорных векторов и алгоритмы градиентного бустинга). Мне нужно измерить производительность каждой модели.
Data Science
Вопрос или проблема В «Фламинго: визуальная языковая модель для обучения с небольшим количеством примеров» (Alayrac et al., 2022) https://arxiv.org/abs/2204.14198 DeepMind использует «обучаемые латентные запросы» в своем «Персевер ресемплере», чтобы гарантировать
Data Science
Вопрос или проблема В чисто образовательных целях моя цель – реализовать базовую архитектуру Transformer с нуля. До сих пор я сосредоточился на энкодере для классификационных задач и предположил, что все образцы в пакете имеют одинаковую длину.
Data Science
Вопрос или проблема Когда я пытаюсь выполнить sns.heatmap(df.corr(),annot=True) этот код в своем Jupyter ноутбуке, возникает эта ошибка. Я не понимаю, в чем проблема. Пожалуйста, помогите мне. Для df.corr() вам нужно передать значения типа float/целое число вместо строки.
Data Science
Вопрос или проблема Я работаю над исследовательской работой о надежной схеме агрегации федеративного обучения для защиты от атакующих. У меня есть 1D массив оценок доверия для клиентов, и мне нужно сгруппировать их, чтобы выявить честных клиентов (с наивысшими оценками).
Data Science
Вопрос или проблема У меня есть набор данных о ценах на дома и соответствующих характеристиках (комнаты, квадратные метры и т.д.). Дополнительной характеристикой является дата продажи дома. Цель состоит в том, чтобы создать модель, которая могла бы оценить
Data Science
Вопрос или проблема Я работаю над реализацией алгоритма классификации Наивного Байеса. У меня есть метод def prob_continous_value, который должен возвращать функцию плотности вероятности для атрибута, заданного классовым атрибутом.
Data Science
Вопрос или проблема Я относительно новичок в машинном обучении, и любые предложения и исправления кода будут большой помощью. Я использую Lasso для отбора признаков и хочу выбрать лямбда, которая обеспечивает наименьшую ошибку.
Data Science
Вопрос или проблема В математике вектор имеет как величину, так и направление. В области Data Science для определения схожести документов мы преобразуем документ в вектор признаков. Затем применяем формулу косинусного угла между вектором признаков исходного и целевого документа.
Data Science
Вопрос или проблема Я работаю с набором данных, который, помимо возраста и дохода клиентов, показывает баланс, который есть у клиента на различных типах банковских счетов: расчетные, акции, инвестиции, сбережения, депозиты, ипотека, кредит и сертификаты.
Data Science
Вопрос или проблема У меня есть переменная цвета с значениями для различных товаров электронной коммерции, таких как – оливковый, бирюзовый, синий, зеленый и т.д. Я хочу сгруппировать эти цвета по основным цветовым значениям. Например –
Data Science
Вопрос или проблема Предположим, у меня есть текстовый корпус с неконсистентно написанными биграммами. Примером может быть “би грам”, “би-грам”, “биграм”. Существует ли какой-либо стандартный метод предварительной обработки
Data Science
Вопрос или проблема Я не совсем уверен, как мне следует настраивать xgboost, прежде чем использовать его в качестве мета-обучающего в ансамблевом обучении. Должен ли я включать матрицу предсказаний (то есть df, содержащий столбцы результатов предсказаний
Data Science
Вопрос или проблема В настоящее время я работаю над проектом, который основывается на кластеризации документов в неопределенное количество кластеров на основе порога схожести (в идеале с использованием косинусного расстояния между векторами tf-idf).
Data Science
Вопрос или проблема У меня есть идея проекта, в котором я обучаю множество документов с помощью Doc2Vec, а затем беру роман, входящий в документ, и в идеале могу узнать, насколько он похож на документы, предоставленные для обучения в целом, или насколько хорошо он “
Data Science
Вопрос или проблема Во время обучения моей нейронной сети я наблюдаю следующее поведение: крайне нестабильные значения потерь на валидации, в то время как потери на обучении steadily уменьшаются. потери на обучении уменьшаются очень медленно (не характерная