algorithms
Data Science
Вопрос или проблема Я хочу кластеризовать набор данных без предварительного знания о правильном количестве кластеров. Для разных алгоритмов (например, k-means, GMM и т.д.) я могу перебирать различные значения и пытаться найти лучшее решение для любого
Data Science
Вопрос или проблема Итак, я выполняю практическое задание для собеседования в компании, и один из вопросов заключается в том, чтобы вычислить CTR для алгоритма сортировки. Мой вопрос: следует ли мне исключить операции, в которых не было показано никаких
Data Science
Вопрос или проблема Когда я читал руководство пользователя scikit-learn о деревьях решений, они упомянули, что CART (деревья классификации и регрессии) очень похож на C4.5, но отличается тем, что поддерживает числовые целевые переменные (регрессию) и
Data Science
Вопрос или проблема Предположим, у вас есть список из 10 чисел с плавающей точкой, и вы выбираете 5 чисел из этого списка и складываете их, чтобы сформировать новое число, генерируя все возможные комбинации, теперь у вас есть новый список размером C(10, 5).
Data Science
Вопрос или проблема У меня есть данные, которые выглядят так: priority task area 1 clean room living room 2 clean room living room 2 water plants bedroom Я хочу определить записи с приоритетом 2, которые должны иметь приоритет 1 на основе сходства между
Data Science
Вопрос или проблема Я запускаю модель LightGBM (LGBM) с использованием Optuna для подбора гиперпараметров. Я заметил, что когда я обучаю модель на ЦП, я получаю разумные результаты, но когда переключаюсь на CUDA, результаты значительно отличаются, несмотря
Data Science
Вопрос или проблема Существует ли программа, сервис в Интернете или пакет для Python, который поможет найти алгоритм, формулу, которые выявят закономерность в приведенной ниже последовательности? Алгоритм должен преобразовать значение слева в значение справа.
Программное обеспечение
Вопрос или проблема Я ищу мнения трейдеров, которые реализовали алгоритмические торговые программы в облаке или на своих локальных рабочих станциях. Моя цель – определить наиболее эффективный, экономичный и масштабируемый вариант, который соответствует
Data Science
Вопрос или проблема Я пытаюсь решить следующую задачу, но застрял. Итак, для адебуст $err_t = \frac{\sum_{i=1}^{N}w_i \Pi (h_t(x^{(i)}) \neq t^{(i)})}{\sum_{i=1}^{N}w_i}$ и $\alpha_t = \frac{1}{2}ln(\frac{1-err_t}{err_t})$ Весы для следующей итерации равны $w_i’
Data Science
Вопрос или проблема Я работаю над проектом по кластеризации воздушных объектов на основе их траекторий. Я хотел бы обучить модель на наборе данных с траекториями различных летающих объектов, чтобы позже я мог предсказать, к какому типу объекта относится
Data Science
Вопрос или проблема Дорогие участники сообщества Data Science, У меня есть следующая задача, которую нужно решить, и я хотел бы узнать, какой алгоритм или подход я могу использовать, чтобы с ней справиться. Я не ожидаю полного решения, но действительно
Data Science
Вопрос или проблема Я работаю над проектом, связанным с подгонкой плоскостей к 3D облакам точек. Часть, отвечающая за подгонку плоскостей, работает хорошо, но я пытаюсь определить лучший способ ограничить подогнанные плоскости данными точками, к которым они подходят.
Data Science
Вопрос или проблема У меня есть более 20,000 изображений произведений искусства (живопись, скульптуры, банки и т. д.), хранящихся в базе данных. Самие произведения распределены по нескольким складам. Идеально, чтобы физические предметы ДОЛЖНЫ были иметь
Data Science
Вопрос или проблема Я работаю с набором данных, который был закодирован и категоризирован, так что каждая точка данных имеет набор закодированных характеристик. Примером точки данных может быть что-то вроде следующего: Пример точки данных: Качество Обслуживание
Data Science
Вопрос или проблема Может ли это несоответствие быть вызвано стратегией порога? Если да, то как мне оптимизировать или скорректировать эти пороги? Как мне лучше согласовать результаты модели с бизнес-контекстом “X”
Data Science
Вопрос или проблема Я работаю над проектом по классификации поведения водителей на основе данных о положении и скорости автомобиля. Для каждого временного шага у меня есть следующая информация: $x, y $ : Координаты положения в 2D-плоскости $V_x, V_y$
Data Science
Вопрос или проблема Я работаю над проектом – «анализ настроений в твитах». Есть 5 различных настроений – крайнеNegative, негативное, нейтральное, положительное и крайне положительное. Так что это, в основном, задача обработки естественного
Data Science
Вопрос или проблема Я нов в этой области и работаю над простой задачей обнаружения мошенничества с следующим распределением классов: Метка 0: 142,900 образцов Метка 1: 16,530 образцов Я обучаю модель LightGBM, используя Optuna для подбора гиперпараметров.
Data Science
Вопрос или проблема У меня есть несколько вычислительных устройств. Я использовал алгоритм для распределения нагрузки между этими устройствами. Есть центральный координатор, который контролирует нагрузку на каждое устройство, и если одно устройство перегружено
Data Science
Вопрос или проблема Я вручную создал случайный набор данных вокруг некоторого среднего значения и попытался использовать градиентный спуск для линейной регрессии, чтобы предсказать это простое среднее значение. Я сделал точно так же, как в руководстве