Data Science
Как выбрать «лучший» алгоритм обучения без учителя для кластеризации моего конкретного набора данных?
00
Вопрос или проблема Я хочу кластеризовать набор данных без предварительного знания о правильном количестве кластеров. Для разных алгоритмов (например, k-means, GMM и т.д.) я могу перебирать различные значения и пытаться найти лучшее решение для любого
Data Science
Проблема вычисления коэффициента кликов (CTR)
00
Вопрос или проблема Итак, я выполняю практическое задание для собеседования в компании, и один из вопросов заключается в том, чтобы вычислить CTR для алгоритма сортировки. Мой вопрос: следует ли мне исключить операции, в которых не было показано никаких
Data Science
Деревья решений – C4.5 против CART – наборы правил
00
Вопрос или проблема Когда я читал руководство пользователя scikit-learn о деревьях решений, они упомянули, что CART (деревья классификации и регрессии) очень похож на C4.5, но отличается тем, что поддерживает числовые целевые переменные (регрессию) и
Data Science
Ищу лучший способ для расчета положительной доли суммы комбинаций.
00
Вопрос или проблема Предположим, у вас есть список из 10 чисел с плавающей точкой, и вы выбираете 5 чисел из этого списка и складываете их, чтобы сформировать новое число, генерируя все возможные комбинации, теперь у вас есть новый список размером C(10, 5).
Data Science
Какие алгоритмы доступны для определения коэффициентов сходства между двумя записями?
00
Вопрос или проблема У меня есть данные, которые выглядят так: priority task area 1 clean room living room 2 clean room living room 2 water plants bedroom Я хочу определить записи с приоритетом 2, которые должны иметь приоритет 1 на основе сходства между
Data Science
Разница в AUC между lgbm с использованием CPU и CUDA
00
Вопрос или проблема Я запускаю модель LightGBM (LGBM) с использованием Optuna для подбора гиперпараметров. Я заметил, что когда я обучаю модель на ЦП, я получаю разумные результаты, но когда переключаюсь на CUDA, результаты значительно отличаются, несмотря
Data Science
Как мне найти алгоритм или формулу?
00
Вопрос или проблема Существует ли программа, сервис в Интернете или пакет для Python, который поможет найти алгоритм, формулу, которые выявят закономерность в приведенной ниже последовательности? Алгоритм должен преобразовать значение слева в значение справа.
Программное обеспечение
Запуск торгового алгоритма – Локально против Облака
00
Вопрос или проблема Я ищу мнения трейдеров, которые реализовали алгоритмические торговые программы в облаке или на своих локальных рабочих станциях. Моя цель – определить наиболее эффективный, экономичный и масштабируемый вариант, который соответствует
Data Science
Адудосто – Показать, что корректировка весов приводит к ошибке текущей итерации к 0.5.
00
Вопрос или проблема Я пытаюсь решить следующую задачу, но застрял. Итак, для адебуст $err_t = \frac{\sum_{i=1}^{N}w_i \Pi (h_t(x^{(i)}) \neq t^{(i)})}{\sum_{i=1}^{N}w_i}$ и $\alpha_t = \frac{1}{2}ln(\frac{1-err_t}{err_t})$ Весы для следующей итерации равны $w_i’
Data Science
Какие алгоритмы машинного обучения могут быть использованы для классификации траекторий?
00
Вопрос или проблема Я работаю над проектом по кластеризации воздушных объектов на основе их траекторий. Я хотел бы обучить модель на наборе данных с траекториями различных летающих объектов, чтобы позже я мог предсказать, к какому типу объекта относится
Data Science
Рассчитайте 5 лучших оптимальных конфигураций шкафов для посылок.
00
Вопрос или проблема Дорогие участники сообщества Data Science, У меня есть следующая задача, которую нужно решить, и я хотел бы узнать, какой алгоритм или подход я могу использовать, чтобы с ней справиться. Я не ожидаю полного решения, но действительно
Data Science
Присвоение точек подогнанным плоскостям
00
Вопрос или проблема Я работаю над проектом, связанным с подгонкой плоскостей к 3D облакам точек. Часть, отвечающая за подгонку плоскостей, работает хорошо, но я пытаюсь определить лучший способ ограничить подогнанные плоскости данными точками, к которым они подходят.
Data Science
Руководство для модели распознавания изображений (для инвентаризации)
00
Вопрос или проблема У меня есть более 20,000 изображений произведений искусства (живопись, скульптуры, банки и т. д.), хранящихся в базе данных. Самие произведения распределены по нескольким складам. Идеально, чтобы физические предметы ДОЛЖНЫ были иметь
Data Science
Какие алгоритмы я должен использовать для определения схожих характеристик между данными (пересечения)?
00
Вопрос или проблема Я работаю с набором данных, который был закодирован и категоризирован, так что каждая точка данных имеет набор закодированных характеристик. Примером точки данных может быть что-то вроде следующего: Пример точки данных: Качество Обслуживание
Data Science
Классификации модели не соответствуют ожиданиям бизнеса или метрике “X”.
00
Вопрос или проблема Может ли это несоответствие быть вызвано стратегией порога? Если да, то как мне оптимизировать или скорректировать эти пороги? Как мне лучше согласовать результаты модели с бизнес-контекстом “X”
Data Science
Как классифицировать поведение при вождении (ускорение, торможение, поворот) с использованием 2D координат и скорости?
00
Вопрос или проблема Я работаю над проектом по классификации поведения водителей на основе данных о положении и скорости автомобиля. Для каждого временного шага у меня есть следующая информация: $x, y $ : Координаты положения в 2D-плоскости $V_x, V_y$
Data Science
Какой алгоритм машинного обучения лучше всего работает с текстовыми данными и почему? Также какие метрики используются для оценки производительности модели?
00
Вопрос или проблема Я работаю над проектом – «анализ настроений в твитах». Есть 5 различных настроений – крайнеNegative, негативное, нейтральное, положительное и крайне положительное. Так что это, в основном, задача обработки естественного
Data Science
Метрики LGBM равны 0.0
00
Вопрос или проблема Я нов в этой области и работаю над простой задачей обнаружения мошенничества с следующим распределением классов: Метка 0: 142,900 образцов Метка 1: 16,530 образцов Я обучаю модель LightGBM, используя Optuna для подбора гиперпараметров.
Data Science
Показ времени отклика на графике
00
Вопрос или проблема У меня есть несколько вычислительных устройств. Я использовал алгоритм для распределения нагрузки между этими устройствами. Есть центральный координатор, который контролирует нагрузку на каждое устройство, и если одно устройство перегружено
Data Science
Градиентный спуск сильно расходится.
00
Вопрос или проблема Я вручную создал случайный набор данных вокруг некоторого среднего значения и попытался использовать градиентный спуск для линейной регрессии, чтобы предсказать это простое среднее значение. Я сделал точно так же, как в руководстве