Data Science
Алгоритмы оценки глубины без эталонного изображения в компьютерном зрении для видео данных, захваченных веб-камерой, о человеке.
00
Вопрос или проблема В настоящее время я работаю над проектом в области компьютерного зрения, который включает в себя анализ видео данных человека, захваченных с помощью веб-камеры. В этом проекте мне нужно вычислить карту глубины или расстояние определенного
Data Science
Должна ли временная серия быть стационарной перед проведением кластерного анализа?
00
Вопрос или проблема Для анализа временных рядов и прогнозирования мы стараемся сделать временные ряды стационарными перед тем, как проводить эксперимент. Я хотел бы знать, необходима ли такая процедура, если работать над задачей неконтролируемого обучения
Data Science
Поиск реализации Faster RCNN
00
Вопрос или проблема Какие из известных вам реализаций Faster RCNN являются наилучшими по написанию и структурированию? Пожалуйста, предоставьте ссылки. Если вы знакомы с Tensorflow, вы можете обратиться к Tensorflow Object Detection API.
Data Science
Измените форму с помощью array_reshape
00
Вопрос или проблема Я новичок в CNN, и я пытался изменить несколько изображений для распознавания изображений, но постоянно получаю сообщение об ошибке, которое не знаю, как исправить. library(keras) reticulate::install_miniconda() for (i in 1:10) {mypic[[i]] <
Data Science
Доброта на тестовом или обучающем наборе?
00
Вопрос или проблема Я разделил свой набор данных на обучающую (80%) и тестовую (20%) выборки. Обучил модель логистической регрессии на обучающем наборе. Теперь хочу проверить адекватность модели с помощью хи-квадрат теста на согласие, на каком наборе
Data Science
Кластеризация для разреженной матрицы данных высокой размерности
00
Вопрос или проблема У меня есть набор данных из 1000 записей с 512 разреженными признаками. Я хочу сгруппировать их. Я пытался использовать алгоритм k-means, но обнаружил, что кластеризация оказалась не очень хорошей, и я смотрел на другие методы кластеризации
Data Science
Способ инициализации векторного представления предложений для несп supervised кластеризации текста, лучше чем GloVe wordvec?
00
Вопрос или проблема Для неконтролируемой кластеризации текста ключевым моментом является начальноеembedding для текста. Если мы хотим использовать deepcluster для текста, проблема для текста заключается в том, как получить начальноеembedding из глубокой модели.
Data Science
Сравнение работы сети с тройной потерей и многоклассовой классификации
00
Вопрос или проблема Я обучаю сеть классификации на основе тройного потерь и обычную сеть многоклассовой классификации на основе некоторых изображений. В моем случае сеть с тройным потерями работает хуже, чем многоклассовая сеть.
Data Science
Использование SVM для классификации аудиоданных
00
Вопрос или проблема Если бы у меня было 1000 аудиофайлов, где три человека независимо говорят название животного одновременно, может быть 9 независимых меток животных. Какие характеристики я должен выбрать из аудиофайла, и как мне их нормализовать, чтобы
Data Science
Метки как признаки в детекции аномалий
00
Вопрос или проблема У меня есть набор данных, созданный для решения задачи классификации. Из-за дисбаланса Y я решил перейти к задаче обнаружения аномалий. Должен ли я использовать Y, который у меня есть внутри модели обнаружения аномалий, в качестве признаков?
Data Science
Тонкая настройка с использованием предобученной модели всегда лучше, чем обучение с нуля?
00
Вопрос или проблема В худшем случае мы можем считать предварительно обученные веса случайной инициализацией, такой же, как если бы мы обучали модель с нуля, верно? Если это так, разве не было бы лучше всегда начинать с предварительно обученной модели
Data Science
реализовать кластер dask с prophet
00
Вопрос или проблема Я пытаюсь реализовать dask. В данный момент я использую joblib, и он работает отлично, использует весь ЦП, что, на мой взгляд, идеально, но я хочу добавить больше ресурсов. Теперь, пытаясь реализовать dask, это идет гораздо медленнее
Data Science
инвертированный маятник REINFORCE
00
Вопрос или проблема Я изучаю обучение с подкреплением, и в качестве практики я пытаюсь стабилизировать инвертированный маятник (gym: Pendulum-v0) в прямом положении, используя градиент политики: REINFORCE. У меня есть несколько вопросов, пожалуйста, помогите
Data Science
Классификация последовательных данных
00
Вопрос или проблема В настоящее время я пытаюсь классифицировать дискретные последовательные данные на пять классов с помощью машинного обучения. Настройка следующая: Фактический объект заполнен различными свойствами, но для разделения объектов и назначения
Data Science
Плохая работа архитектуры кодировщика-декодировщика на основе внимания для заполнения слотов
00
Вопрос или проблема В настоящее время я провожу исследование методов, которые решают проблемы классификации намерений и заполнения слотов в NLP. Одним из подходов, с которым я решил начать эксперименты, предложен в следующей статье: https://arxiv.
Data Science
Разница между феноменом двойного спада и доброкачественным переобучением
00
Вопрос или проблема Я пытаюсь понять разницу между феноменом двойного спуска и доброкачественным переобучением. Двойной спад возникает в модели, когда ошибка на тестах возрастает с увеличением сложности модели после определенной точки, а затем снова уменьшается
Data Science
Структура проекта – многие проекты используют один и тот же большой набор данных.
00
Вопрос или проблема У меня есть множество проектов для работы, которые в значительной степени не связаны друг с другом, за исключением того, что они используют одни и те же данные, которые занимают довольно много места на диске в формате csv.
Data Science
Что такое метод сглаживания “интерполированное абсолютное дисконтирование”?
00
Вопрос или проблема Меня просят реализовать “Интерполированное Абсолютное Скидка” для биграммной языковой модели для текста. Во-первых, я не знаю, что это такое. Я предполагаю, что это интерполяция между разными n-граммами (униграммами, биграммами и т.
Data Science
Прогнозирование последовательности в наборе данных родитель-ребенок
00
Вопрос или проблема У нас есть большая коллекция документов (D), каждый из которых сопровождается набором метаданных (M). В этой коллекции некоторые документы являются родительскими и имеют несколько дочерних документов. Как родительские, так и дочерние
Data Science
Не удается подогнать ИНС к “простому” набору данных?
00
Вопрос или проблема Мне действительно трудно смоделировать набор данных, который я получил, проводя эксперименты. Конкретно это временные ряды (онлайн) данных измерений, а целевые параметры – это кинетические параметры, которые я подгонял под каждый