Data Science
Является ли Data Science незаконнорожденным dzieмом математики, статистики и информатики?
00
Вопрос или проблема Является ли дата-наука просто незаконнорожденным ребенком, заимствовавшим идеи из математики, статистики и компьютерных наук? То, что люди описывают как дата- science, всего лишь набор украденных идей из математики и статистики, на
Data Science
Как получить и загрузить хороший начальный набор данных для локализации объектов?
00
Вопрос или проблема Я ищу хороший набор данных для обучения сети на основе CNN для локализации объектов (т.е. набор данных с метками классов и данными ограничивающих прямоугольников). Какой хороший начальный набор данных можно использовать?
Программное обеспечение
Бесплатный и открытый просмотрщик файлов Parquet для Ubuntu
00
Вопрос или проблема Как указано в заголовке, я ищу простой просмотрщик файлов Parquet (с базовыми описаниями столбцов, типами и предварительным просмотром некоторых значений) на рабочем столе Ubuntu. Иногда я имею дело с некоторыми adhoc файлами.
Data Science
Кластеризация набора элементов с элементами в виде векторов признаков
00
Вопрос или проблема Мне нужно кластеризовать этот набор данных, в котором у меня есть дома и потребление воды в следующем виде: $$ House1 = (x_{1},x_{2}… x_{n});\\ House2 = (y_{1},y_{2}… y_{n});\\ House3 = (z_{1},z_{2}…
Data Science
Поиск предсказаний из 4 наборов данных
00
Вопрос или проблема Четвёртый набор данных содержит (train_data, test_data, previous_data и information_history_data). Цель состоит в том, чтобы найти рейтинг пользователя по кредиту в банке. Я запутался с первым шагом в этом процессе, потому что существует
Программное обеспечение
Инструмент сравнения файлов с достаточными эвристиками для сравнения структурированных данных, таких как XML, HTML, JSON и INI файлы.
00
Вопрос или проблема Программы для сравнения файлов, такие как WinMerge и WinMerge2011, отлично подходят для сравнения обычных, неструктурированных данных. Но для сравнения файлов, содержащих структурированные текстовые данные, такие как XML, HTML и JSON
Unix-подобные системы
Ускорение чтения большого количества файлов (случайное чтение)
00
Вопрос или проблема Я пытаюсь запустить bash-скрипт на всех xml-файлах в папке. После некоторых усилий я пришел к выводу, что узкое место, вероятно, заключается в чтении файлов, учитывая имена файлов. Мой скрипт, вероятно, работает достаточно быстро
Data Science
Разделение датафрейма на основе содержимого строк
00
Вопрос или проблема У меня есть датафрейм с 50000 строк и 5 столбцов. В столбце VarName есть два типа данных: 1 – DatiStatistica_CombiWeight, 2 – DatiStatistica_TargetWeight Я отфильтровал строки, содержащие DatiStatistica_TargetWeight Я хотел
Data Science
Исследовательский анализ данных на наборе, разделенном на победителей и проигравших
00
Вопрос или проблема У меня есть набор данных о характеристиках победителей теннисных турниров и о характеристиках проигравших: возраст_победителя, рейтинг_победителя / возраст_проигравшего, рейтинг_проигравшего Чтобы провести надлежащий EDA, мне нужно
Data Science
Низкоразмерные бинарные классификационные наборы данных
00
Вопрос или проблема Если кто-то хочет изучить аспекты нейронных сетей (например, в академической статье) и хочет экспериментировать с бинарной классификацией векторов в низкоразмерном пространстве (например, размерность = 2 или размерность < 6);
Data Science
Какой лучший подход к работе с пропущенными данными в наборе данных?
00
Вопрос или проблема У меня есть набор данных, содержащий пропущенные значения в некоторых столбцах. Я хотел бы знать, какой лучший подход для работы с этими недостающими данными. Следует ли мне удалять строки с пропущенными данными или заполнять отсутствующие
Data Science
Как мне агрегировать данные для построения модели? Я боюсь вычислить среднее средних.
00
Вопрос или проблема Здравствуйте, Спасибо, что нашли время помочь мне с этим. Я работаю с необработанным набором данных и нуждаюсь в руководстве по агрегации данных для построения модели, которая предсказывает значение столбца “
Data Science
В чем разница между сдвигом ковариат, сдвигом метки, сдвигом концепта, дрейфом концепта и сдвигом априорной вероятности?
00
Вопрос или проблема Как начинающему в MLOps, мне было трудно с некоторыми запутанными определениями. Насколько я понимаю, когда у нас есть классификатор или регрессор с функцией y = f(X): Covariate Shift означает изменение распределения независимых переменных
Программное обеспечение
Восстановление фотографий/видео на iPhone после удаления
00
Вопрос или проблема Произошла потеря важных фотографий и видео на Windows, которые были вручную перенесены с iPhone 6s на Windows. Какой инструмент для iPhone 4 и iPhone 6s лучше всего подходит для восстановления фотографий и видео?
Программное обеспечение
Инструмент для внутренней памяти iPhone, который работает
00
Вопрос или проблема Произошла потеря важных изображений и видео на Windows, которые были вручную перенесены с iPhone 6s на Windows. Какой инструмент для iPhone 4 и iPhone 6s лучше всего подходит для восстановления фотографий и видео?
Программное обеспечение
Лучший инструмент для управления внутренней памятью iPhone, который работает
00
Вопрос или проблема Произошла потеря важных фотографий и видео на Windows, которые были вручную перенесены с iPhone 6s на Windows. Какой инструмент для iPhone 4 и iPhone 6s лучше всего подходит для восстановления фотографий и видео?
Data Science
Как создать этот конвейер данных?
00
Вопрос или проблема У меня не так много опыта в области инженерии данных, поэтому я здесь, чтобы попросить совета. Я работаю над проектом, который заключается в создании панели управления для ИТ-отдела банка. Панель должна представлять информацию из логов.
Unix-подобные системы
Восстановление данных после сбоя жесткого диска
00
Вопрос или проблема Пару дней назад я попытался запустить один из моих старых серверов. Изначально он работал, но после обновления и перезагрузки системы несколько раз система отказалась загружаться, застряв на GRUB Rescue. Я вставил жесткий диск в другую
Data Science
Набор данных с несколькими вариантами ответов для дообучения
00
Вопрос или проблема Надеюсь, здесь можно задавать вопросы, но я ищу набор данных (формат не так важен), который похож на SQuAD, но также содержит ложные ответы на вопросы. Я хочу использовать его для дообучения GPT-3, и все, что я нахожу, это либо вопросы
Data Science
В какой степени чистая математика используется в анализе данных и машинном обучении?
00
Вопрос или проблема В какой мере чистая математика используется в области Data Science и машинного обучения? Я пришел из области чистой математики и недавно переключился на сферу Data Science. Однако я довольно разочарован, так как всё, что я делаю, –