Data Science
Как правильно вычислить коэффициент корреляции значения столбца из таблицы в Python 3?
00
Вопрос или проблема У меня есть таблица данных о ежедневных значениях за последние 2 года, которая выглядит следующим образом, и мне нужно рассчитать корреляции между данными в Python. У меня нет опыта в области науки о данных, поэтому я боюсь, что мои
Data Science
Множественные гипотезы в Python
00
Вопрос или проблема Я хочу написать метод для тестирования нескольких гипотез для пары школ (скажем, TAMU и UT Austin). Я хочу рассмотреть все возможные пары слов (Исследование, Тезис, Предложение, ИИ, Аналитика) и протестировать гипотезу о том, что количество
Data Science
Эвристики для иерархической кластеризации с пользовательской функцией связи
00
Вопрос или проблема Я создал свою собственную функцию связывания для SciPy и хочу добавить эвристику. Я кластеризую последовательности json, и, например, если один кластер достаточно велик (скажем, 20 json), а другой меньше (скажем, 2 json), я бы предпочел
Вопросы и ответы
Интерполяция данных емкости батареи в логарифмической шкале с использованием Python
00
Вопрос или проблема Я работаю над интерполяцией данных емкости батареи на основе взаимосвязей между hour_rates, capacities и currents. Вот образец моих данных: import numpy as np import pandas as pd from scipy.interpolate import interp1d import matplotlib.
Вопросы и ответы
Свертка дискретизированных функций
00
Вопрос или проблема Я хотел бы выполнить свертку функций (в математическом смысле) с использованием функций свертки scipy, но, похоже, это дает результаты, отличающиеся от ожидаемых. Сначала я определяю сетку точек: def generate_square_mesh(num_points=50): x = np.
Вопросы и ответы
Добавление двумерных массивов numpy с различными осями: как правильно заменить устаревшую interp2d на RectBivariateSpline?
00
Вопрос или проблема Мне нужно сложить два двумерных массива numpy, которые могут иметь разные формы и разные соответствующие массивы осей. Что я имею в виду: давайте определим два разных набора осей x и y, и рассчитаем значения z в соответствии с какой-либо
Data Science
Как я могу распечатать данные после подгонки данных в конвейере?
00
Вопрос или проблема Я использовал 3 функции из scipy: TFIDF векторизатор, Мультивыходной классификатор и Линейный SVC. Код выглядит так. pipe_lr1 = Pipeline(steps=[('cv',TfidfVectorizer()), ('lr_multi',MultiOutputClassifier(LinearSVC()))]) Как я могу
Вопросы и ответы
Сборка Scipy из исходников для Windows Arm64 заканчивается ошибками линковки lld.
00
Вопрос или проблема я использую сборку scipy из исходников Во время выполнения python -m pip install -r requirements/build.txt -r requirements/dev.txt matplotlib выдает ошибку. llvm 18.1.0rc Я собрал Openblas из исходников для arm64, указал путь в переменной
Data Science
Какой лучший алгоритм для извлечения сущностей из неструктурированного документа?
00
Вопрос или проблема У меня есть неструктурированные документы, из которых мне нужно извлечь такие данные, как имя покупателя, имя продавца, дата истечения срока, дата покупки и т. д. Я планировал использовать spacy (кастомная идентификация сущностей (следуя
Data Science
Дендограмма: ValueError: Истинностное значение серии неоднозначно. Используйте a.empty, a.bool(), a.item(), a.any() или a.all()
00
Вопрос или проблема Я пытаюсь построить дентрограмму для кластеризации данных, но эта ошибка мешает мне. Мои данные здесь. Сначала я выбрал столбцы для работы: df_euro = pd.read_csv('https://assets.datacamp.com/production/repositories/655/datasets/2a1f3ab7bcc76eef1b8e1eb29afbd54c4ebf86f2/eurovision-2016.
Data Science
Сcurve_fit Scipy и метод “dogbox”
00
Вопрос или проблема Я пытаюсь воспроизвести в этом исследовании1 инженерию признаков для активности пользователей. Они используют 14 дней накопленной активности пользователей и сохраняют параметры (2 параметра), которые соответствуют сигмоиде.
Вопросы и ответы
scipy.optimize.curve_fit перестал работать после нескольких итераций
00
Вопрос или проблема —– обновления 2: Когда я застрял здесь, я также обновил свои коды на использование optuna – и, похоже, optuna работает лучше, чем curve_fit. —– обновления 1: Проблема была связана с “
Data Science
Агломеративная кластеризация с ограничениями на минимальный и максимальный размер кластеров
00
Вопрос или проблема Существуют ли пакеты Python, которые содержат алгоритмы агломеративной кластеризации с встроенными ограничениями на минимальный и максимальный размер кластеров? Я нашёл отличный пакет под названием KMeansConstrained, но, к сожалению