Data Science
Как понять возвращаемые значения scipy.interpolate.splrep
00
Вопрос или проблема Фон Продолжение Интерполяция сплайнами – почему куб с производной второго порядка, следуя Кубическая интерполяция сплайнами на YouTube. Пример из YouTube приведен ниже. Реализовано с использованием scipy.
Data Science
Как обучить модель для оценки коэффициентов связанных ОДУ?
00
Вопрос или проблема Рассмотрите следующую систему связных ОДУ (уравнения Лотки-Вольтерра): $$ \frac{dx}{dt} = \alpha x – \beta x y, \\ \frac{dy}{dt} = – \gamma y + \delta x y , $$ Как я могу обучить модель для оценивания положительных параметров
Data Science
scipy bootstrap генерирует входные данные с неконсистентным количеством образцов
00
Вопрос или проблема У меня есть набор данных из 77 образцов, и я использую scipy bootstrap, чтобы получить доверительный интервал для оценки точности. Я озадачен тем, что вижу, как он генерирует входные переменные с неконсистентным количеством образцов
Data Science
Решить нелинейную систему на Python с помощью алгоритма ГАУССА-НЬЮТОНА? (Матрица Якоби J и т.д.)
00
Вопрос или проблема Я хотел бы решить нелинейную систему (которая содержит голы футбольной команды в предыдущих матчах) с использованием алгоритма Гаусса-Ньютона, чтобы найти параметр (частоты), который будет использоваться в качестве лямбда в упрощенном
Data Science
Векторизовать scipy.stats.norm.logpdf
00
Вопрос или проблема Я пытаюсь обучить байесовскую нейронную сеть, и в какой-то момент мне нужно вычислить логарифмическую вероятность для некоторых данных в соответствии с многомерным диагональным нормальным распределением с параметрами (mu, sigma).
Data Science
Указание и подгонка пользовательского распределения к данным
00
Вопрос или проблема У меня есть набор данных измерений $Y$, к которому я хочу применить пользовательское распределение, чтобы получить оценку параметров распределения. Основываясь на знаниях предметной области, я знаю, что процесс, генерирующий $Y$, представляет
Data Science
задача оптимизации линейного программирования на Python
01
Вопрос или проблема У меня есть следующий DataFrame pandas, который представляет потребление за 7 дней (day_0 — это сегодня, day_-1 — это вчера и т.д.) 10 людей (ids): import pandas as pd import numpy as np df = pd.DataFrame(np.
Data Science
Инкрементный алгоритм кластеризации
01
Вопрос или проблема Я ищу инкрементный алгоритм кластеризации. Под инкрементным я понимаю алгоритм, который строит кластеры, начиная с начального набора данных и который способен постепенно добавлять новые элементы/наблюдения, добавляя их к существующим или новым кластерам.
Data Science
Тест Крамера-Армана требует слишком много ресурсов.
00
Вопрос или проблема Я занимаюсь анализом данных и использую тест Крамера — фон Мизеса, чтобы проверить, происходят ли две выборки из одного распределения. Я использую реализацию cramervonmises_2samp из scipy.stats. Изначально, выборки, которые я использовал
Data Science
Как правильно вычислить коэффициент корреляции значения столбца из таблицы в Python 3?
00
Вопрос или проблема У меня есть таблица данных о ежедневных значениях за последние 2 года, которая выглядит следующим образом, и мне нужно рассчитать корреляции между данными в Python. У меня нет опыта в области науки о данных, поэтому я боюсь, что мои
Data Science
Множественные гипотезы в Python
00
Вопрос или проблема Я хочу написать метод для тестирования нескольких гипотез для пары школ (скажем, TAMU и UT Austin). Я хочу рассмотреть все возможные пары слов (Исследование, Тезис, Предложение, ИИ, Аналитика) и протестировать гипотезу о том, что количество
Data Science
Эвристики для иерархической кластеризации с пользовательской функцией связи
00
Вопрос или проблема Я создал свою собственную функцию связывания для SciPy и хочу добавить эвристику. Я кластеризую последовательности json, и, например, если один кластер достаточно велик (скажем, 20 json), а другой меньше (скажем, 2 json), я бы предпочел
Вопросы и ответы
Интерполяция данных емкости батареи в логарифмической шкале с использованием Python
00
Вопрос или проблема Я работаю над интерполяцией данных емкости батареи на основе взаимосвязей между hour_rates, capacities и currents. Вот образец моих данных: import numpy as np import pandas as pd from scipy.interpolate import interp1d import matplotlib.
Вопросы и ответы
Свертка дискретизированных функций
00
Вопрос или проблема Я хотел бы выполнить свертку функций (в математическом смысле) с использованием функций свертки scipy, но, похоже, это дает результаты, отличающиеся от ожидаемых. Сначала я определяю сетку точек: def generate_square_mesh(num_points=50): x = np.
Вопросы и ответы
Добавление двумерных массивов numpy с различными осями: как правильно заменить устаревшую interp2d на RectBivariateSpline?
00
Вопрос или проблема Мне нужно сложить два двумерных массива numpy, которые могут иметь разные формы и разные соответствующие массивы осей. Что я имею в виду: давайте определим два разных набора осей x и y, и рассчитаем значения z в соответствии с какой-либо
Data Science
Как я могу распечатать данные после подгонки данных в конвейере?
00
Вопрос или проблема Я использовал 3 функции из scipy: TFIDF векторизатор, Мультивыходной классификатор и Линейный SVC. Код выглядит так. pipe_lr1 = Pipeline(steps=[('cv',TfidfVectorizer()), ('lr_multi',MultiOutputClassifier(LinearSVC()))]) Как я могу
Вопросы и ответы
Сборка Scipy из исходников для Windows Arm64 заканчивается ошибками линковки lld.
00
Вопрос или проблема я использую сборку scipy из исходников Во время выполнения python -m pip install -r requirements/build.txt -r requirements/dev.txt matplotlib выдает ошибку. llvm 18.1.0rc Я собрал Openblas из исходников для arm64, указал путь в переменной
Data Science
Какой лучший алгоритм для извлечения сущностей из неструктурированного документа?
00
Вопрос или проблема У меня есть неструктурированные документы, из которых мне нужно извлечь такие данные, как имя покупателя, имя продавца, дата истечения срока, дата покупки и т. д. Я планировал использовать spacy (кастомная идентификация сущностей (следуя
Data Science
Дендограмма: ValueError: Истинностное значение серии неоднозначно. Используйте a.empty, a.bool(), a.item(), a.any() или a.all()
00
Вопрос или проблема Я пытаюсь построить дентрограмму для кластеризации данных, но эта ошибка мешает мне. Мои данные здесь. Сначала я выбрал столбцы для работы: df_euro = pd.read_csv('https://assets.datacamp.com/production/repositories/655/datasets/2a1f3ab7bcc76eef1b8e1eb29afbd54c4ebf86f2/eurovision-2016.
Data Science
Сcurve_fit Scipy и метод “dogbox”
00
Вопрос или проблема Я пытаюсь воспроизвести в этом исследовании1 инженерию признаков для активности пользователей. Они используют 14 дней накопленной активности пользователей и сохраняют параметры (2 параметра), которые соответствуют сигмоиде.