Data Science
Как создать групповые идентификаторы для людей в продольных данных
00
Вопрос или проблема У меня есть большой набор данных, содержащий информацию о людях и адресах, по которым они проживают. Я хочу создать идентификатор домохозяйства на основе общих адресов (рабочая идея: люди, которые проживают по одному и тому же адресу
Data Science
Как увеличить количество выбросов в наборе данных?
00
Вопрос или проблема У меня есть набор данных с 1000 строками и 4 колонками с 3 выбросами. Я хочу добавить еще 7 выбросов, связанных с ними, для обнаружения при помощи кластеризации. Пример того, что я сделал Col1 col2 Col3 col4 Out1 a1 b1 c1 d1 Out2 a2
Data Science
KLMS в машинном обучении
00
Вопрос или проблема Поскольку метод наименьших средних квадратов является очень популярным выбором для использования в комбинации с топологиями нейронных сетей, какие алгоритмы машинного обучения (и легко) можно комбинировать с Kernel Least Mean Square?
Data Science
Помощь с глубоким обучением для инспекции мотоциклов
00
Вопрос или проблема Прежде всего, я очень нов в машинном обучении иData science, поэтому мне очень жаль, если мой вопрос совершенно глупый. Я проходил стажировку в области машинного зрения, и люди в моем офисе хотят, чтобы я реализовал модель глубокого
Data Science
Как улучшить точность в следующем коде?
00
Вопрос или проблема Я имею около 43 различных категорий изображений дорожных знаков. Если я использую небольшие данные из 3 категорий, максимальная точность, которую я получаю, составляет около 65%, и я пробовал много различных значений слоев, а также
Data Science
Как улучшить идентификацию выбросов для удаления
00
Вопрос или проблема У меня есть много наборов данных, где измеренное значение либо «нормальное» (т.е. процесс работает), либо аномальное (т.е. процесс не работает). К сожалению, у меня нет измерений, которые ясно указывают на то, что процесс работает
Data Science
Построить несколько catplot из датафрейма
00
Вопрос или проблема У меня есть датафрейм, и я хочу построить несколько категориальных графиков. Я хочу использовать цикл, но не знаю, как его реализовать. Есть примеры? { DF = pd.DataFrame(feat[["click", "hour", "banner_pos", "site_category", "app_category"]]) sb.
Data Science
Как использовать несколько адаптеров с предобученной моделью в Hugging Face Transformers для вывода?
00
Вопрос или проблема У меня есть предобученная модель Llama-2 в директории models_hf и два адаптера с дообучением: адаптер для обобщения в ./tmp/llama-output и чат-адаптер в ./tmp/chat_adapter. Подробности кода находятся в другом вопросе.
Data Science
Как обрабатывать неопределенные или нулевые данные в нейронной сети
00
Вопрос или проблема Позвольте мне начать этот пост с того, что я невероятно нов в области машинного обучения/нейронных сетей. В настоящее время я работаю над классификационной нейронной сетью, использующей TensorFlow, где входные данные представляют собой
Data Science
Как мне сгруппировать похожие виды навыков вместе?
00
Вопрос или проблема Предположим, что у меня есть файл, в котором содержатся тысячи навыков от A до Z. Теперь я хотел бы создать модель, которая сможет группировать похожие навыки вместе (например, нейронная сеть и SVM могут группировать вместе).
Data Science
Обучение по многомерным данным
00
Вопрос или проблема У меня есть следующая задача: тренировочная программа на протяжении 3 дней для прогнозирования 4-го дня. Каждодневные данные представлены в виде одного CSV файла с размерами 24×25. Каждая точка данных в каждом CSV файле соответствует пикселю.
Data Science
Наиболее надежный метод нормализации и обработки популярности в совместном появлении элементов?
00
Вопрос или проблема В разделе 19.4 сайта https://animlbook.com/recommender_systems/recommendation/index.html предлагается матрица со-occurence, а схожесть Джаккара является одним из предложенных методов нормализации. Другие распространенные методы нормализации –
Data Science
Какие статистические наборы следует использовать для сравнения 2 дихотомических переменных?
00
Вопрос или проблема У вас есть модель машинного обучения, которая выдает 100 000 из миллиона наблюдений двоичного переменного 0 или 1. Вы хотите проверить, является ли распределение выданных 100 000 наблюдений модели аналогичным миллиону.
Data Science
Что означает ‘v’ в GoogLeNet?
00
Вопрос или проблема В GoogLeNet (по этой ссылке) есть обозначение ‘v’ на рисунке 3, как ‘1X1+1(v)’. Я не знаю, что означает ‘v’. Кроме того, я понял ‘s’ как шаг. Но я не знаю, почему в ‘
Data Science
Как создать классификационные деревья решений на наборе данных, содержащем как числовые, так и категориальные переменные?
00
Вопрос или проблема Я довольно нов в области Data Science и изучаю вещи на практике на работе. Я аналитик по мошенничеству, и моя работа заключается в том, чтобы предсказать, является ли заявление мошенническим или нет, исходя из данных.
Data Science
Использование временных рядов для предсказания другой переменной.
00
Вопрос или проблема Я хотел бы проанализировать данные о вращении головы в пространстве. Для этого я измерял вращение вокруг углов X, Y и Z с частотой 15 Гц в течение чуть больше десяти минут. Я хотел бы использовать эти движения, чтобы проанализировать
Data Science
Как передавать входные данные в модели глубокого обучения для задачи ответа на множественный выбор?
00
Вопрос или проблема В настоящее время я работаю над системой ответов на вопросы с множественным выбором. Обучающая выборка состоит из вопроса, ответа и 4 вариантов, и мне нужно предсказать правильный ответ среди 4 вариантов. Иногда есть и один абзац, например: 1.
Data Science
Какой статистический тест лучше всего подходит для сравнения дихотомических переменных?
00
Вопрос или проблема Вы имеете модель ML, которая выдает 100 000 из миллиона наблюдений дихотомической переменной 0 или 1. Вы хотите узнать, схожа ли распределение выведенных 100 000 наблюдений модели с 1 миллионом. Вы применяете модель 3 раза, назовем
Data Science
Обучение fasttext на собственном корпусе
00
Вопрос или проблема Я хочу обучить fasttext на своей собственной корпусе. Однако у меня есть маленький вопрос перед продолжением. Нужно ли мне каждое предложение как отдельный элемент в корпусе, или я могу иметь много предложений как один элемент?
Data Science
Симуляция данных с использованием make_classification в Python
00
Вопрос или проблема У меня есть вопрос о моделировании данных в Python. Я занимаюсь классификацией несбалансированных данных и хочу протестировать эффективность различных методов на смоделированных данных. Я видел в различных статьях и книгах, что функция