text
Data Science
Вопрос или проблема Я строю иерархический текстовый классификатор, используя подход Local Classifier Per Parent Node (LCPN) с политикой ‘siblings’, как описано в обзоре иерархической классификации в различных областях применения: Например
Data Science
Вопрос или проблема Я использую sklearn Tfifdfvectorizer для извлечения признаков из текста для классификации текста. Я считаю, что нужная мне информация, как правило, находится в начале документа, поэтому я хотел бы каким-то образом зафиксировать смещение
Программное обеспечение
Вопрос или проблема Кто-нибудь знает или использует (желательно бесплатные) инструменты или программы, которые позволяют искать в текстовых документах определенные слова и затем добавлять к ним идентификационный код для последующего анализа?
Unix-подобные системы
Вопрос или проблема Итак, я понимаю, что a2ps в основном предназначен для преобразования ASCII-кода в постскрипт для печати, но иногда я люблю печатать .txt или .md файл для школы. Часто целое предложение (или даже абзац) будет на одной строке, и a2ps
Unix-подобные системы
Вопрос или проблема Мне нужны файлы PDF в текстовом формате, чтобы я мог искать в них массово из командной строки. Существует ли какой-нибудь конвертер для Ubuntu, OBSD или аналогичного дистрибутива? Возможно, связанный пост, OCR с Ubuntu здесь.
Wordpress
Вопрос или проблема В моих одиночных записях WordPress я хочу применить отступ в 100 пикселей слева и справа. Проблема в том, что когда я применяю его к .single .post-content, изображения также получают отступ. Однако я хочу, чтобы все изображения на
Data Science
Вопрос или проблема У меня есть набор данных с 4 типами столбцов данных: числовой категориальный теги текст id 1 51585 27 [A, B, C, …] “Некоторый текст бла бла бла” 2 53596 27 [B, D, E] “Другой текст…
Unix-подобные системы
Вопрос или проблема Предположим, у меня есть входной текстовый файл (sample_simple.txt) следующего вида: 3 1 10 1 6 9 4 2 4 1 9 2 2 2 1 Используя команду: awk '$0=$1" "$1*$2" "$3*$4' sample_simple.txt, я получаю следующий вывод: 3 3 10 9 36 8 9 18 4 Затем
Data Science
Вопрос или проблема У меня есть набор данных, аналогичный newsgroup20, для классификации. С обучающим набором данных у меня есть набор данных словаря, который объясняет некоторые жаргоны в обучающем наборе данных. Эти два набора данных различны, так как
Unix-подобные системы
Вопрос или проблема POSIX определяет текстовый файл как “файл, который содержит символы, организованные в ноль или более строк”. Тем не менее, согласно определению строки в POSIX, существуют два возможных “типа”
Программное обеспечение
Вопрос или проблема Я общаюсь с многими клиентами каждый день, и ответ на часто задаваемые вопросы может стать для меня настоящей проблемой в долгосрочной перспективе. Я просто копирую из текстового файла, переключаюсь на другую вкладку и вставляю.
Wordpress
Вопрос или проблема Я искал во всех файлах WordPress фразу “результат поиска для“, которая отображается на странице результатов поиска (результат поиска для (ключевых слов)), но не смог её найти. Я хотел бы, чтобы было: “
Unix-подобные системы
Вопрос или проблема Существует ли что-то вроде ‘генератора lorem ipsum? Я знаю, что он есть в Latex и даже в LibreOffice, но я ищу команду для терминала. Я хотел бы ввести что-то вроде loremipsum 10 >> file1.txt, что дало бы мне первые 10
Убунту
Вопрос или проблема Я пытаюсь обновить устаревший выпуск Ubuntu (EOL) до поддерживаемой версии, следуя советам Ubuntu здесь. Я перехожу с Ubuntu 23.04 (Lunar Lobster) на 23.10 (Mantic Minotaur), используя специфичный для версии установщик здесь.
Unix-подобные системы
Вопрос или проблема Есть ли способ изменить скорость прокрутки текстовой консоли без перезагрузки? В настоящее время использую Fedora, но буду признателен за обходные решения, не привязанные к дистрибутиву. https://www.kernel.
Data Science
Вопрос или проблема Моя цель заключается в том, чтобы оценить различия в том, как пять политических партий используют моральные слова в своих твитах и речах. С этой целью я использую словарь, который применяю к каждому тексту твита / аудиотранскрипции
Убунту
Вопрос или проблема Я использую Ubuntu 10.04, и меня раздражает, что по умолчанию функциональность копирования/вставки также вставляет текстовый формат. Чаще всего, когда я копирую/вставляю текст, я хочу вставить только текст в формате ASCII без какого-либо форматирования.
Убунту
Вопрос или проблема <AppendNhere> A H W C <AppendNhere> A H W C <AppendNhere> A H W C Sed '/^/ i N' filename Я пытался добавить N с помощью этого, но N добавляется в начало новых строк, а не в начало существующих строк. Сначала вам нужно понять “
Data Science
Вопрос или проблема Предположим, у меня есть текстовый корпус с неконсистентно написанными биграммами. Примером может быть “би грам”, “би-грам”, “биграм”. Существует ли какой-либо стандартный метод предварительной обработки
Wordpress
Вопрос или проблема Я создал баннер на Canva для страницы с часто задаваемыми вопросами. Мне нравится шрифт, и теперь я хотел бы использовать его для заголовков и других элементов на одной странице. Шрифт – Aloja-Light, и мне удалось его скачать.