text
Data Science
Вопрос или проблема У меня есть коллекция (около 1000) очень шумных, похожих документов, каждый из которых очень длинный (>10 страниц – 600 параграфов) с множеством подразделов – я хочу провести тематическое моделирование по документам, чтобы выявить ключевые темы.
Программное обеспечение
Вопрос или проблема Ищу программное обеспечение / инструмент для перемешивания алфавитов / символов в текстовом файле, Требования: используйте 1 пароль для перемешивания и восстановления правильный пароль восстановит текстовый файл в его оригинальную
Data Science
Вопрос или проблема Я ищу корпус компьютерных наук, специфичный для домена, содержащий не менее 20 миллионов слов (предпочтительно больше 50 миллионов слов), для обучения языковой модели. Есть ли что-то готовое, что я мог бы использовать?
Unix-подобные системы
Вопрос или проблема Я хочу добавить больше терминалов в файл /etc/securetty. Более конкретно, я хотел бы добавить pts/n, где n находится в диапазоне 0-9, если он не существует. Возможно ли это сделать с помощью команды sed? Ниже приведено содержимое моего
Программное обеспечение
Вопрос или проблема Я ищу программное обеспечение, которое позволит вам создавать город, похожий на то, что можно сделать в 3D AutoCAD выбирать аватары, чтобы разместить их внутри города (похожим образом, как в Sims в режиме редактирования, щелкать по
Unix-подобные системы
Вопрос или проблема При нажатии n Less пропускает все совпадения в текущей строке и переходит к следующей строке с совпадением (даже если строки обернуты). Как я могу заставить его перемещать курсор ко всем совпадениям в каждой строке?
Программное обеспечение
Вопрос или проблема У меня есть 10 000 PDF файлов на диске, и мне необходимо собрать следующие метаданные. Я пытался использовать wordstat, но не могу получить следующие данные: Имя файла Тип файла Тип актива Название актива Категория продукта Тип продукта
Программное обеспечение
Вопрос или проблема Я хотел бы программное обеспечение, которое, когда вы пишете текст на своей физической клавиатуре, будет предсказывать возможные слова, которые я могу написать. Желательно, чтобы я мог написать предсказанное слово только с помощью
Data Science
Вопрос или проблема Я пытаюсь подогнать модель с использованием генератора и получаю следующую ошибку: ValueError: Слой модели ожидает 2 входа, но получил 3 входных тензора. Полученные входы: [<tf.Tensor 'IteratorGetNext:0' shape=(None, None) dtype=float32>
Убунту
Вопрос или проблема Я пробовал перезагрузить компьютер, но он все равно остается испорченным. У меня нет представления, как ориентироваться в настройках за пределами значков – она также искажает мой пароль, он по-прежнему работает, но текст на моем
Вопросы и ответы
Вопрос или проблема Я пытаюсь преобразовать файл htm, содержащий текстовые таблицы, в датафрейм. Я посмотрел на предыдущие вопросы здесь и здесь, но не решил свою проблему. Таблица получается испорченной. Следующий воспроизводимый пример. # URL сайта url <
Убунту
Вопрос или проблема Хотел бы конвертировать текстовый файл в mp3 файл с помощью espeak. Это возможно сделать? Я пытаюсь использовать espeak, чтобы создать оболочку сценария синтеза песни, который может конвертировать текст в песню. Существует два способа сделать это;
Data Science
Вопрос или проблема Я хотел бы классифицировать тексты без использования каких-либо моделей машинного обучения. Моя идея состоит в том, чтобы составить список ключевых слов, которые я назначу каждой категории. Затем, когда мне нужно будет классифицировать
Убунту
Вопрос или проблема Когда я открываю документ в LibreOffice Writer, между каждым словом и в любом другом месте есть “пробел”, который серый вместо белого фона. Читать очень трудно. Вот пример. Я не могу понять, как убрать этот стиль форматирования.
Вопросы и ответы
Вопрос или проблема Я работаю над проектом, в котором я успешно обнаружил ячейки на табличном изображении, и в каждой ячейке я пытаюсь обнаружить написанные числа и тексты, но я уже много раз терпел неудачу, пробуя множество вариантов.
Data Science
Вопрос или проблема Привет, я работаю над классификацией текста в социальных медиа в финансовой сфере на тайском языке. Проблема заключается в путанице классов, неправильно классифицированные предсказания имеют последовательный паттерн как пара.
Программное обеспечение
Вопрос или проблема Меня интересует, как используются определенные символы Юникода. Я хочу инструмент, который позволит мне искать конкретный символ или кодовую точку, а затем покажет этот символ и некоторый соседний текст так, как он появляется в опубликованных электронных документах.
Data Science
Вопрос или проблема У меня есть набор данных из 5566 образцов – один столбец содержит текст описания рецепта, а другой – это налоговый класс. Я хочу создать классификатор, который будет классифицировать рецепты, используя только машинное обучение.
Вопросы и ответы
Вопрос или проблема Я читаю текст из множества PDF-документов с помощью следующего кода: import fitz import numpy as np import pandas as pd # открыть документ doc = fitz.open(filename_path) # получить текст с каждой страницы документа for idx, page in
Вопросы и ответы
Вопрос или проблема Я хочу обучить простую нейронную сеть, у которой embedding_dim является параметром: class BoolQNN(nn.Module): def __init__(self, embedding_dim): super(BoolQNN, self).__init__() self.fc1 = nn.Linear(embedding_dim, 64) self.