text
Data Science
Вопрос или проблема Я пытаюсь подогнать модель с использованием генератора и получаю следующую ошибку: ValueError: Слой модели ожидает 2 входа, но получил 3 входных тензора. Полученные входы: [<tf.Tensor 'IteratorGetNext:0' shape=(None, None) dtype=float32>
Убунту
Вопрос или проблема Я пробовал перезагрузить компьютер, но он все равно остается испорченным. У меня нет представления, как ориентироваться в настройках за пределами значков – она также искажает мой пароль, он по-прежнему работает, но текст на моем
Вопросы и ответы
Вопрос или проблема Я пытаюсь преобразовать файл htm, содержащий текстовые таблицы, в датафрейм. Я посмотрел на предыдущие вопросы здесь и здесь, но не решил свою проблему. Таблица получается испорченной. Следующий воспроизводимый пример. # URL сайта url <
Убунту
Вопрос или проблема Хотел бы конвертировать текстовый файл в mp3 файл с помощью espeak. Это возможно сделать? Я пытаюсь использовать espeak, чтобы создать оболочку сценария синтеза песни, который может конвертировать текст в песню. Существует два способа сделать это;
Data Science
Вопрос или проблема Я хотел бы классифицировать тексты без использования каких-либо моделей машинного обучения. Моя идея состоит в том, чтобы составить список ключевых слов, которые я назначу каждой категории. Затем, когда мне нужно будет классифицировать
Убунту
Вопрос или проблема Когда я открываю документ в LibreOffice Writer, между каждым словом и в любом другом месте есть “пробел”, который серый вместо белого фона. Читать очень трудно. Вот пример. Я не могу понять, как убрать этот стиль форматирования.
Вопросы и ответы
Вопрос или проблема Я работаю над проектом, в котором я успешно обнаружил ячейки на табличном изображении, и в каждой ячейке я пытаюсь обнаружить написанные числа и тексты, но я уже много раз терпел неудачу, пробуя множество вариантов.
Data Science
Вопрос или проблема Привет, я работаю над классификацией текста в социальных медиа в финансовой сфере на тайском языке. Проблема заключается в путанице классов, неправильно классифицированные предсказания имеют последовательный паттерн как пара.
Программное обеспечение
Вопрос или проблема Меня интересует, как используются определенные символы Юникода. Я хочу инструмент, который позволит мне искать конкретный символ или кодовую точку, а затем покажет этот символ и некоторый соседний текст так, как он появляется в опубликованных электронных документах.
Data Science
Вопрос или проблема У меня есть набор данных из 5566 образцов – один столбец содержит текст описания рецепта, а другой – это налоговый класс. Я хочу создать классификатор, который будет классифицировать рецепты, используя только машинное обучение.
Вопросы и ответы
Вопрос или проблема Я читаю текст из множества PDF-документов с помощью следующего кода: import fitz import numpy as np import pandas as pd # открыть документ doc = fitz.open(filename_path) # получить текст с каждой страницы документа for idx, page in
Вопросы и ответы
Вопрос или проблема Я хочу обучить простую нейронную сеть, у которой embedding_dim является параметром: class BoolQNN(nn.Module): def __init__(self, embedding_dim): super(BoolQNN, self).__init__() self.fc1 = nn.Linear(embedding_dim, 64) self.
Data Science
Вопрос или проблема У меня есть следующий датафрейм Текст Ключевые слова Тип Это тюбик с роллером роллер шарик Это бочка бочка барр Неизвестная форма другие это сборка сборка сборка это герметичная сборка сборка фабрика это роллер двойной роллер фабрика
Data Science
Вопрос или проблема В принципе, это то же самое, что это, но для Java (и желательно для нескольких языков) (например, индекс читаемости Флеша, индекс SMOG, уровень Флеша-Кинкейда, индекс Коулмана-Лиу, автоматический индекс читаемости, оценка читаемости
Data Science
Вопрос или проблема У меня есть список коротких строк, каждая из которых определяет город. Орфографические ошибки очень распространены. Пример ниже показывает некоторые из этих коротких строк и правильный город, которому они должны соответствовать.
Data Science
Вопрос или проблема У меня есть столбец в Excel, который содержит много данных, разделенных разделителями ||. Данные можно классифицировать по некоторым классам, таким как сущности, коды IFSC, идентификаторы транзакций и т. д.
Wordpress
Вопрос или проблема Я хочу заставить текст обтекать изображение в WordPress. Я использую последнее обновление, нажимаю на изображение, выравниваю его влево или вправо, и это выглядит хорошо в редакторе. Когда я предварительно просматриваю свой сайт, текст
Data Science
Вопрос или проблема Я пытаюсь агрегировать информацию о профессиональных профилях из нескольких источников, устанавливая согласованную таксономию. В настоящее время главная проблема заключается в том, как установить предпочтительную таксономию для профилей
Data Science
Вопрос или проблема При обучении модели word2vec с использованием, например, gensim, вы можете указать минимальное количество раз, которое должно быть увидено слово (параметр min_count). Значение по умолчанию для этого, похоже, равно 5.
Data Science
Вопрос или проблема В последнее время меня вдохновляет этот https://rossum.ai/, который способен извлекать текст из счетов. У вас есть идеи, как это можно реализовать? Я понимаю, что они провели много исследований, чтобы достичь такого уровня производительности