Вопрос или проблема
У меня есть много текста на урду
, в котором кавычки перевернуты. Я хочу вернуть их в нормальное состояние.
’’احرام باندھتے وقت کاغسل‘‘
Вот как это выглядит (выше). Я хочу, чтобы это выглядело так:
‘‘احرام باندھتے وقت کاغسل’’
Если присмотреться, то кавычки, приведенные выше, это двойные одиночные кавычки, чтобы они выглядели как двойные кавычки. Мне нужен код регулярного выражения для этого. Код, который я использую, не работает так, как ожидалось.
Я использую (\x{2019}{2})(.+?)(\x{2018}{2})
для поиска и замены на $3$2$1
На самом деле я хочу типографические кавычки / фигурные кавычки.
Примечание: Я хотел показать изображение, но по какой-то причине не могу загрузить изображение сюда.
Ответ или решение
Чтобы решить вашу задачу по обращению кавычек в предложении на урду, следует воспользоваться регулярными выражениями. У вас уже есть код, который, судя по всему, не работает так, как вы ожидали. Я предлагаю следующее решение.
Обзор проблемы
Вы имеете текст на урду с двойными одинарными кавычками, и ваша цель — заменить их на типографские двоичные кавычки. Задача заключается в том, чтобы корректно обрабатывать входные кавычки и заменять их на нужные.
Решение
Используя Python, вы можете применить следующий код для достижения желаемого результата:
import re
# Входные данные с неправильными кавычками
text = "’’احرام باندھتے وقت کاغسل‘‘"
# Регулярное выражение для нахождения и замены кавычек
# Заменяем двойные одинарные кавычки на типографские
modified_text = re.sub(r'’{2}(.*?)‘{2}', r'“\1”', text)
print(modified_text)
Объяснение регулярного выражения
’{2}
— этот элемент ищет последовательность из двух закрывающих одинарных кавычек (неправильные кавычки).(.*?)
— это захватывающая группа, которая захватывает любой текст между кавычками.‘{2}
— ищет последовательность из двух открывающих кавычек.
Вместо двойных одинарных кавычек мы используем типографские кавычки “
и ”
для замены.
Результат
После выполнения кода, ваш текст будет выглядеть следующим образом:
“احرام باندھتے وقت کاغسل”
Заключение
Таким образом, с помощью регулярных выражений в Python можно легко обработать текст и исправить форматирование кавычек. Если вам требуется изменить кавычки на другие типографские символы, не забудьте заменить их в коде. Если у вас есть дополнительные вопросы или нужны уточнения, я буду рад помочь!