Как обратить кавычки в моем урду предложении?

Вопрос или проблема

У меня есть много текста на урду, в котором кавычки перевернуты. Я хочу вернуть их в нормальное состояние.

 ’’احرام باندھتے وقت کاغسل‘‘  

Вот как это выглядит (выше). Я хочу, чтобы это выглядело так:

‘‘احرام باندھتے وقت کاغسل’’  

Если присмотреться, то кавычки, приведенные выше, это двойные одиночные кавычки, чтобы они выглядели как двойные кавычки. Мне нужен код регулярного выражения для этого. Код, который я использую, не работает так, как ожидалось.

Я использую (\x{2019}{2})(.+?)(\x{2018}{2}) для поиска и замены на $3$2$1

На самом деле я хочу типографические кавычки / фигурные кавычки.

Примечание: Я хотел показать изображение, но по какой-то причине не могу загрузить изображение сюда.

Ответ или решение

Чтобы решить вашу задачу по обращению кавычек в предложении на урду, следует воспользоваться регулярными выражениями. У вас уже есть код, который, судя по всему, не работает так, как вы ожидали. Я предлагаю следующее решение.

Обзор проблемы

Вы имеете текст на урду с двойными одинарными кавычками, и ваша цель — заменить их на типографские двоичные кавычки. Задача заключается в том, чтобы корректно обрабатывать входные кавычки и заменять их на нужные.

Решение

Используя Python, вы можете применить следующий код для достижения желаемого результата:

import re

# Входные данные с неправильными кавычками
text = "’’احرام باندھتے وقت کاغسل‘‘"

# Регулярное выражение для нахождения и замены кавычек
# Заменяем двойные одинарные кавычки на типографские
modified_text = re.sub(r'’{2}(.*?)‘{2}', r'“\1”', text)

print(modified_text)

Объяснение регулярного выражения

  • ’{2} — этот элемент ищет последовательность из двух закрывающих одинарных кавычек (неправильные кавычки).
  • (.*?) — это захватывающая группа, которая захватывает любой текст между кавычками.
  • ‘{2} — ищет последовательность из двух открывающих кавычек.

Вместо двойных одинарных кавычек мы используем типографские кавычки и для замены.

Результат

После выполнения кода, ваш текст будет выглядеть следующим образом:

“احرام باندھتے وقت کاغسل”

Заключение

Таким образом, с помощью регулярных выражений в Python можно легко обработать текст и исправить форматирование кавычек. Если вам требуется изменить кавычки на другие типографские символы, не забудьте заменить их в коде. Если у вас есть дополнительные вопросы или нужны уточнения, я буду рад помочь!

Оцените материал
Добавить комментарий

Капча загружается...