Вопрос или проблема
Мы получаем все больше спам-сообщений и маркетинговых писем с эмодзи в строке темы, и я хочу увеличить спам-оценку таких сообщений с помощью правила для SpamAssassin.
Кажется, эмодзи не являются встроенными изображениями, а технически обычными символами UTF-8, так как они даже отображаются, когда загрузка изображений из электронных писем отключена в почтовом клиенте. Похоже, что нет способа удалить/заблокировать их в Outlook или Thunderbird.
Мои вопросы:
-
Можете ли вы подтвердить, что эти эмодзи являются символами UTF-8, или подсказать, как я мог бы это проверить?
-
Я хотел бы создать правило для SpamAssassin, чтобы увеличить спам-оценку сообщений, содержащих эти эмодзи в строке темы. Как мне это сделать? Если это символы UTF-8, есть ли диапазон символов эмодзи, на который я мог бы обратить внимание?
Ответ или решение
Увеличение балла спама в SpamAssassin для емодзи в теме письма
При поступлении все большего количества спама и маркетинговых писем с эмодзи в теме, разумно предпринять меры для повышения уровня фильтрации таких сообщений. Ваша цель можно достичь с помощью создания пользовательского правила в SpamAssassin. В данной статье мы ответим на ваши вопросы и предоставим необходимые шаги для реализации решения.
1. Проверка, являются ли эмодзи UTF-8 символами
Эмодзи используют кодировку UTF-8 и могут быть представлены в виде последовательности байтов. Чтобы проверить, что эмодзи действительно являются UTF-8 символами, выполните следующие действия:
-
Используйте текстовый редактор: Откройте сообщение, содержащее эмодзи, в текстовом редакторе, который поддерживает отображение исходного кода. Убедитесь, что он настроен на отображение в кодировке UTF-8.
-
Проверьте код: Вы можете скопировать и вставить эмодзи в онлайн-инструмент или использовать команду в терминале, чтобы отобразить их исходный UTF-8 код. Для этого выполните команду
echo -n "<эмодзи>" | xxd -p
, чтобы увидеть байтовое представление. -
Анализ с помощью Python: Полезный способ — написать небольшой скрипт на Python:
text = "😊" # ваш эмодзи print([hex(ord(c)) for c in text])
Этот скрипт выведет код символа в шестнадцатеричном формате, подтверждая, что это символ UTF-8.
2. Создание пользовательского правила в SpamAssassin
Создание пользовательского правила в SpamAssassin для повышения спам-скора сообщений с эмодзи в теме письма включает несколько шагов:
-
Найдите диапазон символов эмодзи: Эмодзи находятся в нескольких диапазонах кодов Unicode. Основные диапазоны, на которые стоит обратить внимание, включают следующие:
- U+1F600 до U+1F64F (обычные эмоции)
- U+1F300 до U+1F5FF (символы и картины)
-
Добавление правила в SpamAssassin: Откройте файл правил SpamAssassin (обычно располагатся по адресу
/etc/mail/spamassassin/local.cf
) и добавьте следующее правило:header EMOJI_SUBJECT Subject =~ /\x{1F600}-\x{1F64F}|\x{1F300}-\x{1F5FF}/ score EMOJI_SUBJECT 5.0
В данном правиле мы создаём заголовок
EMOJI_SUBJECT
, который проверяет, содержит ли тема письма один из указанных диапазонов эмодзи. Если это так, применяется штраф в размере 5.0. Можете отрегулировать значение5.0
в зависимости от вашей системы фильтрации спама. -
Перезапустите SpamAssassin: После редактирования конфигурации необходимо перезапустить SpamAssassin для применения изменений:
sudo systemctl restart spamassassin
Заключение
Эти два шага помогут вам эффективно увеличивать спам-оценку сообщений с эмодзи в теме. Помните, что результаты фильтрации могут варьироваться в зависимости от других настроек системы и типа сообщений. Постоянно анализируйте и при необходимости корректируйте свои правила, чтобы обеспечить надлежащее управление входящей почтой.
Таким образом, вы не только создадите защиту от спама, но и улучшите качество своей почтовой кореспонденции.