Spamassassin: увеличить оценку спама для эмотиконов в теме письма

Вопрос или проблема

Мы получаем все больше спам-сообщений и маркетинговых писем с эмодзи в строке темы, и я хочу увеличить спам-оценку таких сообщений с помощью правила для SpamAssassin.

Кажется, эмодзи не являются встроенными изображениями, а технически обычными символами UTF-8, так как они даже отображаются, когда загрузка изображений из электронных писем отключена в почтовом клиенте. Похоже, что нет способа удалить/заблокировать их в Outlook или Thunderbird.

Мои вопросы:

  1. Можете ли вы подтвердить, что эти эмодзи являются символами UTF-8, или подсказать, как я мог бы это проверить?

  2. Я хотел бы создать правило для SpamAssassin, чтобы увеличить спам-оценку сообщений, содержащих эти эмодзи в строке темы. Как мне это сделать? Если это символы UTF-8, есть ли диапазон символов эмодзи, на который я мог бы обратить внимание?

Пример изображения сообщений:Пример, показывающий письма с эмодзи

Ответ или решение

Увеличение балла спама в SpamAssassin для емодзи в теме письма

При поступлении все большего количества спама и маркетинговых писем с эмодзи в теме, разумно предпринять меры для повышения уровня фильтрации таких сообщений. Ваша цель можно достичь с помощью создания пользовательского правила в SpamAssassin. В данной статье мы ответим на ваши вопросы и предоставим необходимые шаги для реализации решения.

1. Проверка, являются ли эмодзи UTF-8 символами

Эмодзи используют кодировку UTF-8 и могут быть представлены в виде последовательности байтов. Чтобы проверить, что эмодзи действительно являются UTF-8 символами, выполните следующие действия:

  • Используйте текстовый редактор: Откройте сообщение, содержащее эмодзи, в текстовом редакторе, который поддерживает отображение исходного кода. Убедитесь, что он настроен на отображение в кодировке UTF-8.

  • Проверьте код: Вы можете скопировать и вставить эмодзи в онлайн-инструмент или использовать команду в терминале, чтобы отобразить их исходный UTF-8 код. Для этого выполните команду echo -n "<эмодзи>" | xxd -p, чтобы увидеть байтовое представление.

  • Анализ с помощью Python: Полезный способ — написать небольшой скрипт на Python:

    text = "😊"  # ваш эмодзи
    print([hex(ord(c)) for c in text])

Этот скрипт выведет код символа в шестнадцатеричном формате, подтверждая, что это символ UTF-8.

2. Создание пользовательского правила в SpamAssassin

Создание пользовательского правила в SpamAssassin для повышения спам-скора сообщений с эмодзи в теме письма включает несколько шагов:

  • Найдите диапазон символов эмодзи: Эмодзи находятся в нескольких диапазонах кодов Unicode. Основные диапазоны, на которые стоит обратить внимание, включают следующие:

    • U+1F600 до U+1F64F (обычные эмоции)
    • U+1F300 до U+1F5FF (символы и картины)
  • Добавление правила в SpamAssassin: Откройте файл правил SpamAssassin (обычно располагатся по адресу /etc/mail/spamassassin/local.cf) и добавьте следующее правило:

    header EMOJI_SUBJECT Subject =~ /\x{1F600}-\x{1F64F}|\x{1F300}-\x{1F5FF}/
    score EMOJI_SUBJECT 5.0

    В данном правиле мы создаём заголовок EMOJI_SUBJECT, который проверяет, содержит ли тема письма один из указанных диапазонов эмодзи. Если это так, применяется штраф в размере 5.0. Можете отрегулировать значение 5.0 в зависимости от вашей системы фильтрации спама.

  • Перезапустите SpamAssassin: После редактирования конфигурации необходимо перезапустить SpamAssassin для применения изменений:

    sudo systemctl restart spamassassin

Заключение

Эти два шага помогут вам эффективно увеличивать спам-оценку сообщений с эмодзи в теме. Помните, что результаты фильтрации могут варьироваться в зависимости от других настроек системы и типа сообщений. Постоянно анализируйте и при необходимости корректируйте свои правила, чтобы обеспечить надлежащее управление входящей почтой.

Таким образом, вы не только создадите защиту от спама, но и улучшите качество своей почтовой кореспонденции.

Оцените материал
Добавить комментарий

Капча загружается...