Excel – Разное выделение для разных пар дублирующих значений

Вопрос или проблема

0

У меня есть файл Excel, который содержит данные пользователей веб-сайта. В колонке A находятся их имена пользователей, а в колонке B – их адреса электронной почты. К сожалению, много дубликатов: как внутри одной колонки, так и между ними.

Пример:

  1. Thelegend28 | [email protected]
  2. timmyhs | [email protected]
  3. l33tu53r | [email protected]
  4. Thelegend28 | [email protected]
  5. 2l33t4u | [email protected]
  6. timmyhs | [email protected]

Как видно, у меня есть пользователи, зарегистрированные дважды с одним и тем же именем пользователя и адресом электронной почты (2. и 6.), но у меня также иногда разные уникальные имена пользователей, связанные с одной электронной почтой (3. и 5.) и имена пользователей, которые связаны с несколькими адресами (1. и 4.).

Что мне нужно сделать, если это возможно, так это отформатировать эти три случая по-разному.

Конечно, любая помощь будет очень ценна. Я всего лишь новичок, но стараюсь учиться. Заранее благодарю всех.

Попробуйте добавить 2 колонки с формулой COUNTIF:

Колонка C: =COUNTIF($A$2:$A$7,A2)

Колонка D: =COUNTIF($B$2:$B$7,B2)

Вы получите результат, как показано на следующем изображении:
введите описание изображения здесь

Затем вы можете использовать Условное форматирование с этими формульными правилами:

=AND($C2=1,$D2>1)

=AND($C2>1,$D2=1)

=AND($C2>1,$D2>1)

введите описание изображения здесь

Как всегда, есть много способов использовать Excel.

  1. Используйте сводные таблицы и считайте количество вхождений в трех отдельных таблицах (pivot tables легче, чем кажется – просто посмотрите видео на YouTube об этом – это изменит ваш взгляд на жизнь, эээ, я имею в виду Excel). Одна таблица для дублированных имен пользователей, одна для дублированных адресов электронной почты и одна для обоих (объедините A1 & B1 в новую колонку C с =A1&”;”&B1). Это одна сводная таблица на колонку. Это может хорошо работать для ручной обработки (например, массовая рассылка пользователям, обновление базы данных веб-сайта и т. д.), но не так хорошо для удаления или редактирования дублированных строк в исходной электронной таблице. P.S. Не забывайте, что вы можете “углубляться” из сводной таблицы, дважды щелкнув на ячейку.

  2. Для цветового форматирования на исходных данных условное форматирование сделает вашу работу. Сохраните новую колонку C, как указано выше. Выбирайте одну колонку за раз, затем нажмите “Главная” > “Условное форматирование” > “Правила выделения ячеек” > “Дублирующиеся значения…” и установите желаемое форматирование для каждой колонки. Этот метод может дать разное цветовое форматирование в одной строке, в отличие от того, чтобы одна строка была помечена как принадлежащая одной категории.

  3. Если вы хотите быть более конкретным, используйте функцию COUNTIF для категоризации каждой строки следующим образом. Сохраните новую колонку C, как указано выше. Скажем, ваши данные находятся в A1:C10, тогда в D1 введите

    =IF(COUNTIF($A$1:$A$10, A1)>1,1,0) + IF(COUNTIF($B$1:$B$10, B1)>1,2,0) + IF(COUNTIF($C$1:$C$10, C1)>1,1,0)

    Это даст вам 0 для уникальных, 1 для дублированных имен пользователей, 2 для дублированных адресов электронной почты, 4 для полных дубликатов и 3 для специального класса, который имеет как дублированные адреса электронной почты, так и имена пользователей, но отдельно (например, john [email protected]; john [email protected]; johnny [email protected]). Вы можете затем условно отформатировать колонку D, используя индивидуальный “набор значков” с 5 различными значками для (0,1,2,3,4).
    введите описание изображения здесь

Ответ или решение

Различное выделение для разных пар дублирующихся значений в Excel

Если вы работаете с данными пользователей в Excel и сталкиваетесь с дублирующимися значениями в столбцах с именами пользователей и адресами электронной почты, можно воспользоваться несколькими методами для их выделения и облегчения последующей работы с данными. В этой статье мы рассмотрим пошаговый подход для достижения именно этих целей.

Шаг 1: Подсчет дубликатов с помощью функций COUNTIF

Первый шаг заключается в создании двух дополнительных столбцов, которые помогут нам определить количество дублирующихся значений в каждом из столбцов:

  1. Вставьте новый столбец C рядом со столбцом B. В ячейке C2 введите формулу:

    =COUNTIF($A$2:$A$7, A2)

    Эта формула посчитает, сколько раз имя пользователя (значение в ячейке A2) встречается в указанном диапазоне.

  2. Вставьте новый столбец D рядом с C. В ячейке D2 введите аналогичную формулу:

    =COUNTIF($B$2:$B$7, B2)

    Это позволит узнать количество раз, когда адрес электронной почты (значение в ячейке B2) встречается в диапазоне.

После ввода формул и их протягивания вниз для всех строк, столбцы C и D будут содержать количество повторений каждого имени пользователя и адреса электронной почты соответственно.

Шаг 2: Условное форматирование для выделения дубликатов

Теперь, когда у вас есть информация о дубликатах, можно использовать условное форматирование для выделения различных категорий дублирующихся значений:

  1. Выделение только дублирующихся пользователей:

    • Выделите столбцы A и B.
    • Перейдите в закладку "Главная" → "Условное форматирование" → "Создать правило".
    • Введите формулу:
      =AND($C2>1, $D2=1)
    • Выберите форматирование (например, заливку красным) и примените его.
  2. Выделение только дублирующихся адресов электронной почты:

    • Повторите предыдущие шаги, но используйте формулу:
      =AND($C2=1, $D2>1)
  3. Выделение полных дублирующихся записей:

    • Еще раз создайте правило условного форматирования с формулой:
      =AND($C2>1, $D2>1)

Каждое из правил позволит визуально разделить дубликаты по категориям, делая их более заметными.

Шаг 3: Альтернативные методы анализа данных

Для более сложного анализа можно использовать сводные таблицы. Создайте новую колонку, объединяющую имя пользователя и адрес электронной почты, чтобы проверить, какие пользователи имеют одно и то же имя и адрес электронной почты. В этом случае используйте формулу:

=A2 & ";" & B2

Это поможет вам получить полное представление о связях между пользователями и их адресами.

Заключение

Работа с дубликатами в Excel может показаться сложной задачей, но с помощью функций и инструментов, таких как условное форматирование и сводные таблицы, можно легко управлять этими данными. Следуя приведенным шагам, вы сможете выделить и проанализировать дублирующиеся значения различных категорий, что очень поможет в управлении вашими данными пользователей. Если у вас возникнут дополнительные вопросы, не стесняйтесь задавать их!

Оцените материал
Добавить комментарий

Капча загружается...