Сервис кластеризации поисковых запросов

Кластеризация ключевых слов - это автоматизированное распределение запросов на группы на основе подобия выдачи в поисковых систем.



Алгоритм кластеризации Rush Analytics соберет ТОП10 URL выдачи Яндекса или Google по каждому вашему ключевому слову, сравнит результаты для каждого ключевого слова и сгруппирует запросы именно так, как они будут успешно продвигаться в поисковых системах, и как будет удобно и логично создавать страницы на сайте.



После обработки запросов, вы получите практически готовую и корректно сформированную, с точки зрения поисковых систем, структуру сайта. А основываясь на данных о частотности по каждой группы ключевых слов, вы сможете легко принять решение о создании дополнительных страниц на сайте.



Ознакомьтесь с видео руководством по функционалу кластеризации


Youtube video

Пошаговый алгоритм работы с сервисом:

  1. Создание проекта. Чтобы создать проект, необходимо перейти во вкладку кластеризация и нажать "Создать новый проект"


  2. Image


     
  3. Шаг первый: Поисковая система и регион.
    Здесь необходимо ввести название проекта (обязательное поле). Можно ввести любое название, часто бывает удобно вводить название сайта, чтобы в будущем легко найти нужный проект.

    Далее мы указываем поисковую систему, по данным которой будет выполняться группировка. Можно выбрать или Яндекс или Google.
    Для Google на данный момент доступны все регионы и языки мира.
    Image
  4. Шаг второй: Настройки сбора
    Image

    Все о наших алгоритмах кластеризации

    Тип - выбор алгоритма кластеризации.

    У нас есть 3 алгоритма кластеризации:

    • Кластеризация с ручными маркерами
    • Кластеризация по Wordstat
    • Комбинированный алгоритм кластеризации (ручные маркеры + Wordstat)

    Работают они по одному и тому же базовому принципу - сравнению подобия ТОПов поисковых систем, но предназначены для решения несколько различных задач.

    Алгоритм с использование ручных маркеров:

    Данный алгоритм эффективнее всего использовать, когда у вас есть готовая и довольно разветвленная структура сайта (каталога), и вы наперед знаете все маркеры и вам нужно просто понять по каким запросам вы собираетесь продвигать существующие страницы, а задачи расширения структуры сайта не стоит. В таком случае вы берете свои маркеры (названия категорий/страниц), собираете по ним подсказки, размечаете маркеры как 1, собранное облако как 0 и отправляете на кластеризацию. На выходе вы получите готовую семантику для своих категорий, а слова, которые не привязались к вашей структуре останутся некластеризованными.
    Формат загрузки данных: ключевое слово | маркер(1/0) - скачать пример входного файла

    Алгоритм кластеризации по Wordstat

    Этот алгоритм скорее решает обратную алгоритму ручных маркеров задачу: вы еще не знаете структуры своего сайта и не можете выделить маркеры - вы просто собрали Wordstat, подсказки и частотность по подсказкам. Теперь вам нужно структурировать эту семантику, чтобы получить группы запросов под страницы будущего сайта или будущих категорий существующего сайта. В таком случае алгоритм кластеризации по Wordstat подойдет как нельзя лучше, работает он следующим образом.
    Весь список ключевых слов сортируется по убыванию частотности, алгоритм пытается привязать все возможные слова из списка к самому частотному слову и формирует кластер, далее все повторяется итерационно для следующих по частотности ключевых слов.
    Не волнуйтесь за то, что ключевые слова могут при первом проходе алгоритма привязаться к неверному кластеру - мы используем алгоритмы машинного обучения, построенные на бинарных деревьях, чтобы предотвратить это :)
    Формат загрузки данных: ключевое слово | частотность (любая) - скачать пример входного файла

    Комбинированный алгоритм (ручные маркеры + Wordstat) - сочетает подходы двух предыдущих методов.

    Этот алгоритм подходит для задачи одновременного подбора ключевых слов для существующей структуры сайта и ее расширения. Работает он следующим образом: сначала мы пытаемся привязать все возможные запросы к вашим маркерным запросам и формируем готовую структуру, привязанную к вашим маркерам. Далее, все запросы, что не были привязаны к маркерам - сортируются по убыванию частотности и группируются между собой. В результате вы получаете:
    а) Готовую семантику для существующих категорий сайта
    б) Расширение семантики для вашего сайта.
    Мы настоятельно рекомендуем использовать комбинированный алгоритм - он дает наилучший результат.
    Формат загрузки данных: ключевое слово | | маркер(1/0) | частотность - скачать пример входного файла


    Все, что нужно знать про точность кластеризации

    Точность – чем больше точность кластеризации (группировки), тем более похожие фразы попадут в одну группу (кластер).
    Другими словами - данная опция отвечает за то, сколько общих URL нужно в ТОП10 поисковой системы, чтобы ключевые слова попали в один кластер.

    В каждой тематике есть свой, необходимый и достаточный порог схожести выдачи, чтобы получить качественное семантическое ядро. Например при продвижении интернет-магазинов, будет большой проблемой, если при кластеризации запросов ключевые слова "мультиварка Redmond RX500" и "Мультиварка Redmond RX500-1" будут попадать в один кластер - т.к. это разные товары и они должны продвигаться на разные карточки товара. Здесь мы рекомендуем использовать точность = 5
    Для инфо-тематик, например, для сайтов скидок или рецептов, такая точность не нужна - здесь задача получить максимальное количество сгруппированных кластеров для написания статей. Для таких сайтов мы рекомендуем точность 3 или 4. А для сайтов в очень конкурентных тематиках, где борьба за ТОП идет в основном по конкурентным ВЧ запросам - мы рекомендуем использовать повышенную точность кластеризации - 6 или 7, а под некластеризованные запросы создавать отдельные страницы.

    Рекомендуется выбирать варианты 3-6 и по результатам смотреть, какая кластеризация будет обладать достаточной полнотой и точностью для вашей семантики. Чем больше значение точности, тем более мелкие будут группы.

    Другие настройки кластеризации

    Не кластеризовать, если частотность меньше, чем - данная опция позволяет не кластеризовать ключевые слова с частотностью, менее заданной. Это поможет сэкономить бюджет на кластеризацию и избавит вас от ручной чистки низко популярных запросов – такие слова будут помещены во вкладку «Не кластеризовано».

    Определение релевантных URL для кластеров существующего сайта
    Вам достаточно ввести название нужного домена и наши алгоритмы попытаются определить релевантные URL для полученных кластеров.
    Опция работает следующим образом: если по главному (маркерному) запросу ваш сайт уже в ТОП10 - мы покажем этот URL и выделим его зеленым цветом. Иначе - подберем URL для маркерного запроса с помощью оператора site:.

    ВАЖНО: Релевантные URL подбираются для маркерных (главных) запросов кластера и присваиваются всему кластеру (всем ключевым словам кластера).



  5. Шаг третий: «Ключевые слова и цена».
    Загружаем файл с запросами.
    Поддерживаемые форматы: xls, xlsx. Формат ввода данных: запрос;маркер или частотность. Для кластеризации по методу Wordstat + Ручные маркеры формат данных: запрос;маркер;частотность.

    Вводим стоп-слова
    Перед кластеризацией из списка будут исключены фразы, содержащие стоп-слова. Функционал помогает сэкономить бюджет на кластеризацию и решает проблему ручной очистки стоп-слов. Функционал особенно полезен, если вы кластеризуете "грязный", предварительно не очищенный список ключевых слов.

    Предлагаем воспользоваться готовыми списками стоп-слов по гео-запросам и различным тематикам, или создать совой список стоп-слов. И не забываем про "Эксперт опции" - по умолчанию применяется символьное соответствие - т.е. частичное вхождение удалит все слово / словосочетание, если вам надо точное соответствие стоп-слову - выбирайте фразовое соответствие.

  6. Image

  7. Нажимаем "Создать новый проект" - все, ваш проект отправлен на кластеризацию!

Теперь можно отслеживать статус проекта во вкладке "Очередь" или же в списке проектов по кластеризации.
На данный момент в Rush Analytics есть 5 статусов:
В очереди – данные еще не собираются, проект ждет своей очереди на сбор данных
Сбор данных – счетчик показывает, сколько ключевых слов обработано
Кластеринг – данные проекта уже собраны, система просчитывает все необходимые метрики, чтобы предоставить вам результат
На паузе – вы можете вручную поставить проект на паузу, если не уверены, что хотите его собирать. Или же, проект может сам встать на паузу т.к. у вас кончились деньги на балансе.
Готов – проект готов - вы можете посмотреть результаты в веб-интерфейсе или скачать в формате XLSX

Выходной файл кластеризации - описание столбцов

Результат кластеризации в формате XLSX выглядит следующим образом:

Image

  • Запросы, выделенные серым цветом – маркерные запросы - указанные вами вручную, или определенные системой
  • Название кластера – берется название маркерного запроса
  • Размер кластера – количество ключевых слов в группе
  • Частотность ключевых слов – та частотность, которую вы задали в шаге «Ключевые слова». В зависимости от того, какую вы взяли частотность – базовую, в кавычках или с восклицательным знаком, результаты кластеризации могут незначительно отличаться
  • Общая частотность кластера – сумма частотностей всех ключевых слов кластера
  • Совпадений ТОПа– количество общих URL в поисковой выдаче по данному запросу с выдачей по эталонному (маркерному) запросу
  • Подсветки – подсветки с выдачи поисковых систем, собранные по вашему ключевому слову
  • Подсветки для кластера - подсветки без дубликатов, по всем словам данного кластера
  • Top URL - самый видимый в выдаче URL конкурента по всем запросам кластера. Здесь мы оцениваем частоту встречаемости URL конкурентов в выдаче по каждому запросу и позицию каждого URL конкурентов в выдаче
  • Релевантный URL - найденный релевантный URL для кластера, если была выбрана опция "Определять релевантные URL
    Опция работает следующим образом: если по главному (маркерному) запросу ваш сайт уже в ТОП10 - мы покажем этот URL и выделим его зеленым цветом. Иначе - подберем URL для маркерного запроса с помощью оператора site:

Примеры готовых файлов после кластеризации можно посмотреть в нашем портфолио

Далее можно объединять логически связанные группы для построения структуры сайта или раздела.
Рекомендуем ознакомиться с нашим полным руководством по подбору семантического ядра.

Эта статья была полезна для 13 людей. Эта статья помогла вам?

Сервис поддержки клиентов работает на платформе UserEcho