Что такое заспамленность текста и как её привести в норму

Стоп спам SEO
Заспамленность текста это хорошо или плохо. Учимся писать SEO-статьи без переспама. Обещаю не лить воду, а дать конкретные рекомендации начинающим копирайтерам. Подробный разбор текстов на спам и воду из ТОП 10 Яндекса.

Что такое SPAM

Недостаточно написать полезный обзор, его нужно оптимизировать под поисковый запрос. Роботы хотят понять отвечает ли материал на заданный вопрос. Если искомая фраза встречается на странице несколько раз, поисковик определит её подходящей (релевантной) и предложит пользователю.

Повторение определённых словосочетаний влияет на продвижение. Однако, если перестараться, то вместо ТОП можно получить БАН.

Заспамленность текста это концентрация часто повторяющихся слов. Статьи, пересыщенные повторами, тяжело читать. Поисковые алгоритмы научились выявлять и отфильтровывать такие страницы.

Впервые слово «SPAM» появилось в 1936 году. Такую аббревиатуру получила новая торговая марка американского предприятия по производству мясных консервов, точную расшифровку знают только директора. Ребрендинг сопровождался чрезмерной рекламой продукции. После окончания войны осталась нереализованной крупная партия консервных банок, выпущенная для армии.

spam - торговая марка

Впоследствии этот термин стал поводом для сатиры и обозначения других передозировок, например рекламных электронных рассылок. Термин приобрёл нарицательное значение. Корпорация даже судилась с компанией SpamArrest, выпускающей антиспамовое программное обеспечение, но проиграла.

Начинающие копирайтеры часто повторяют ключевые фразы, их синонимы или стоп-слова (союзы, предлоги, местоимения и др.). К спаму относятся первые две категории, а последняя — к водности. Все эти излишества тянут на дно. Задача копирайтера написать чистый уникальный информативный грамотный текст.

Предварительный аудит текстового документа SEO-инструментами выявит проблемные места, устранение которых откроет дорогу в ТОП.

Нет единой системы параметров, каждый сервис разработал свои подходы, формулы расчёта, терминологию. Сравнивайте результаты в рамках отдельной программы, придерживаясь её нормативов. Наиболее известные Text.ru и Advego.

Что такое заспамленность текста в антиплагиате

Для SEO-анализа копирайтеры используют популярный сервис Text.ru. Он разрешает бесплатно проверить материал на уникальность, орфографию, spam, водность. Согласно антиплагиату

Заспамленность текста — это отношение количества поисковых ключевых слов к общему объёму статьи, выраженное в процентах.

По уровню заспамленности тексты делятся на три категории:

  • < 30% — натуральный контент с естественным вхождением «ключевиков»
  • 30-60% — оптимизированный под поисковые запросы
  • > 60% — переоптимизированный, большая вероятность попасть под фильтр

Игнорирование или многократное использование ключевых фраз — одна из причин низких позиций в поиске. Золотая середина — секрет успеха продвижения страницы, при этом она будет понятна роботам и легко восприниматься людьми.

Кроме количества вхождений учитывается распределение их по объёму. Даже небольшое число ключей, расположенных рядом, будет определяться как spam. Старайтесь равномерно вписывать их с интервалом 600-800 знаков, некоторые оптимизаторы советуют выдерживать 1000.

Тошнота текста

Адвего, ещё один помощник копирайтеров, разработал собственный показатель повторяемости под названием — тошнота. Да, да именно так воспринимают читатели сео-тексты.

Различают два вида.

Классическая тошнота (КТ) рассчитывается по одному самому часто используемому слову. Для этого извлекается квадратный корень из количества его повторов.

Например, термин «текст» в данном обзоре (до редактирования) встречается 18 раз, значит КТ = 4.24. Много это или мало можно понять только зная общий объём. Об этом мы поговорим чуть позже.

Академическая тошнота учитывает все часто повторяющиеся термины и фразы, рассчитывается по специальной формуле с учётом морфологических форм (склонений, спряжений), выражается в процентах. По этой величине можно судить о естественности контента.

Заспамленность текста и академическая тошнота — схожие, но не тождественные характеристики, используемые разными сервисами. Так, верхняя планка для первой 60%, а второй — 8.5%.

Проверка текста на заспамленность онлайн

Перед публикацией работу желательно проверить на соответствие принятым нормативам или, если вы пишете на заказ, требованиям технического задания. Рассмотрим популярные сервисы семантического анализа.

Для аудита используется текст без заголовка H1.

Процесс происходит автоматически и обычно занимает несколько секунд. Для наглядности я проверю исходный вариант этого обзора разными инструментами, прокомментирую результаты.

Text.ru

Онлайн-сервис Text.ru позволяет узнать заспамленность, уникальность, водность, орфографические ошибки. Просто вставьте содержимое статьи в окошко, нажмите кнопку «Проверить на уникальность» и дождитесь своей очереди.

Антиплагиат Text.ru

Прошло 5 минут. Итог меня порадовал: уникальность 100%, вода — 13%, заспамленность — 51%, поисковые системы должны одобрить.

Проверка текста на уникальнось, заспамленность и воду

Перехожу во вторую вкладку, смотрю орфографию: красным подсвечены возможные ошибки. Действительно, пропустила дефис. Исправила.

Смотрю третью вкладку: фиолетовым цветом отмечены участки, которые определены как spam.

Заспамленные участки текста

Чем насыщенней оттенок, тем больше повторов. По скриншоту видно, какие термины стоит заменить на синонимы, а где — увеличить дистанцию.

Чтобы посмотреть воду, переключите глазик под текстовым окном. Голубым цветом выделены водные элементы. В моём случае достаточно удалить лишние предлоги.

Без регистрации разрешено обрабатывать 15 000 знаков в сутки. Зарегистрированным пользователям с подтверждённым телефоном антиплагиат увеличивает лимит до 50 тысяч, однако размер текста должен быть менее 15 000 символов.

Не забудьте перед работой сменить тариф «Скорость» (стоит по умолчанию) на «Эконом». Переключатель находится перед кнопкой «Проверить на уникальность».

Переключатель на Эконом-тариф в Текст ру

Если бесплатных возможностей не достаточно, купите PRO-аккаунт.

Advego

Адвего определяет классическую и академическую тошноту текста, плотность ключей, семантическое ядро. Для этого выберите закладку SEO-анализ, вставьте в текстовое поле анализируемую статью. Бесплатная версия принимает документы до 100 тысяч символов.

SEO-анализ текста в Адвего

Результат программа выдаёт мгновенно: академическая тошнота 6 % — отличная работа (допустимый уровень < 8.5%).

Тошнота в Адвего

Далее смотрю семантическое ядро, оно показывает по каким запросам будет ранжироваться страница. В основном выделены правильные термины и фразы, однако некоторые явно лишние. Частотность не превышает 3%, что свидетельствует о хорошем качестве контента, написанном для людей (для вас стараюсь).

Семантическое ядро по Адвего

Прокручиваю вниз до stop words: здесь картина не такая радужная, но в рамках допустимого. Лишние предлоги с союзами стоит удалить.

Стоп-слова по Адвего

Тургенев

Для борьбы с текстовым спамом Яндекс запустил в 2017 году алгоритм «Баден-Баден», он выявляет «плохие» страницы и понижает позиции в выдаче. Если их много, может пострадать весь сайт.

Сервис Тургенев рассчитывает степень риска попадания под фильтр, учитывая следующие характеристики:

  • академическая тошнота
  • высокая частота некоторых слов
  • сверхконцентрация союза «и»
  • стилистические ошибки
  • водность
  • покрытие «ключевиками»
  • удобочитаемость

Содержимое текста проверяется по каждому пункту, при превышении допустимых лимитов начисляются штрафные баллы, которые суммируются в общую оценку риска:

  • 5-8 — средний
  • > 8 — высокий
  • > 13 — критический

Разбор стилистических ошибок бесплатный. При регистрации бонусом начисляется 100 рублей на баланс для тестирования платных услуг: общий риск попасть под «Баден-Баден», повторы, запросы, водность, удобочитаемость. Стоимость одного запроса 5 рублей.

В первую очередь исследую текст на повторы: никаких штрафных баллов не начислено, всё чисто.

Тургенев: инструмент повторы

Перехожу к общей оценке риска попасть под фильтр, получила два штрафных бала по стилистическим ошибкам. Благо есть подсказки, нужно внести правки при редактировании. В целом риск низкий, есть все предпосылки контентного продвижения.

Оценка риска попасть под фильтр по Тургеневу

Istio

Бесплатный онлайн-сервис Istio мгновенно рассчитает классическую тошноту, плотность ключевиков, водность, найдёт орфографические ошибки. Для начала работы достаточно вставить текст или указать ссылку на опубликованный обзор. Нет ограничений на количество знаков.

Семантический анализ istio

Изюминкой программы является создание карты частотных слов. В таком виде документ как на ладони, легче корректировать.

Карта частотных слов, созданное в Istio

PR-CY

Программа PR-CY анализирует количество повторов, показывает какие термины вписаны естественно, а какие — часто. Она рассчитает естественную плотность согласно закону Ципфа, даст рекомендации по коррекции каждой позиции.

Американский лингвист, изучая закономерности в языках, обнаружил, что одни термины используются очень часто, а другие — редко. Если взять длинный текст и упорядочить его слова по частоте, то самое популярное встречается в 2 раза чаще второго, в 3 раза чаще третьего и т.д.

Оказывается закон Ципфа работает не только в отношении языков, но и размеров городов. Действительно, в Москве проживает примерно в 2 раза больше людей, чем в Санкт-Петербурге, а Киев — вдвое превосходит Харьков:

РоссияУкраина
Москва — 12.6 млнКиев — 2.9 млн
Санкт-Петербург — 5.4 млнХарьков — 1.4 млн
Численность населения самых крупных городов России и Украины, 2021 год

Идея понятна, переходим к практике. Анализ текста в PR-CY показал, что естественность моего обзора до редактирования составляет 78%. Этот показатель должен быть > 50%, так что результат вполне приемлемый.

Естественность текста по PR-CY

Далее изучаю подробный разбор каждой позиции, сколько чего рекомендуется убрать.

Рекомендации от PR-CY

Miratext

Исследование с помощью анализа текста от Miratext покажет тошнотность, водянистость, качество по закону Ципфа, облако слов, составит график и предложит внести правки.

Снова загружаю свой исходник, отключаю обработку цифр, союзов, предлогов, местоимений и смотрю результат. Сравнивать сложно: водянистость и качество текста сильно отличаются от предыдущих значений.

В поддержке получила странный ответ: параметры имеют информационный характер, пользоваться ими необязательно. Нормативы, найденные в интернете, умалчиваю поскольку не уверена в их достоверности.

Мне симпатизирует Miratext более понятной раскладкой по частотам по сравнению с Адвего, генерацией облака и графика.

Анализ текста в Miratext

Miratext построил график отклонения частотностей от идеальных значений.

График отклонения от закона Ципфа на Miratext

Норма заспамленности

Полностью избавиться от спама не получится. Поисковики не смогут понять по каким запросам ранжировать страницу. Какой уровень заспамленности текста считается допустимым, а какой — оценивается как переспам. Сколько это в процентах…

Есть негласные правила, которых придерживаются копирайтеры. Ниже приведены SEO-нормативы для проверенных сервисов, им доверяет большинство специалистов.

Антиплагиат Text.ru

  • заспамленность текста: 30 — 60%
  • уникальность: > 90%
  • вода: < 15%

Адвего

Наблюдается существенная разница между рекомендациями сервиса и требованиями к копирайтерам. Привожу оба варианта.

  • академическая тошнота: 6 — 8.5% (по Advego: 5-15%)
  • классическая тошнота: < 7 (согласно Advego: «5» на 20 тысяч знаков это нормально)
  • частотность ключа: < 3%
  • вода: 55-75%

Учитывайте, что оценку дают роботы, которые могут ошибаться.

Как снизить заспамленность текста

Если проверка показала, что материал переоптимизирован, то к публикации он точно не готов: поисковые роботы могут забраковать, посчитав его не читабельным. Переходим к редактированию.

Чтобы уменьшить заспамленность текста, я пользуюсь такими приёмами:

  • подобрать синоним
  • заменить местоимением
  • заменить английским переводом
  • использовать аббревиатуру
  • перефразировать предложение
  • объединить два предложения в одно
  • проверить интервалы между ключевыми фразами
  • удалить проблемный участок
  • добавить дополнительный материал для лучшего раскрытия темы
  • прочитать вслух
  • использовать опыт конкурентов

Каждый из этих методов используйте аккуратно. Так, например, замена термина «сайт» на «ресурс» приводит к стилистической ошибке. Наращивание объёма текста не должно снижать его информативности, а вырезание — к потере смысла. Разбавление ключей может привести к другой крайности — водянистости.

Не стоит менять некоторые буквы русского слова на английские, такие махинации легко определяются.

Для уменьшения классической тошноты достаточно откорректировать количество употребления главного ключа. Однако смотрите, чтобы слово-паразит не стало ключевым.

После редактирования проверьте ещё раз. Я записала короткое видео, чтобы продемонстрировать на конкретном примере работу различных инструментов.

Для лучшего эффекта, прочтите свою работу через пару дней на свежую голову. Наверняка придут новые идеи: мастерство приходит со временем.

Уровень заспамленности в ТОП 10

Чтобы разобраться как влияет заспамленность текста на позиции, насколько жёстко действуют фильтры в отношении информационных сайтов, провела следующее расследование. В поиске Яндекс сделала запрос по ключевой фразе и проанализировала первые десять статей на уровень спама.

Все авторы — профессионалы в данной тематике, знают требования и нормы. Хочу перенять опыт экспертов. Приглашаю погрузиться в статистику вместе. Обзоры из Zen.Yandex, vc.ru не учитывались, исследование проведено 14.11.21.

SEO-анализ статей из ТОП 10

Большинство показателей действительно в рамках допустимого. Заспамленность текста никто не превысил, все уложились до 56%. Академическая тошнота почти у всех в диапазоне 6-8.2%, авторы строго соблюдают норматив, только один текст выпал из правила.

Вода по Адвего во всех десяти случаях < 75%, а по Text.ru — немного превышена, доходит до 20% при нормативе < 15%. Похоже, на этот показатель не стоит сильно опираться. Избавиться от словесного мусора поможет сервис Главред.

Рассмотрим подробнее частотность. Я пересчитала средний интервал между вхождениями тематического термина «заспамленность».

позиция в ТОП12345678910
интервал вхождения66449236322410294731289769703697

Как видите, санкции не накладываются даже при внедрении ключа c интервалом 200 знаков. Однако это исключение, обычно все соблюдают приличную дистанцию.

Классическая тошнота сильно превышена для всех участников. Так, Адвего даёт норму «5» для 20 000 знаков. При объёмах всего лишь 6 — 16.5 тысяч КТ варьируется в диапазоне 4.36 — 8.31. На этот показатель мало кто обращает внимание, главное не превышать 7.

Ещё один нюанс. Одна статья набрала 10 общих баллов по Тургеневу, есть высокий риск попасть под санкции, но поисковики, к счастью, имеют другое мнение.

Общий риск попасть под фильтр Баден-Баден

Ниже представлены сгенерированные облака. Всё наглядно.

Облака слов для ТОП 10

Какой я сделала вывод. Стремиться к идеалу нужно, но без фанатизма. Больше думайте о людях, а не о цифрах. Поисковые роботы достаточно лояльно относятся даже к явному передозу. Не думаю, что в будущем нас ждут поблажки, скорее отбор будет более жёстким, увлекаться спамом явно не стоит.

На этом у меня всё. Надеюсь вы почерпнули что-то новое. Работайте над текстами и они займут достойные позиции. Пишите свои соображения, наблюдения в комментариях.

Поделиться с друзьями
Светлана Стецко

Буду рада помочь новичкам разобраться с базовыми понятиями и настройками. Предлагаю пошаговую инструкцию создания качественного блога без знания программирования.

Оцените автора
( 1 оценка, среднее 5 из 5 )
SiteFromZero
А вы проверяете свои тексты на заспамленность?

  1. Елена

    Полезная статья. Тургеневым никогда не пользовалась, надо попробовать. 5 рублей это за одну проверку одного текста?

    Ответить
    1. Светлана Стецко автор

      Стлилистические ошибки (а это изюминка сервиса) проверяются бесплатно. Рассчитать общий риск попасть под фильтр Баден-Баден — 5 рублей, но вам в подарок 100 р. за регистрацию. Спам и воду можно проверить в Адвего и Text.ru. Очень хороший сервис, рекомендую.

      Ответить
  2. Ирина

    Светлана, очень информативная статья. Подскажите, я проверяю тексты на сайт только с помощью Техт.ru и Адвего, правильно я поняла, что желательно ещё по Тургеневу и добиваться риска менее 5?

    Ответить
    1. Светлана Стецко автор

      Техт.ru и Адвего — это обязательно. Начинающим я также рекомендую проверять по Тургеневу, поскольку он учитывает не только спам и воду, но и стилистические ошибки. А практика показывает, что многие авторы не уделяют этому внимания. Сам сервис Тургенев рекомендует не набирать более 8 штрафных баллов. 13 — это критический показатель. Облако слов в Miratext также поможет наглядно оценить проделанную работу.

      Ответить
  3. Максим

    Спасибо автору за подробный разбор, даже для меня как для новичка в данной теме все понятно! Спасибо

    Ответить
    1. Светлана Стецко автор

      Пожалуйста. Вооружились знаниями — внедряйте!

      Ответить
  4. Роман

    Спасибо большое за статью. Очень много полезного узнал. Закрыл ряд вопросов. Буду периодически перечитывать 😉

    Ответить
    1. Светлана Стецко автор

      Пожалуйста, заходите ещё)

      Ответить
  5. Юрий

    Интересная статья а главное что полезная Спасибо

    Ответить
    1. Светлана Стецко автор

      Пожалуйста)

      Ответить
  6. Виталий

    Очень полезная статья, узнал новые советы для себя, есть чем воспользоваться Спасибо.

    Ответить
    1. Светлана Стецко автор

      Желаю вам удачи в контентном продвижении.

      Ответить
  7. Алексей

    Автору спасибо за статью!
    Всегда проверяю тексты на Текст.ру
    Но, там есть ограничение по символам, большую статью разбиваю на несколько частей и прогоняю ее.

    Ответить
    1. Светлана Стецко автор

      Да, максимально 15000 знаков для бесплатной версии. У меня изначально эта статья была на 17 тысяч знаков, так я её переписала и сократила до 15 000, чтобы записать этот видеоролик для обзора)

      Ответить
  8. Валерий

    Полезная и важная статья, особенно для тех, кто ведет свой сайт или блог. А я из таких. Спасибо за ваш труд!

    Ответить
    1. Светлана Стецко автор

      Рада, что статья оказалась полезной. Благодарю за отзыв.

      Ответить
  9. Евгений

    Я пользуюсь сервисом текст ру лично мне он нравиться, да и хватает с головой

    Ответить
    1. Светлана Стецко автор

      Отличный выбор. Он сразу даёт все важные показатели: уникальность, заспамленность и воду. Я бы ещё посоветовала Адвего, тем более, что он обрабатывает статьи до 100 тысяч знаков, чего не может сделать Text.ru.

      Ответить
  10. Светлана

    Осень подробно, нашла много полезного для себя.

    Ответить
    1. Светлана Стецко автор

      Очень рада, желаю вам отличных результатов.

      Ответить