«Вода» (водянистость) текста – это доля слов и фраз без собственной смысловой нагрузки (так называемых стоп-слов). Иными словами, текст считается водянистым, если в нём много служебных конструкций, вводных оборотов и общих слов, которые не добавляют новой информации. SEO-сервисы подчёркивают: высокий процент «воды» ухудшает читаемость, приводит к оттоку посетителей и снижению поведенческих показателей сайта. Для поисковых машин сам процент «воды» формально не важен, но избыточная «вода» обычно ассоциируется с низкосодержательными статьями, что в итоге отрицательно сказывается на ранжировании.
Однако полностью избавляться от всех служебных слов тоже нельзя – текст станет сухим. Оптимальная цель – сделать текст информативным и «живым»: убрать лишние обобщения, конкретизировать идеи и минимизировать «водянистые» обороты.
Механизм подсчёта водности в автоматических системах
SEO-аналитики автоматически оценивают «водность» по примерно одинаковому принципу: подсчитывают число так называемых стоп-слов и считают их отношение к общему числу слов. Обычно к «стоп-словам» относятся служебные части речи и часто встречающиеся общие конструкции. По сути, алгоритм делает разметку текста на части речи (или сверяется с заранее составленным списком «водных» слов) и вычисляет процент «бесполезных» позиций. Например, Advego прямо указывает: «Процент воды определяется как отношение незначимых слов к общему количеству слов». Аналогично Text.ru помечает вводные и часто употребляемые обобщающие слова цветом, подсчитывая их долю (нормой считается 15–30 % по их шкале).
Важно: автоматические инструменты фокусируются на формальных признаках. Они обычно считают предлоги, союзы, частицы, вводные слова и междометия «водой» – хотя с точки зрения смысла текста многие из них могут быть оправданы. У «живого» текста вводные слова допустимы, а программы их всё же считают лишними. Тем не менее общий механизм таков: каждое слово проверяется по словарю «водных» слов/конструкций, и по итогам высчитывается процент «воды».
Категории «водных» слов и выражений
Часто встречающиеся «водные» единицы можно разбить на категории:
- Вводные слова и конструкции. «Как известно», «во-первых», «кстати», «однако», «тем не менее», «в сущности», «итак», «мол», «в самом деле» и т.п. Эти слова обычно добавляют эмоцию или переход, но не несут нового смысла.
- Оценочные и общие прилагательные. Обобщённые эпитеты типа «хороший», «важный», «интересный», «качественный», «уникальный», «всесторонний», «масштабный», «роскошный» и т.п. Они описывают предмет в общих чертах и «разбавляют» текст. Например, «вкусный завтрак» можно заменить описанием конкретных блюд.
- Усилители и обобщители. «Очень», «абсолютно», «сверхъестественно», «весьма», «всего лишь», «максимально», «наиболее» и т.д. Эти слова не добавляют фактов, а лишь усиливают оценку.
- Штампы и канцеляризмы. Расхожие фразы-клише: «вообще говоря», «на сегодняшний день», «в целях (чего-либо)», «с одной стороны… с другой стороны», «следует отметить», «далее», «к вышесказанному» и т.п. Также это устойчивые выражения: «расширили географию продаж», «иное дело, что…», «изюминка проекта», «не секрет, что…» и т.д. Они делают текст формальным и затянутым.
- Модальные и «бытийные» глаголы. «Мочь», «надо», «следует», «должен» (например, «может быть удобно», «следует отметить», «надо сказать») без конкретного действия делают фразу неопределённой. К «бытийным» относятся «быть», «являться», «существовать», «находиться» и т.п. Они сообщают о факте существования, но не о действии, поэтому считаются слабыми (водянистыми) глаголами. Например, «в далёкой Австралии существуют школы» проще заменить «в Австралии создавались школы».
- Неопределённые слова. «Примерно», «около», «почти», «в целом», «вообще» — слова-уточняющие, которые делают смысл расплывчатым. В SEO-тексте предпочтительны чёткие формулировки вместо «около 10 человек» (лучше «10 человек»).
- Междометия и обращения. «Уважаемые клиенты», «дорогие коллеги» и междометные восклицания («ах!», «ой!») – в большинстве коммерческих и информационных текстов подобные вставки считаются лишними.
Все вышеперечисленные элементы можно считать «водой» – при удалении или замене их на более конкретные формулировки текст становится более плотным и ёмким.
Примеры водянистых фраз и их доработки
- Пример 1 (канцеляризм + модальность): «Это может быть удобно для заказчиков, которым нужно написать большой объем текста.»
Улучшение: «Этот способ удобен заказчикам, которым требуется текст большого объёма.».
Здесь удалены слова «может быть» и «нужно написать», а пассивный «способ» превращён в подлежащее, что сразу делает фразу короче и яснее. - Пример 2 (фраза-ввод): «Организация корпоратива дает возможность сблизить коллектив и подарить ему приятное времяпрепровождение.»
Улучшение: «Наше агентство организует корпоративы, чтобы сплотить коллектив и подарить ему незабываемый праздник.»
Фраза «дает возможность» не несёт информации (читателя не интересует, что оно даёт возможность – важнее, что делается). Перефразирование убрало лишнюю обобщённость и усилило конкретику. - Пример 3 (плеоназм): «Подняться вверх по лестнице».
Улучшение: «Подняться по лестнице».
Слова «вверх» избыточно, так как «подняться» уже подразумевает движение вверх.
Эти примеры иллюстрируют общий принцип: если после удаления или перефразирования «водяной» части смысл не меняется, то от неё лучше избавиться.
Нормативный процент «воды» для SEO-текста
Точных стандартов нет, но на практике часто приводят следующие ориентиры:
- Text.ru: до 15 % воды считается естественным, 15–30 % – допустимо, свыше 30 % – много воды. (Эта градация отражает внутреннюю оценку сервиса.)
- Advego: нормой считают примерно 55–75 % (они измеряют не «воду» напрямую, а долю «полезных» слов от всех и трактуют обратное как воду).
- Другие источники: часто упоминают порог около 60 % как ориентир «не более» воды.
Разные сервисы и специалисты могут рекомендовать разные числовые значения, но общее правило такое: чем ниже «водность», тем информационнее (и обычно полезнее) текст. Для SEO-продвижения принято стремиться к водности ~20–30% или ниже, особенно в продающих и информационных материалах.
Ручная методика оценки водности
Вручную «водность» можно оценивать по похожему принципу: в тексте подчёркивают или выписывают все служебные и «штампованные» слова и фразы, а затем оценивают их долю. Полезно пройтись по тексту и задать себе вопросы:
- Изменится ли смысл, если убрать это слово/фразу? Если ответ «нет», то это «вода», и слово можно исключить (например, «вообще», «во-первых», «именно» часто убирают без потери смысла).
- Можно ли сказать то же короче? Если при попытке перефразировать предложение фраза исчезает, она водянистая. Например, «дабы повысить эффективность» можно заменить на «для эффективности».
- Слишком ли общее описание? Например, вместо «всем известно, что…» стоит указать конкретный факт или цифру.
При чтении стоит обращать внимание на частую череду союзов и предлогов, на описательные эпитеты, вводные конструкции и канцеляризмы. Можно постепенно вычеркивать по одному «водяному» слову в каждом предложении и смотреть, уплотняется ли смысл. В идеале к концу такого анализа останутся только значимые слова и конструкции, несущие ключевую информацию.
Также вручную можно просчитать «сырой» процент воды: подсчитать общее число слов, затем число стоп-слов (например, из списка выше) и найти их отношение. Если служебных слов оказывается слишком много (например, каждый третий–четвёртый), текст явно водянист. Этот метод грубый, но наводит на мысль. Копирайтеры советуют: не стесняйтесь редактировать текст несколько раз, и после каждого прохода читать его как для читателя – слишком сухого текста быть не должно, но и «болтовня» здесь ни к чему.
Пример простого скрипта на Python
Ниже – пример упрощённого консольного скрипта на Python, который подсчитывает долю «водных» слов в тексте по заданному списку стоп-слов. Это демонстрация логики без привлечения сложной лингвистики:
import re
text = input(“Введите текст: “)
# Набор типичных стоп-слов (можно расширить)
stop_words = {
“и”, “в”, “на”, “что”, “который”, “также”, “вообще”,
“очень”, “абсолютно”, “примерно”, “почти”, “кстати”,
“настоящий”, “суть”, “далее”, “итак”, “во-первых”, “во-вторых”,
“нужно”, “именно”, “конечно”, “даже”, “безусловно”
}
# Разбиваем текст на слова (простейшая токенизация)
words = re.findall(r’\w+’, text.lower())
if not words:
print(“Текст пуст.”)
exit()
# Считаем стоп-слова
water_count = sum(1 for w in words if w in stop_words)
total = len(words)
water_ratio = water_count / total * 100
print(f”Всего слов: {total}. Стоп-слов (вода): {water_count}.”)
print(f”Водность текста: {water_ratio:.1f}%”)
Этот скрипт принимает текст, разбивает его на слова и считает, сколько раз встречаются заранее определённые «водные» слова. По отношению этого числа к общему числу слов получается «процент воды». Конечно, на практике словарь стоп-слов стоит расширять (включать различные формы слов, фразы, канцеляризмы и т.д.), а для точности можно применять морфологический анализ. Но даже такой примитивный подсчёт поможет оперативно оценить водность текста и увидеть «тёмные пятна» (фразы, в которых много стоп-слов).