| name | Russian Text Humanization |
| description | Натурализация русскоязычного текста - убрать маркеры ИИ-генерации. Использовать когда:
Хабр-статьи, блоги, маркетинг, любой русский текст который не должен читаться как ИИ.
Покрывает: слова-маркеры, калькирование, канцелярит, ритм, отглагольные существительные.
Источники: Liang et al. (arxiv 2406.07016), gramota.ru, Хабр 918226, Sber GigaCheck.
Use BEFORE publishing any AI-generated Russian text.
|
Натурализация русского текста
Когда использовать
- Статьи на Хабр, блоги, маркетинговые тексты
- Полировка ИИ-черновиков до человеческого звучания
- Любой русский текст который не должен восприниматься как сгенерированный
Главный принцип
Специфичность против обобщённости. Человек пишет конкретно: имена, даты, версии, личный опыт. ИИ пишет общо: покрывает все базы, хеджирует, использует самые частотные формулировки. "Гладко но пусто" - подпись ИИ.
Слова-маркеры (ЗАПРЕЩЕНЫ)
Tier 1 - Убить немедленно
| Маркер | Замена |
|---|
| является | тире или перефразировать ("X - это Y" или просто убрать) |
| выступает (в роли) | работает как, служит |
| играет важную/ключевую роль | важен для, влияет на |
| не просто..., а... | перефразировать напрямую (любимая конструкция ChatGPT) |
| мощный (инструмент/подход) | быстрый, удобный, рабочий - что конкретно мощного? |
| позволяет | можно, даёт, через X можно Y |
| обеспечивает | даёт, гарантирует, делает возможным |
| данный (подход/метод) | этот, или убрать |
Tier 2 - Отглагольные существительные (deverbal nouns)
ИИ злоупотребляет ими. Заменять глаголами:
| Канцелярит | По-человечески |
|---|
| привлечение пользователей | привлекать пользователей / чтобы пришли пользователи |
| обеспечение качества | чтобы качество не падало / следить за качеством |
| тестирование функционала | тестировать фичи / гонять тесты |
| использование инструментов | пользоваться инструментами |
| осуществление перехода | перейти |
| проведение анализа | проанализировать / разобраться |
Tier 3 - Фразы-индикаторы
| Убить | Почему | Замена |
|---|
| Я надеюсь, это помогло Вам | чатбот-маркер | убрать |
| Конечно / Безусловно (в начале) | ChatGPT opening pattern | убрать |
| Вы абсолютно правы | подхалимаж чатбота | "да, верно" / "ок, принято" |
| По состоянию на [дата] | калька с английского "as of" | "на сегодня" / "сейчас" |
| Сообщите мне | калька "let me know" | "дай знать" / "напиши" |
| более подробный анализ | канцелярит | "разберу подробнее" |
| В заключение хотелось бы отметить | пустая связка | просто написать вывод |
| Стоит отметить, что | пустая связка | убрать, сразу к сути |
| Честный нюанс / Честный дисклеймер | LLM-конструкция, люди так не говорят | просто новое предложение с фактом, или UPD: |
| Важно понимать, что | LLM-преамбула | убрать, сразу к факту |
| Следует учитывать | канцелярит-LLM | убрать, сразу к факту |
| Необходимо отметить | канцелярит-LLM | убрать |
| Правда есть одно но | устаревшая письменная связка | просто новое предложение |
| Однако / Впрочем / Тем не менее | формальные коннекторы, в онлайн-тексте редко | новое предложение без связки |
| Стоит сказать / Надо сказать | LLM-преамбула | убрать, сразу к сути |
Принцип: коннекторы не нужны
Современная письменная русская речь (Хабр, Telegram, чаты) упростилась. Вместо связок типа "правда", "впрочем", "стоит отметить" - просто новое предложение с фактом. Для явной вставки/поправки - UPD:.
LLM: "Спасибо за наводку, посмотрю. Честный нюанс: у меня managed-окружение, обновить не так просто."
Человек: "Спасибо за наводку, посмотрю. У меня managed-окружение, обновить не так просто."
Человек (с явной вставкой): "Спасибо за наводку, посмотрю. UPD: у меня managed-окружение, обновить не так просто."
Структурные маркеры ИИ
Порядок слов
Русский - язык со свободным порядком слов. ИИ калькирует английский SVO:
ИИ (калька): "Модель обеспечивает высокое качество обработки."
Человек: "Качество обработки у этой модели - огонь." / "Обрабатывает она, надо сказать, отлично."
Предложения
- ИИ: все предложения средней длины, максимум 2 части в сложном
- Человек: от 3 слов до 40, вложенные придаточные, причастные обороты, иногда обрывает мысль
Абзацы
- ИИ: одинаковой длины, каждый начинается с отглагольного существительного + двоеточие
- Человек: один абзац - одно предложение, следующий - пять. Неравномерно
Логика
- ИИ: абзацы можно переставить без ущерба для смысла (нет логической цепочки)
- Человек: каждый следующий абзац вытекает из предыдущего, есть внутренняя аргументация
Дополнительные паттерны ИИ (из Wikipedia "Признаки сгенерированности текста")
| Паттерн | Пример | Исправление |
|---|
| Правило трёх - триады прилагательных | "яркий, богатый, разнообразный" | Убрать до одного точного слова |
| Ложный диапазон (мерисм) | "от лёгкого до тяжёлого" | Конкретное значение вместо range |
| Замена имени синонимом | "данный специалист", "вышеупомянутый проект" | Просто повторить имя/название |
| Безымянные эксперты | "по словам экспертов", "исследования показывают" | Конкретная ссылка или убрать |
| Проблема → вагонный оптимизм | "Несмотря на проблемы, перспективы выглядят многообещающе" | Конкретный прогноз или честное "не знаю" |
| Определение в начале | "X - это..." как первое предложение | Начать с контекста, проблемы, истории |
| Рекламные кластеры | "потрясающая природная красота", "богатое культурное наследие" | Конкретный факт |
| Капитализация заголовков | "Как Правильно Настроить Конфиг" (English style) | По-русски: только первое слово с большой |
Стилистические маркеры
| Маркер ИИ | Что делает человек |
|---|
| Канцелярский язык | Живая речь, разговорные элементы |
| Идеальная пунктуация | Стратегические "ошибки", разговорный стиль |
| Повтор мыслей разными словами | Новая информация в каждом предложении |
| Обезличенность | Субъективность, "я думаю", "мне кажется" |
| Равномерное распределение акцентов | Фокус на главном, проскакивание второстепенного |
| Отсутствие юмора | Ирония, самоирония, неожиданные сравнения |
Разговорные элементы (добавлять)
Человек пишет с разговорными вкраплениями даже в техническом тексте:
- Частицы: ну, вот, кстати, вообще-то, правда, ведь, же
- Вводные: короче, в общем, допустим, грубо говоря, если честно
- Оценочные: нормально, ок, фигня, круто, дичь
- Самокоррекция: "хотя нет, подождите...", "ну точнее не совсем так..."
- Риторические вопросы: "А смысл?", "И что?", "Знакомо?"
Дозировка: 1-2 разговорных элемента на 500 слов. Больше - развязно. Меньше - стерильно.
Техники для технических статей
- Начинать с проблемы которая была у тебя лично, не с обзора темы
- Включать тупики - "Я попробовала X, не сработало потому что..."
- Показывать реальные error messages, stack traces, версии
- Свои цифры - "заняло 47 минут на моём MacBook M1"
- Конкретные инструменты с версиями - не "популярный фреймворк"
- Не соглашаться с чем-то - занять позицию
- Признавать что не понимаешь - "честно, я до сих пор не понимаю зачем тут..."
- Код из реального проекта, не generic примеры
- Упоминать время - "в 2 ночи я поняла что..."
- Скриншоты своего терминала/IDE, не стоковые
Чеклист перед публикацией
Отличия от английского
| Аспект | Английский | Русский |
|---|
| Порядок слов | SVO фиксирован, не маркер | Свободный, SVO = подозрительно |
| Морфология | Бедная, не детектится | Богатая, ИИ упрощает формы |
| Отглагольные | Норма | Сильный сигнал ИИ |
| Связка "to be" | Нормально | "является" = красный флаг |
| Калькирование | Нет проблемы | Структуры "переведённые с английского" |
| Грамматические ошибки | Мало у людей | Люди допускают в разговорном стиле |
Источники
Академические
- Liang et al. (2024) - arxiv 2406.07016 - 15M+ абстрактов, 280 excess words (принципы применимы к русскому)
- Human-LLM Coevolution (arxiv 2502.09606) - маркеры меняются со временем
Русскоязычные
- gramota.ru - признаки ИИ-сгенерированного русского текста
- Хабр (habr.com/ru/articles/918226/) - 14 признаков + чеклист гуманизации
- Русская Википедия - "Признаки сгенерированности текста"
- Sber GigaCheck (developers.sber.ru) - ИИ-детектор для русского, 94.7% accuracy