Поверхностный рерайт можно делать используя метод пересказа, или, используя приложение 1 разбивать n-граммы текста авторским контентом. Ниже приведена иллюстрация процесса автоматизации этого метода.
Рисунок 9 – Пример сверки двух текстов по методу Ш2, левое окно, текст переведенный на китайский и затем на русский, правое окно – текст источник, показатель отличия см. внизу, справа
Лёгкий рерайт не требует глубоких знаний стилистики и лингвистики, что делает его доступным для широкого круга пользователей. Поверхностное перефразирование может быть достаточно эффективным подходом для повышения оригинальности текста в системах проверки заимствований, основанных на элементарном сравнении слов и фраз (РуКонтекст, антиплагиат ру, бесплатная версия).
Антиплагиат ВУЗ использует более сложные алгоритмы анализа текста, основанные на методе Ш2, поэтому легкий рерайт не преодолеет порог срабатывания модуля поиска перефразирования и модуля поиска рерайта, который лежит на границе выше 80%.
Ниже приведены сравнения эффективности двух онлайн-переводчиков, примененных для поверхностного рерайта текстов, сверка отличия осуществлена по параметру Ш2 (сверка шинглов, состоящих из двух слов), табл. 1.
Таблица 1 – Показатель отличия текстов Ш2 для онлайн-переводчиков DEEPL и translate. google
Из таблицы 1 видно, что большее отличие текстов, по сумме балов, достигает translate. google, абсолютными лидерами, дающими наибольшее отличие выступают: финский, китайский (традиционный), китайский (упрощенный), эстонский, японский языки.
Переводчик DEEPL демонстрирует не плохие результаты отличие текста по показателю Ш2 на следующих языках: китайский (традиционный), китайский (упрощенный), финский, эстонский, венгерский. Как заверяют разработчики DEEPL, переводчик самый точный в мире.
Производительность – в среде файлового перевода translate. google – 100 тыс. знаков в минуту, в интерфейсе – 10—15 тыс. в минуту. В интерфейсе DEEPL, 50 тыс. знаков в минуту.
В целом, для поверхностного рерайта можно рекомендовать финский, китайский и эстонский языки. Уровень поверхностного рерайта лежит в границах менее 80% отличия текстов по показателю Ш2.
ЧР – Глубокий рерайт и перефразирование
Глубокое перефразирование текстов актуально для всех сервисов проверки на уникальность, несмотря на значительную трудозатратность. Основная задача такого процесса заключается в систематичном внедрении новых слов после второго-четвёртого слова или замене существующих 2, 3, 4 слов. Что и как менять, какой это дает результат, показывает Приложение 1. Аксакалы традиционных школ рекомендуют текст прочитать и напечатать его своими словами по памяти, пересказать, другими словами. Метод имеет право на жизнь, хотя при наличии в доме пылесоса редкий эстет согласиться подметать пол зубной щеткой.
Глубокий рерайт подразумевает отличие текстов Ш2 на уровне более 80%. Исходя из таблицы 1, справедливо задаться вопросом, как онлайн-переводчики способны помочь в глубоком перефразировании. Обратимся к DEEPL и выполним цепочный перевод – русский – китайский (традиционный) – финский – эстонский – венгерский, это дает показатель отличия Ш2 – 85%.
Рисунок 10 – Цепочный перевод – русский – китайский (традиционный) – финский – эстонский – венгерский, это дает показатель отличия Ш2 – 85%
Как видно из рисунка 10, текст рерайта требуют вычитывания, так как содержит неточности, например, текст рерайта содержит фразу – «уличных праздников», вместо «уличного досуга». В целом текст читабелен и не составит особого труда его подправить.
В следующем эксперименте выполним круговой перевод – русский – китайский (традиционный) – русский – финский – русский – эстонский – русский – венгерский – русский, рис. 11.