Шингл – это фрагмент текста длиной в несколько слов, с которым работает программа проверки уникальности. Весь текст разбивается на отдельные фрагменты заданной фиксированной величины (от трёх до восьми слов), а программа проверяет наличие таких же фрагментов текста (шинглов) в размещенных ранее документах в сети Интернет.
Уникальность проверяемого документа зависит от длины шингла. К примеру, если задать размер шингла в одно слово, то в Интернете всегда найдется хотя бы один документ, в котором будет встречаться каждое слово, существующее в проверяемом документе – уникальность такого документа будет равна нулю. Если создать выборку из девяти слов, то уникальность проверяемого документа возрастет, ведь найти два документа с одинаковыми фрагментами текста из девяти слов сложно.
Метод шинглов, с размером шингла равным, например, 3, ищет совпадения только по 3 рядом идущим словам. То есть слова не просто должны совпасть, но и идти в том же порядке, без перестановок.
Если у вас в тексте практически не было совпадений по трехсловным шинглам, проверка ничего не найдет.
В программе есть выбор глубины проверки, а также возможность выбрать свои настройки.
Чтобы проверить текст на программе Етхт необходимо скачать и установить приложение с
сайта программы.