Так как две предыдущие статьи про Антиплагиат (часть 1, часть 2) пользуются на сайте большой популярностью (мне даже пришлось отключить для них комментарии — уж очень много там было рекламы и ненужных «дебатов») я решил продолжить тему проверки текстов на наличие заимствований.
Если в первых двух статьях речь шла о различных технических приемах, позволяющих «обмануть» систему «Антиплагиат», то теперь я собираюсь написать о признаках плагиата в тексте.
Я на собственном опыте знаю, что система «Антиплагиат» — не истина в последней инстанции. Если есть какие-то подозрения, а «Антиплагиат» показывает хороший результат – можно учинить дополнительную проверку. А какие, собственно подозрения? За несколько лет я сформировал для себя ряд косвенных признаков, свидетельствующих о том, что в тексте есть заимствования.
Все эти признаки основаны на существовании ряда функций и приемов, доступных в Word и других текстовых редакторах, которые почти не применяются обычными пользователями, но «всплывают» при копировании и вставке текста откуда-либо. Если я обнаруживаю такие признаки — текст проходит дополнительную проверку (об этом ниже).
Прежде чем я их перечислю, давайте уточним некоторые детали:
1) речь идет именно о наличии банальных заимствований в тексте, а не о каких-либо технических приемах, позволяющих обмануть «Антиплагиат»;
2) приведенные ниже признаки, являются косвенными. То есть – всего лишь сигналами на то, что надо провести более пристальную проверку, не более. Т. е. наличие их не означает наличие плагиата с вероятностью 100%;
3) верно и обратное – то, что этих признаков нет, вовсе не означает, что нет и заимствований;
4) признаки являются чисто техническими, никаких филологических ухищрений;
5) для того, чтобы попытаться обнаружить эти признаки Вам понадобиться сам текст в формате doc или docx и текстовый редактор (желательно Word).
Итак, открываем нужный файл в Word, включаем режим «отобразить все знаки» и начинаем просматривать текст. Что нас может ждать там?
Символ перевода строки в конце каждой строки
Символ перевода строки сам по себе не очень популярен у пользователей. В конце же каждой строки он появляется при копировании и вставке в Word текста из браузера.
Много неразрывных пробелов
Похожий на предыдущий признак. Вы сами часто при наборе текстов используете символ «неразрывный пробел» (отображается «вордом» как кружочек)? С вероятностью 99% ответ «никогда». А вот при вставке текста из сети они появляются частенько. Выводы сделать не сложно.
Перейдем к менее очевидным признакам.
Неоднородное форматирование
При взгляде на рисунок глаз сам сразу цепляется за «косяк», даже стрелочка была не обязательна.
Да, такое может получиться случайно и при наборе (или редактировании) текста. Но между тем, всегда есть определенная вероятность, что вот этот кусочек – откуда-то «спионерили».
Неоднородные параметры шрифта
А вот это — сложный, но довольно достоверный признак. Неоднородность таких параметров шрифта междустрочный интервал (это как раз легко) или интервал между символами.
Чаще бывает именно второе – при вставке из PDF получаются кусочки текста с уменьшенным интервалом между символами. Выглядит это вот так (нажмите на картинку для увеличения):
Если хорошенько присмотреться, можно увидеть, что интервалы между буквами в верхнем абзаце меньше. Для наглядности открыто окно настройки шрифта, где вы можете видеть, что он уплотнен на 0,3 пт. Это лишь поначалу кажется сложным, после некоторого количества тренировок, глаз сходу цепляется за такие мелочи.
Фон у текста
Бывает, что у текста можно обнаружить едва заметный серый фон. Эффект проявляется при вставке текста с сайтов, при этом он характерен тем, что стандартными средствами Word его убрать нельзя (только полный сброс форматирования помогает), поэтому такой признак встречается особенно часто.
На приведенном для примера изображении фон виден довольно хорошо, бывает же, что он едва различим. Однако, в любом случае, если Вы видите такой фон, и он не убирается штатными средствами Word — можно с большой вероятностью утверждать – текст был скопирован где-то в сети и вставлен в документ.
Отсутствие маркеров или нумерации в списках
Вы видите в тексте список, налицо все признаки – каждая новая строка начинается с маленькой буквы, а в конце стоит точка с запятой. Только вот ни маркеров, ни нумерации нет. Это так же довольно распространённый эффект при копировании текста откуда-либо.
Как видите, признаки довольно простые. Однако, они не раз оправдывали себя – подозрения оказывались не напрасными.
Как дополнительно проверить текст?
Простейшей (и очень эффективной!) дополнительной проверкой является выборочный прогон трех – пяти случайно выбранных фраз из текста через поисковые системы. Можно воспользоваться и другими инструментами – существует целый ряд программ и сервисов, схожих с «Антиплагиатом», но ориентированных скорее на копирайтеров и их клиентов, нежели на науку и образование. Это, однако, не мешает им находить заимствования.
Как автор, регулярно пишущий статьи в научные журналы, не могу согласиться с вот этим утверждением:
>> Вы сами часто при наборе текстов используете символ «неразрывный пробел» (отображается «вордом» как кружочек)? С вероятностью 99% ответ «никогда».
Ибо я всегда ставлю неразрывный пробел между числом и единицей измерения, фамилией и инициалами и другими подобными «парами», которые не должны разрываться при изменении форматирования текста.
Ну согласитесь, что Вы их во-первых ставите не везде, а во-вторых — как редактор научного журнала уверяю — Вы такой один на тысячу.