Косвенные признаки наличия плагиата в тексте

Так как две предыдущие статьи про Антиплагиат (часть 1, часть 2) пользуются на сайте большой популярностью (мне даже пришлось отключить для них комментарии — уж очень много там было рекламы и ненужных «дебатов») я решил продолжить тему проверки текстов на наличие заимствований.

Если в первых двух статьях речь шла о различных технических приемах, позволяющих «обмануть» систему «Антиплагиат», то теперь я собираюсь написать о признаках плагиата в тексте.

Я на собственном опыте знаю, что система «Антиплагиат» — не истина в последней инстанции. Если есть какие-то подозрения, а «Антиплагиат» показывает хороший результат – можно учинить дополнительную проверку. А какие, собственно подозрения? За несколько лет я сформировал для себя ряд косвенных признаков, свидетельствующих о том, что в тексте есть заимствования.

Все эти признаки основаны на существовании ряда функций и приемов, доступных в Word и других текстовых редакторах, которые почти не применяются обычными пользователями, но «всплывают» при копировании и вставке текста откуда-либо. Если я обнаруживаю такие признаки — текст проходит дополнительную проверку (об этом ниже).

Прежде чем я их перечислю, давайте уточним некоторые детали:

1) речь идет именно о наличии банальных заимствований в тексте, а не о каких-либо технических приемах, позволяющих обмануть «Антиплагиат»;

2) приведенные ниже признаки, являются косвенными. То есть – всего лишь сигналами на то, что надо провести более пристальную проверку, не более. Т. е. наличие их не означает наличие плагиата с вероятностью 100%;

3) верно и обратное – то, что этих признаков нет, вовсе не означает, что нет и заимствований;

4) признаки являются чисто техническими, никаких филологических ухищрений;

5) для того, чтобы попытаться обнаружить эти признаки Вам понадобиться сам текст в формате doc или docx и текстовый редактор (желательно Word).

Итак, открываем нужный файл в Word, включаем режим «отобразить все знаки» и начинаем просматривать текст. Что нас может ждать там?

 

Символ перевода строки в конце каждой строки

Символ перевода строки в конце каждой строки

Символ перевода строки сам по себе не очень популярен у пользователей. В конце же каждой строки он появляется при копировании и вставке в Word текста из браузера.

 

Много неразрывных пробелов

Похожий на предыдущий признак. Вы сами часто при наборе текстов используете символ «неразрывный пробел» (отображается «вордом» как кружочек)? С вероятностью 99% ответ «никогда». А вот при вставке текста из сети они появляются частенько. Выводы сделать не сложно.

 Много неразрывных пробелов

Перейдем к менее очевидным признакам.

 

Неоднородное форматирование

Priznaki3

При взгляде на рисунок глаз сам сразу цепляется за «косяк», даже стрелочка была не обязательна.

Да, такое может получиться случайно и при наборе (или редактировании) текста. Но между тем, всегда есть определенная вероятность, что вот этот кусочек – откуда-то «спионерили».

Неоднородные параметры шрифта

А вот это — сложный, но довольно достоверный признак. Неоднородность таких параметров шрифта междустрочный интервал (это как раз легко) или интервал между символами.

Чаще бывает именно второе – при вставке из PDF получаются кусочки текста с уменьшенным интервалом между символами. Выглядит это вот так (нажмите на картинку для увеличения):

Разные интервалы

Если хорошенько присмотреться, можно увидеть, что интервалы между буквами в верхнем абзаце меньше. Для наглядности открыто окно настройки шрифта, где вы можете видеть, что он уплотнен на 0,3 пт. Это лишь поначалу кажется сложным, после некоторого количества тренировок, глаз сходу цепляется за такие мелочи.

Фон у текста

Бывает, что у текста можно обнаружить едва заметный серый фон. Эффект проявляется при вставке текста с сайтов, при этом он характерен тем, что стандартными средствами Word его убрать нельзя (только полный сброс форматирования помогает), поэтому такой признак встречается особенно часто.

Фон у текста

На приведенном для примера изображении фон виден довольно хорошо, бывает же, что он едва различим. Однако, в любом случае, если Вы видите такой фон, и он не убирается штатными средствами Word — можно с большой вероятностью утверждать – текст был скопирован где-то в сети и вставлен в документ.

Отсутствие маркеров или нумерации в списках

Вы видите в тексте список, налицо все признаки – каждая новая строка начинается с маленькой буквы, а в конце стоит точка с запятой. Только вот ни маркеров, ни нумерации нет. Это так же довольно распространённый эффект при копировании текста откуда-либо.

Список без маркеров

Как видите, признаки довольно простые. Однако, они не раз оправдывали себя – подозрения оказывались не напрасными.

Как дополнительно проверить текст?

Простейшей (и очень эффективной!) дополнительной проверкой является выборочный прогон трех – пяти случайно выбранных фраз из текста через поисковые системы. Можно воспользоваться и другими инструментами – существует целый ряд программ и сервисов, схожих с «Антиплагиатом», но ориентированных скорее на копирайтеров и их клиентов, нежели на науку и образование. Это, однако, не мешает им находить заимствования.

комментария 2
  1. 4gost
    12.02.2016 в 00:24 Ответить

    Как автор, регулярно пишущий статьи в научные журналы, не могу согласиться с вот этим утверждением:

    >> Вы сами часто при наборе текстов используете символ «неразрывный пробел» (отображается «вордом» как кружочек)? С вероятностью 99% ответ «никогда».

    Ибо я всегда ставлю неразрывный пробел между числом и единицей измерения, фамилией и инициалами и другими подобными «парами», которые не должны разрываться при изменении форматирования текста.

    1. Александр Павлов
      12.02.2016 в 00:40 Ответить

      Ну согласитесь, что Вы их во-первых ставите не везде, а во-вторых — как редактор научного журнала уверяю — Вы такой один на тысячу.

Добавить комментарий

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.