Подпишитесь на оповещения
от Газеты.Ru
Дополнительно подписаться
на сообщения раздела СПОРТ
Отклонить
Подписаться
Получать сообщения
раздела Спорт

«Существуют целые фабрики, где лепятся псевдонаучные тексты»

Создан «Корчеватель» по-французски»: программа, которая выявляет фальшивые научные работы, созданные компьютером

Григорий Колпаков 27.03.2015, 16:52
В. Коваль. Троицкий вариант В.Коваль
В. Коваль. Троицкий вариант

Во Франции создана программа, позволяющая выявлять фальшивые научные работы, сгенерированные компьютером. Эксперты считают, что, хотя программа и выложена в открытый доступ, кардинально ситуацию с фальшивыми научными статьями это не изменит: против бессмыслицы, созданной человеком, программа бессильна.

Большинство читателей, интересующихся наукой, вероятно, помнят российский скандал под условным названием «Корчеватель», когда группа ученых во главе со знаменитым биофизиком Михаилом Гельфандом сгенерировала с помощью программы SCIgen бессмысленную статью и послала ее для публикации в один из Российских нереферируемых журналов. Та бредовая статья прошла рецензию и была опубликована: народ сильно смеялся, а редакция спешно убрала статью со своего сайта.

Программа SCIgen была создана в 2005-м тремя аспирантами Массачусетского технологического института именно для тех целей, для которых она была использована в проекте «Корчеватель» в 2005 году, — показать отсутствие каких-либо экспертиз на конференциях низкого качества, что позволяет публиковать за деньги какую угодно псевдонаучную белиберду. Там тоже случился анекдотический скандал наподобие нашего «Корчевателя», заставивший устроителей ежегодной конференции World Multi-Conference on Systemics, Cybernetics, and Informatics (WMSCI) отозвать две фальшивые публикации.

Но одновременно эта программа оказалась очень хорошим подспорьем для тех, кто эту белиберду генерирует.

Она быстро распространилась по всему миру, появились ее бесчисленные версии, позволяющие писать научные бессмыслицы на любые темы, от математики до теории постмодернизма.

Все это безнаказанно продолжалось до 2012 года, пока компьютерный специалист Кирилл Лаббе из Университета Жозефа Фурье в Гренобле не разработал метод для автоматического обнаружения текстов, сгенерированных программой SCIgen, которая в случайном порядке комбинирует последовательности слов, создающие впечатление научной, но вполне бессмысленной публикации. Принципы своего метода он опубликовал тогда в журнале Scientometric. C помощью этого метода он разоблачил 85 псевдонаучных докладов, принятых на 24 компьютерных конференциях, а чуть позже вынудил издательство Springer отозвать еще 120 результатов компьютерного творчества.

В ответ Springer не только не обиделось, а, наоборот, очень заинтересовалось работой Кирилла Лаббе и заключило с ним контракт на апгрейд его программы.

Представители издательства о сумме контракта умалчивают, но намекают, что этих денег вполне хватило Лаббе, чтобы оплатить три года работы в его лаборатории еще одного аспиранта.

SciDetect, новая программа из лаборатории Кирилла Лаббе, работает в основном по тем же принципам, что и прежняя, но серьезно усложнена применением статистической техники, подобной той, которая применяется для распознавания спама, и выискивает не ключевые слова, а грамматические особенности, позволяющее уловить «руку машины». По заявлению представителей Springer, программа очень гибкая и может быть адаптирована ко многим софтам наподобие SCIgen.

В разговоре с «Газетой.Ru» Михаил Гельфанд, уже упоминаемый нами в связи с «Корчевателем», не слишком высоко отозвался о новом оружии издательства Springer против жуликов.

«Конечно, это осложнит им жизнь и заставит самостоятельно писать бессмысленный бред, но самой ситуации это не изменит, — заявил Гельфанд. — Программа SciDetect может отлавливать лишь те тексты, которые генерируются компьютером, и беспомощна перед бессмыслицей, созданной человеком».

По его словам, создание фейковых статей давно уже является для издателей и для всего научного сообщества ночным кошмаром по вполне объективным причинам. Одна из них — создание научных интернет-журналов с открытым доступом. Само по себе явление, которое нельзя не приветствовать, очень способствует появлению этого вида жульничества.

«Автор, которому нужна публикация, платит за фальшивую статью, редактор ее публикует, потратив на создание фейкового журнала 10–20 минут, — говорит Гельфанд. — Получается что-то вроде симбиоза фальшивых авторов и фальшивых редакторов. Есть и вторая причина — усилившееся давление на исследователей, которым требуются публикации для отчетности, для получения грантов, поддержания репутации.

Я подозреваю, что кое-где существуют целые фабрики, где лепятся эти псевдонаучные тексты.

Например, мне, как члену редколлегии журнала «Молекулярная биология», очень часто приходят из Китая статьи, вполне наукообразные, вполне бессмысленные, но очень похожие, будто написанные одной и той же рукой. Полагаю, там существует целый бизнес по их производству. Так что на сегодня никакой компьютер не в состоянии заменить нормального эксперта».