Пенсионный советник

Телескоп и читальный зал в одном мониторе

Наука XXI века — это большое количество стандартизированных данных и доступ к ним

Николай Подорванюк 23.06.2011, 16:12
Thinkstock/Fotobank.ru

Современные реалии науки XXI века: поработать в Британской библиотеке, не приезжая в Лондон, и сделать выдающееся открытие в астрономии, обработав наблюдения десятилетней давности. В скором времени аналогичные принципы работы будут справедливы и в других науках.

В начале нынешней недели стало известно о начале сотрудничества между Британской библиотекой и поисковой системой Google, в рамках которого будет произведена оцифровка 250 тысяч книг. Речь идет о текстах периода между 1700 и 1870 годами — времени, за которое «мир стал свидетелем промышленного переворота, Великой французской революции, Трафальгарской битвы и Крымской войны». Одними из первых будут оцифрованы памфлет о королеве Франции Марии-Антуанетте и относящаяся к 1858 году работа испанского изобретателя Нарсисо Монтуриоля, которая считается одним из первых в мире проектов подводной лодки.

В соответствующем пресс-релизе представители библиотеки отмечают, что в результате данного проекта исследователи, студенты и все желающие смогут «просматривать исторические элементы из любой точки мира», а также выполнять другие работы с этими текстами в некоммерческих целях.

По словам исполнительного директора Британской библиотеки Линн Бриндли, этот проект отвечает просветительским устремлениям руководства библиотеки начиная с XIX века — сделать знания доступными для всех.

«В то время этого можно было добиться, скупая все издаваемые в мире книги и предоставляя доступ к ним в читальных залах, — сказала Бриндли. — Мы продолжаем эту славную традицию максимальной доступности нашей коллекции. Наша цель — предоставить постоянный доступ к этому историческому материалу, и мы надеемся, что наши богатства в сочетании с ноу-хау Google помогут нам достичь этого».

Отметим, что пока речь идет о небольшой части коллекции Британской библиотеки: вся коллекция насчитывает более 150 млн наименований. Кроме того, подобные партнерские соглашения Google заключила уже с 40 библиотеками во всем мире — правда, нередко компания сталкивается с проблемами при оцифровке произведений, охраняемых законами об авторском праве.

Возможность дистанционного изучения исторических материалов существенным образом повлияет на тех представителей гуманитарных наук, которые по своей работе сталкиваются с материалами из Британской библиотеки, которые вскоре будут оцифрованы. Грубо говоря, буквально через несколько месяцев у ряда исследователей отпадет необходимость организовывать командировку в Лондон (тратить деньги на билеты, оформлять визу, бронировать гостиницу) для того, чтобы ознакомиться с материалами Британской библиотеки, потому что эту работу можно будет выполнить столь же эффективно из своего дома или со своего рабочего места в институте.

Такой метод работы, когда существует большая база данных — материалов для исследований, а у ученых существует доступ к ней, — это одна из тенденций развития научных исследований в XXI веке.

Например, существуют доступные базы данных, в которых содержится информация о последовательности нуклеотидов, которые составляют человеческую ДНК. В химии существует огромное количество разных баз данных, в которых каким-либо образом классифицируются различные химические вещества, соединения и структуры.

В ряде наук, например в астрономии, дело пошло уже несколько дальше. Проведем аналогии между простой оцифровкой книг и астрономическими наблюдениями. Оба этих процесса, по сути, представляют собой процесс сбора данных. Для удобства работы с этими данными нужно привести их в единый формат. Так в астрономии возник альянс «Международная виртуальная обсерватория» по обобщению наблюдательных данных и способов доступа к ним.

По сути, ученые разных стран объединились для того, чтобы выработать единые стандарты работы с существующей астрономической информацией.

Конечно, процесс получения данных сам по себе является непростым, а уж сделать из этих данных единую стандартизированную базу — это сложно хотя бы потому, что это довольно дорого и провести такую работу без помощи государства или бизнеса довольно сложно. Но в первую очередь со стороны ученых должна быть инициатива, подобная той, что была в случае Виртуальной обсерватории.

Без такой инициативы эти данные в большинстве своем будут просто лежать без обработки, имея малый научный выход.

В отношении книг роль подобной Виртуальной обсерватории выполнила компания Google, которая сканирует книги в едином стандарте и к тому же берет все расходы на себя.

Инициатива Google и Британской библиотеки — необходимый и, в конечном счете, неизбежный шаг в процессе глобализации научной деятельности. Речь тут идет не о крупных международных исследовательских проектах, наподобие Большого адронного коллайдера или космических программ, и не об удаленной совместной работе участников общего научного проекта. Доступные базы позволяют сформировать новый уровень эффективности науки за счет привлечения новых участников из стран с активно развивающейся научной средой, вроде Китая и Бразилии, за счет экономии, скорости взаимодействия, а главное – возможности обрабатывать бескрайние массивы архивов и данных, накопленных исследователями.

Разумеется, тут много проблем. Для Google оцифровка Вселенной — часть общей стратегии развития, и для компании нет принципиальной разницы между Google Street View и библиотечными архивами XIX века. Очевидно, что оцифровка научного знания может выйти на новый уровень лишь при создании соответствующей международной структуры, которая будет поддерживать и координировать усилия по созданию баз знания. Возможно, ждать этого придется не слишком долго. Хотя препятствия кажутся непреодолимыми, логика развития технологий и научного процесса — тоже штука упрямая.