Подпишитесь на оповещения
от Газеты.Ru
Дополнительно подписаться
на сообщения раздела СПОРТ
Отклонить
Подписаться
Получать сообщения
раздела Спорт

Стопка дисков от Земли до Луны

Сколько информации на планете Земля

Иван Куликов 14.02.2011, 10:42
Thinkstock/Fotobank.ru

Объем хранимой информации на планете Земля за двадцать лет увеличился примерно в сто раз, и, согласно подсчетам ученых, в 2007 году он составлял 295 эксабайт (295 миллиардов гигабайт).

Журнал Science опубликовал результаты исследования Мартина Гилберта (Университет Южной Калифорнии) и Присциллы Лопес (Открытый университет Каталонии), подсчитавших информационную емкость человеческой цивилизации. Целью работы было определить совокупный объем информации, доступной для искусственного хранения, передачи и обработки, то есть подсчитывались все, по возможности, учтенные и находящиеся в обороте данные, представленные в машиночитаемом виде. Заметим, что это очень важное ограничение, выводящее за скобки большой объем «немашинной» информации, представленной в виде прямых вербальных коммуникаций, а также мыслительной деятельности и биологической активности, совершаемых нами без участия искусственно созданных устройств и технологий.

С созданием искусственного интеллекта и техник, свободно манипулирующих геномом, это ограничение будет, возможно, снято.

Анализу подверглись 21 аналоговая и 39 цифровых технологий за период с 1986 по 2007 год. Эта выборка существенно превышает предыдущие (в частности, выборку компании EDC, сделавшей сходное исследование три года назад), и на данный момент ее можно считать самой полной. Для корректного подсчета совокупный объем информации был поделен на три группы: хранимая информация (учитывается емкость всех известных устройств хранения), передаваемая (емкость всех типов одно- и двунаправленных трансляций) и трансформируемая (емкость вычислительных процессов). Границы между технологиями иногда размыты, и такие тонкости тоже принимались в расчет. Простой пример — оперативная память RAM. Устройство запоминающее, но на самом деле оно является частью вычислительного процесса, поэтому отнесено к третьей группе.

Более сложный случай — технология печатных СМИ (газеты и журналы), которые участвуют как в передаче информации на значительные расстояния, так и в ее хранении на бумажных носителях. Вклад «газетных» мегабайт учитывался в обеих группах.

Для корректного суммирования разнородной информации, например — в газете с информацией на кассете VHS или микрочипе, используется методика унификации данных. Емкость всех информационных носителей конвертирована в байты и нормирована через коэффициенты сжатия, при этом каждой разновидности данных назначен свой коэффициент. Все это необходимо для построения финальной унифицированной шкалы. Понятно, что 1Мb несжатого видео в 1987 году содержал меньше информации, чем такой же мегабайт, сжатый MPEG-4 в 2007-м, и сопоставлять их некорректно. После оптимизации (взяв за точку отсчета современные алгоритмы компрессии) видеомегабайт 87-го года окажется равен оптимизированному 0,017 Мb, мегабайт 93-го (кодек Cinepack) — 0,33 Mb , 2000-го (MPEG-1) — 0,45 Мb. Такие же коэффициенты есть для текстовых и графических данных. Все подсчеты даются именно в оптимизированных байтах.

Широту охвата технологий и устройств можно оценить в специальном приложении к статье, где перечислены данные по информационному вкладу даже таких карликов, как калькуляторы, или более экзотичных случаев, например — рентгенографии. Под учет попали и игровые консоли, и виниловые пластинки, и цифро-аналоговые преобразователи, и промышленные микроконтроллеры, не говоря уже о книгах, аналоговом радио и даже традиционной почте. Неучтенной, пожалуй, оказалась лишь система дорожных знаков, пиктографическая информация в общественных местах, тексты Брайля, деревянные счеты, маркировки на устройствах машинно-человеческого интерфейса или устройства, основанные на троичной логике, но в такие дебри авторы решили не углубляться, да и надежной статистики по ним нет.

Согласно авторам публикации в Science, объем хранимой информации за двадцать лет увеличился на планете Земля примерно в сто раз — с 2,6 эксабайт (эксабайт — миллиард гигабайт) в 1986 году до 295 эксабайт в 2007-м.

Если посчитать этот объем информации в компакт-дисках, то в 1986 году понадобилось меньше чем одна болванка на человека, в 1993 — четыре CD на одного человека, 12 — в 2002-м, и, наконец, целый 61 диск пришелся бы на жителя Земли в 2007-м.

Стопка таких болванок покроет расстояние, на четверть большее, чем от Земли до Луны, а чтобы скопировать ее, потребовалось бы примерно 295 миллионов терабайтных винчестеров, или 295 миллиардов гигабайтных флешек.

При этом доля цифровых способов хранения (25%) еще уступала аналоговым в 2000 году, а резкий перелом произошел лишь в 2002-м, что можно считать официальной точкой отсчета цифровой революции. Так, через пять лет на долю цифры приходилось уже 94% хранимой информации. На долю бумажных носителей в 2007-м осталось 0,007% (0,33% в 1986-м, когда большая часть байт тоже пожиралась мультимедиа — кассетами VHS, виниловыми пластинками и аудиокассетами), хотя в общей сложности объем бумажной памяти увеличился в два раза с 8,7 до 19,4 петабайт (то есть вся бумажная информация уложилась бы в 2007 году на 20 тысячах терабайтных дисках).

В 2007 году совокупный объем переданной информации равнялся 2 зеттабайтам (два миллиарда терабайтных винчестеров). Подавляющая ее часть (1,9 Зб) приходится на технологии однонаправленного вещания, то есть все разновидности ТВ, телетекст, а также газеты, журналы и GPS. При этом только четверть такого вещания была цифровой. А вот на двунаправленные коммуникации в 2007-м пришлось несравнимо меньше — 65 эксабайт. Иначе говоря, в 2007-м на одного человека в день приходилось 784 Мб вещательных и только 27 Мб телекоммуникационных данных (в 1986-м — 241 и 0,16), и это с поправками на эффективное, то есть спорадическое использование этих каналов. Но даже с такими поправками одно вещательное устройство в среднем транслировало в 2007-м в 27 раз больше информации в день, чем один коммуникатор (компьютер, мобильный телефон, смартфон и пр.).

Грубо говоря, через телевизор три года назад изливалось в три раза больше информации, чем через интернет и связь — холодный душ на головы апологетов интернет-революции!

Впрочем, «зомбоящик» пока что побеждает, но быть ему лидером осталось недолго: за 20 лет темпы ежегодного прироста телекоммуникационных байтов опережали прирост вещательных в среднем в пять раз (6% в год — у вещателей, 28% — у телекоммуникаций). Также следует учитывать, что по вещательным каналам передаются большей частью «тяжелые» звук и видео, интернет же насыщен текстовыми и графическими данными, использующими меньше байт.

Если бы, к примеру, в 2007-м в космос к инопланетянам отправились бы все граждане Китая, то для того, чтобы взять с собой всю информацию за год — как искусственно записанную человечеством, так и переданную по всем каналам связи, — каждому китайцу нужно было бы выдать всего лишь два терабайтных винчестера.

Сложнее представить наглядно совокупную вычислительную емкость цифровых устройств (аналоговые — механические арифмометры, счеты, логарифмические линейки и пр. — используются уже ничтожно мало). Производимый на протяжении 2007 года всеми компьютерами 6,4 1012 миллион операций в секунду (МОПС) мало что дадут нашему воображению. А вот сравнительная динамика более интересна: в течение двадцати лет темпы роста именно вычислительных технологий (83% в год) значительно превышали темпы роста технологий хранения информации (23% в год) и ее передачи на расстояние (30% в год).

При этом львиная доля этих 83% приходится не на компьютеры общего назначения (серверы, суперкомпьютеры, мэйнфреймы, настольные и мобильные устройства с человеческим интерфейсом), а на прикладные компьютеры (цифро-аналоговые преобразователи, микроконтроллеры, графические процессоры).

97% МОПС, проведенные прикладными компьютерами в 2007 году, производили устройства для обработки графики. Разбитым, таким образом, оказался еще один миф: локомотивом цифровой революции являются не рост коммуникаций и не рост объема хранимой информации, а технологии по изменению информации и созданию виртуальной реальности в широком диапазоне от моделирования и построения прогностических моделей (в случае с суперкомпьютерами и сетевыми вычислениями) до игр (25% МОПС пришлось в 2007-м на видеоприставки).

Статистика статистикой, но пока не конвертирована в оптимизированные байты оставшаяся за кадром информация, играющая в нашей жизни ключевую роль (начать хотя бы с процесса воспитания детей, передачи культурных навыков, обмена эмоциями и опытом, личных знакомств и прочих оффлайновых и, скорей всего, алгоритмически невычислимых практик), подсчитанная информационная емкость человеческой цивилизации останется вавилонским столпотворением впечатляющих, но бессмысленных цифр, не более.

Впрочем, кое-какие сравнения с оффлайном уже возможны. 6,4 1012 МОПС, произведенных компьютерами общего назначения три года назад, уже вполне сопоставимы с числом нервных импульсов, производимых в секунду человеческим мозгом (1017).

Но это — всеми компьютерами Земли и одним полуторакилограммовым комком нейронов, функционирующим, скорей всего, совсем не по принципам двоичной логики, для которой все едино: что 10 Мб компрессированного текста, излагающего теорию струн, что 10 Мб компрессированного видео с клипом Леди Гага в паршивом качестве.

А ведь именно на такой логике, не различающей «арбузный» бит от бита «свиного хрящика», строятся пока что все попытки инвентаризовать производимую человеком информацию, в том числе и вышеописанное исследование, суммирующее банковскую транзакцию с пением соловья (принцип «нейтральности» всей информации оговорен авторами особо — он сослужил хорошую службу при подсчетах). Сумма дает большее число бит, но вот смысл составляющих теряется. Но если мы прекрасно отличаем хрящик от арбуза, а деньги от музыки, можно ли модель, подсчитывающую созданную нами информацию, научить различать в сумме битовые данные по смыслу? Если да, то такая «различающая» информационная модель различит, то есть осознает и самое себя — станет интеллектом.

В этом случае 295 миллионов терабайтных дисков, на которых цивилизация запишет все, что в состоянии записать, модель рано или поздно научится адекватно сопоставлять и с другими битами — содержащимися, например, во всех ДНК взрослого человека (1023).

Двигаясь дальше, поскольку ее вычислительная способность будет возрастать (бинарные алгоритмы, например, сменят рано или поздно квантовые, дающие гигантский прирост в производительности), она сопоставит их и с 1090 бит, содержащимися в видимой части Вселенной, а также с 10120 логическими операциями, произведенными природой над этими битами за 13,5 млрд лет с момента ее рождения. Быть может, и здесь нет абсолютно ничего запретного с точки зрения физики и вычислений, кто-то уже совершил такое сопоставление мира со своей моделью. К сожалению, нельзя исключать и вероятность того, что мы живем в одной из таких моделей, где способность создания искусственного интеллекта, способного вычислить «изначального» программиста методом сопоставления данных, специально не заложена в ее программу.