Пенсионный советник

Роботы возлюбили ближнего

Искусственный интеллект осваивает этическое измерение

Иван Куликов 20.05.2011, 15:32
physorg.com

Сострадающие роботы, способные разделить с ближним последний глоток бензина, были скорее героями научной фантастики в стиле Генри Каттнера, чем реальным фактом нашей жизни. Но биологам и кибернетикам удалось доказать, что альтруизм и любовь к ближнему — объективное явление, свойственное эволюции всех живых систем, объединяющих близкородственных участников.

Важнейшее достижение эволюционной биологии — открытие «гена альтруизма» — уже несколько десятилетий остается одним из главных предметов интереса эволюционной этики, изучающей генетическую, то есть вполне материальную природу поведенческих, в том числе эксклюзивно-человеческих на первый взгляд, феноменов, проходивших (и по инерции проходящих) исключительно по ведомству философии, искусства и религии.

За это время восхитительный и загадочный казус альтруизма, когда отдельная особь ценой собственных жизненных интересов совершает благодеяние в пользу другой или других, жертвуя, таким образом, своим репродуктивным будущим, исследован и объяснен достаточно подробно и в популяциях животных, прежде всего социальных — насекомых, птиц и др., и в человеческом сообществе, эволюционирующем не только биологически, но социально и культурно, то есть продуцируя и передавая информацию негенетическим путем.

Однако и в этом «менее генетическом» случае исследование наследственной природы альтруизма дает весьма нетривиальные, если не сказать больше, результаты в понимании

механики межгрупповых конфликтов, то есть войн (феномен самопожертвования и героизма), религиозных практик (феномен мученичества), ксенофобии (выборочный альтруизм «только для своих»), экономических обменов (благотворительность) и даже самоубийств.

Как выяснилось, во всех подобных ситуациях неравновесного обмена жизнями и благами — от простейшей бескорыстной помощи до подвигов на войне — степень предрасположенности людей к альтруистическим поступкам продолжает оставаться генетически предопределенной в эффективном диапазоне от, по разным оценкам, 10% до 30%. Это пока не позволяет отнести альтруистическое поведение к исключительно «культурным» наработкам человечества (факт, нисколько, конечно, не оправдывающий его отсутствие).

Но даже если не детализировать разницу между поведением человека и животных, наличие «жертвенного» гена и в том и другом случае хорошо распознается описывающей феномен альтруизма теорией родственного отбора, увенчанной законом Гамильтона, названного по имени британского генетика Уильяма Д. Гамильтона, сформулировавшего его в 1964 году в классической работе «Генетическая эволюция социального поведения».

Согласно этому закону, жертвенная альтруистическая линия в генотипе популяции проявляется при условии, если

rB — C > 0,

где r (relatedness) — степень генетического родства членов группы, а B и C — репродуктивная выгода (benefit) и потеря (cost), получаемые членами группы в акте неравновесного обмена. Из этого условия вытекает, что альтруистичный паттерн развивается в популяции, если

rB > C,

то есть репродуктивная выгода (возможность обзавестись потомством) одной особи, совершающей обмен (С), всегда меньше, чем выгода, получаемая другой (RB). С, таким образом, обозначает «жертвующего» альтруиста, а B — сторону, принимающую жертву.

Однако ключевым элементом формулы, определяющим суть закона Гамильтона, является переменная r — степень генетического родства членов группы.

Еще раз переформулировав уравнение, получим

r >C/B,

или, переведя на обычный язык, что неравноценное соотношение выгод, при котором С «дающего» меньше B «получающего» (ну, скажем, 1/10), то есть собственно альтруистический акт обмена между особями, возможно при условии высокого генетического родства членов коллектива.

Другими словами, закон Гамильтона фиксирует приоритет устойчивой передачи генетической информации следующим поколениям перед репродуктивностью или, говоря проще, ценностью жизни индивида. «Ген альтруизма» (точнее, конечно, говорить о геноме с присутствующей в нем альтруистической линией) стимулирует идти на жертвы отдельные организмы, чтобы другие носители этой линии, получившие репродуктивное преимущество в результате жертвы, смогли с большей вероятностью передать ее своим потомкам.

Образованному человеку, привыкшему расценивать альтруизм с морально-этических позиций, довольно трудно воспринять подобную жестокую механику природы, ставящую гены выше особи.

Но закон Гамильтона является не пустой абстракцией, а фундаментальным правилом, выведенным из предшествующих и подтвержденным последующими наблюдениями за реальными популяциями животных с высокоразвитой кооперацией. С течением времени он стал восприниматься большинством биологов как нечто само собой разумеющееся. Однако включить правило Гамильтона в пятерку самых изящных и глубоких формул, открытых человечеством в ХХ веке, мешает одно «но»:

несмотря на то что он сформулирован в математической форме, до сих пор этот закон не удавалось ни подтвердить, ни опровергнуть вычислительными способами.

Проблема в том, что из всех трех переменных выведенного Гамильтоном уравнения только одну — степень генетического родства r — удается представить (спасибо статистической генетике) в цифровой форме, а вот оставшиеся C и В являются скорее символико-эмпирическими операторами, которые невозможно перевести в числа.

И проблема даже не в том, что сложно представить в виде цифр такие показатели, как «ущерб» и «выгода», а в том, что в реальных биосообществах вес этих переменных варьируется под воздействием сложновычислимых или вообще невычислимых факторов — от специфичных экологических условий, в которых функционирует популяция (а они могут очень сильно различаться: одни муравейник стоит в лесу, другой на пустыре), до миллиардов лет эволюции, представляющей наблюдателю

очевидные результаты работы альтруистичных генов, но отнюдь не поэтапное описание, как они эволюционировали в популяции.

Возьмем, к примеру, известный опыт с осами, когда, удалив некоторых ос-сестер, биологи искусственно повысили статус средней осы-сестры до самой старшей фрейлины. Последняя, имея малые шансы обзавестись своим потомством, стала ухаживать за осой-королевой («жертвовать»). Родство обитателей гнезда просчитать несложно, ситуация ущерба и выгоды наглядна, но через какие именно весовые коэффициенты их обозначить?

Так как в реальной жизни биосообществ точная математика начинает неумолимо расплываться, а синтетические организмы делать мы пока не научились, швейцарские биологи и кибернетики из Федеральной политехнической школы и Университета Лозанны решили проверить закон Гамильтона на эволюционирующих объектах, жизнь которых представляет собой достаточно прозрачную вычислительную процедуру — роботах. Итоговая статья с описанием экспериментов опубликована в З> Public Library of Science.

Пройти испытание альтруизмом выпало маленьким роботам Alice, живущим в пластиковом манеже 50Х50 см, имитирующем пастбище.

Нервная система роботов представляет собой самообучаемую нейронную сеть простых процессорных узлов, обрабатывающих данные с оптических сенсоров (входной сигнал) и управляющих вращением колес (выходной сигнал), а также промежуточного слоя ассоциативной памяти, вычисляющего весовые коэффициенты всех сигналов. Иначе говоря, в Alice встроен классический трехслойный персептрон с обратной коррекцией сигнала ошибки и промежуточным слоем ассоциативных нейронов, оценивающих вес входных сигналов и коэффициенты связи между узлами сети, суммирование которых по определенному алгоритму позволяет отсортировать правильные решения от неправильных, обучаться и запоминать уроки.

Робот «Alice» и схема построения нейронной сети. Шесть левых кружков — нейроны «входа» (четыре инфракрасных датчика расстояния и две камеры). Три крайних правых — нейроны «выхода» (левое и правое колесо и нейрон, принимающий решение, делится ли выгодой, полученной от транспортированного кубика). Посередине — промежуточный слой ассоциативных нейронов. Схема представляет собой классический самообучающийся перцептрон с обратной коррекцией сигнала ошибки // PLOS
Робот «Alice» и схема построения нейронной сети. Шесть левых кружков — нейроны «входа» (четыре инфракрасных датчика расстояния и две камеры). Три крайних правых — нейроны «выхода» (левое и правое колесо и нейрон, принимающий решение, делится ли выгодой, полученной от транспортированного кубика). Посередине — промежуточный слой ассоциативных нейронов. Схема представляет собой классический самообучающийся перцептрон с обратной коррекцией сигнала ошибки // PLOS

Роботы сами учатся распознавать кубики, захватывать их и транспортировать к белому бортику манежа. У самых быстрообучаемых и проворных репродуктивный статус за каждый «съеденный» кубик повышается, и такие роботы получают преференцию в передаче своего «генома» — микропрограммы по поиску и поеданию кубиков — следующему поколению.

С каждым новым поколением геном роботов усложняется, способность к быстрому отысканию кубиков совершенствуется, хуже и более медленно обучаемые неудачники отсеиваются, и манеж, таким образом, становится маленьким эволюционирующим мирком, иллюстрирующим работу естественной селекции.

Подчеркнем, что эволюция Alice представляет собой результат работы именно естественного отбора.

В отличие от классических роботов, запрограммированных на отыскание нужных кубиков с помощью детерминистских алгоритмов, искусственные нейронные сети, имитирующие работу живых и отвечающие за гибкое самообучение кибернетического организма и его приспособляемость, дают на выходе непредсказуемые результаты. Так что даже роботы-клоны, геном которых идентичен (а под генами понимается стартовые значения весовых коэффициентов нейронных связей сети, в случае Alice таких связей насчитывается 33), обучаются, ведут себя и, соответственно, эволюционируют совершенно по-разному.

Проверив на Alice работу естественной селекции, швейцарцы решили испытать их альтруистический потенциал.

С этой целью в нейронную сеть был включен еще один ген — весовой процессор, принимающий решение, делиться или нет захваченным ценным кубиком, нужным для повышения репродуктивного статуса, с сородичами по манежу. В зависимости от принятого решения оценивался и репродуктивный статус робота: жадный робот получал более высокий статус, робот-альтруист, жертвующий жизненно важным кубиком, пониже.

Собственно, именно эта процедура позволила, наконец, дать точные числовые значения переменным C и B и проследить развитие и распространение альтруистичного гена на протяжении многих эволюционных поколений организмов, что в реальной жизни потребовало бы от генетиков сотни миллионов лет постоянных наблюдений.

Наконец, варьируя стартовые гены роботов, оказалось возможно доказать или опровергнуть уже математически,

действительно ли развитие в популяции гена альтруизма (напомним, меньшие значения С по сравнению с B, когда дающий теряет репродуктивную выгоду в пользу адресата) прямо коррелирует с генетическим родством членов популяции (чем больше родственников — рост R, тем больше альтруизма — уменьшение С/В).

Напомним, отсутствие такого доказательства долгое время компрометировало правило Гамильтона, понижая его статус до хорошей наблюдательной гипотезы, но не закона.

В общей сложности в эксперименте участвовали 1600 роботов с варьированным «генотипом», «заселившие» 200 манежей по 8 роботов на одно пастбище (практичные швейцарцы, конечно, не стали плодить для эксперимента сотни настоящих роботов, а провернули циклы эволюции на компьютерных моделях Alice, являющихся точными виртуальными копиями роботов).

Группы понадобились для эволюционной отработки сценариев с разной степенью родства между роботами. Было отработано 500 циклов обучения, кормления и передачи генома следующему поколению роботов, во время которых роботы принимали решение, делиться им кубиками или не делиться.

График, демонстрирующий распространение гена альтруизма в разнородственных популяциях роботов. Голубые линии отображают эволюционный уровень альтруизма в поколениях популяций с большим числом близкородственных индивидов. Красные - с малым, желтые — средним соотношением близких и дальних родственников // PLOS
График, демонстрирующий распространение гена альтруизма в разнородственных популяциях роботов. Голубые линии отображают эволюционный уровень альтруизма в поколениях популяций с большим числом близкородственных индивидов. Красные - с малым, желтые — средним соотношением близких и дальних родственников // PLOS

На пятой сотне поколений роботы научились эффективно отыскивать, транспортировать и съедать кубики. Финальные подсчеты показали, что скорость и уровень развития альтруизма на каждом из 200 манежей зависели от степени родства индивидов, питающихся на одном и том же пастбище, то есть делящих общие ресурсы. На результативном графике повышенный альтруизм в локальных популяциях роботов фиксируют только голубые линии, отображающие эволюционные сценарии в близкородственных коллективах.

Иначе говоря, в таких эволюционирующих сообществах фиксировалась положительная корреляция между высоким значением r (степенью родства) и низким отношением C/B (а мы помним, что чем ниже C/B, тем выше уровень альтруизма, когда меньшая выгода дающего С соответствует большей выгоде получателя B).

Таким образом, закон Гамильтона r > C/B получил, наконец, математическое подтверждение, основанное на опытных наблюдениях.

Отношение к доказательству важного закона, полученному таким остроумным способом, может простираться от полного неприятия (какая угодно сложная эволюция роботов является скорее алгоритмическим артефактом, продуцированным машиной Тьюринга, чем биологическим явлением) до осторожного оптимизма. Для последнего есть все-таки некоторые серьезные основания, поскольку нейронная сеть продуцирует решения стохастического, то есть недетерминированного типа, приближаясь, таким образом, к самообучающимся стратегиям живого организма.