Проект «Эффективный человек»

Бояться, лениться, переживать нас заставляет кажущаяся сложность жизни. Но все проще, чем кажется

2,796 просмотров

Око за око! Месть более справедлива, чем всепрощение

Четверг, 29.01.09 · На личном опыте · Поведение людей · Провокация · Психология отношений · Эксперимент

Библия говорит: «поступай с другими так, как хочешь, чтобы другие поступали с тобой».

Но эволюция не признает этой модели.

Вместо этого она использует более живучую модель, которая гласит: «поступай с другими так, как они поступали с тобой». И такой выбор, статистически, оказывается намного более оправданным.

Почему гуманизм Библии терпит неудачу? Чтобы это понять, нужно изучить такие понятия, как «ненулевая сумма», «дилемма узника» и «реципрокный альтруизм». Давайте объясню на примерах.

Основы нашего мира

«Ненулевую сумму» проще всего понять на следующем примере. Представьте, что вы – водитель, и в машине только вы один. На одном из перекрёстков, имея полное право проехать его первым, вы тем не менее пропускаете вперед переполненный автобус с сотней пассажиров. Вы теряете при этом, допустим, 1 минуту – а все 100 пассажиров автобуса в сумме выигрывают 100 минут. Ненулевая сумма составит 99 минут – именно столько времени всё общество выиграет от жертвы вашим автомобилем одной минуты.

«Дилемма узника» – понятие более известное, но оно также основано на получении «ненулевой суммы». У каждого из двух подельников, сидящих в разных камерах, имеется две альтернативы: признаться в преступлении, которое он совершил, или не признаваться. Если оба не признаются – они получат свободу, если признается кто-то один, ему скостят срок, а если признаются оба, оба получат по полной. Варианты кооперации, порождаемые этой игрой, как бы подталкивают нас к решению дилеммы: довериться подельнику и промолчать (но если он признается – отсидеть за двоих), или же признаться и получить послабление (но если он признается тоже – потерять этот шанс). Оба узника спасутся, только если скооперируются и изначально будут доверять друг другу.

И наконец, «реципрокный альтруизм»: по сути, это обмен с отложенной выгодой. Представьте, что вы даете умирающему от голода человеку денег, которых у вас в избытке, а у него не хватает: скажем, вы даете 500 рублей, и давайте назовем это потерей для вас 5 баллов. Теперь обратите внимание на очень важный момент: его приобретение БОЛЬШЕ, чем ваша потеря, так как у него, все-таки, был период острой нужды. Поэтому действительная ценность этих денег для него необычайно высока, – в принципе, ему вообще-то некуда деваться, – и если вы (например) заставите его подписать договор займа, он рассудительно согласится расплатиться за 500 рублей сейчас – скажем, 600 рублями сразу же после получки в следующую пятницу. Выходит, он оценил это приобретение в 6 баллов, хотя вам оно стоило только 5, и вы создали дополнительную выгоду. А в следующий раз, когда ситуация будет обратная, вы получите обратно свой долг и прибавите по пути еще 1 балл.

Теперь давайте подумаем: почему «поступай с другими так, как они поступали с тобой» – принцип более живучий, чем «поступай с другими так, как хочешь, чтобы другие поступали с тобой»? Какая модель взаимодействия между людьми работает ВСЕГДА?

Моделирование реальности

В конце 1970-х Роберт Аксельрод (Robert Axelrod), американский ученый-политолог, придумал на основе теории «ненулевой суммы» компьютерный мир и приступил к его заселению. Без упоминаний о естественном отборе, вначале не интересовавшем его, он предложил специалистам по теории игр представить компьютерную программу, воплощающую стратегию решения повторной «дилеммы узника», т.е., сформулировать правило, при помощи которого программа решает при каждой встрече с другой программой, кооперироваться ли с ней. Затем он щелкнул выключателем и предоставил возможность программам смешаться в единой толпе. Контекст этого соревнования отлично отражал социальный контекст человеческой и до-человеческой эволюции. Это было довольно небольшое общество – несколько десятков регулярно взаимодействующих индивидов. Каждая программа могла «помнить», кооперировалась ли с ней каждая другая программа при предыдущих встречах и соответственно этому подстраивать свое собственное поведение.

После того, как каждая программа встретилась 200 раз с каждой другой, Аксельрод суммировал баллы и объявил победителя. Затем он провел соревнование во втором поколении после систематизированной выбраковки: каждая программа была представлена пропорционально ее успеху в первом поколении – выживал сильнейший. И так игра продолжалась, поколение за поколением. Если теория реципрокного альтруизма верна, можно было бы ожидать его «эволюции» внутри компьютера Аксельрода и постепенного возобладания в популяции.

Так и случилось. Программа-победитель, созданная канадским теоретиком игр Анатолем Рапопортом – кстати, автором той самой «Дилеммы узника» – называлась «TIT FOR TAT», или «ТО ЗА ТО» (близкие по смыслу русские эквиваленты – «око за око, зуб за зуб», «что посеешь, то пожнешь», «ты – мне, я – тебе»). ТО ЗА ТО управлялась ПРОСТЕЙШИМ из правил, и программа была самой короткой изо всех представленных – без преувеличения, длиной всего в 5 строчек (кстати, именно поэтому, если бы компьютер был научен генерировать стратегии как бы в результате «случайных мутаций», она бы, вероятно, возникла одной из первых). ТО ЗА ТО воплощала именно то, что означает ее имя: при первой встрече с любой программой она начинала сотрудничать, а затем зеркально воспроизводила все то, что сделала другая программа при предыдущей встрече. Один хороший ход заслуживал одного хорошего ответного. Один плохой – ответного плохого.

Откровенно честная стратегия

Свойства этой стратегии почти так же просты, как и сама стратегия. Если какая-либо программа демонстрирует тенденцию к сотрудничеству, ТО ЗА ТО немедленно завязывает дружбу, и оба пожинают плоды кооперации; если же программа проявляет склонность к обману, ТО ЗА ТО сокращает потери благодаря тому, что воздерживается от кооперации до тех пор, пока программа не исправится, и тем избегает дорогой платы за наивность.

Таким образом, ТО ЗА ТО никогда не становится жертвой повторно, в отличие от неразборчивых в стремлении к кооперации программ. В то же время, ТО ЗА ТО избегает судьбы неразборчивых антикооперационных программ, пытающихся эксплуатировать дружественные к ним программы и оказывающихся в итоге связанными дорогостоящими цепями взаимного предательства с программами, которые желают кооперации лишь на основе взаимности.

ТО ЗА ТО обычно без сомнений отказывается от больших одномоментных выгод, которые могут быть получены путем эксплуатации. Стратегии же, нацеленные на эксплуатацию посредством постоянного или периодического «неожиданного» мошенничества, по мере того, как длится игра, постепенно пролетают. Эти программы лишаются добрых по отношению к ним партнеров, поэтому, исчерпав в итоге большие выгоды «разовой» эксплуатации, лишаются более скромных, но «бесконечных» выгод взаимного сотрудничества.

«Откровенно честная» ТО ЗА ТО оказалась, в конце концов, вполне самодостаточной, обойдя “неожиданно подлые”, “настойчиво милые”, равно как и “разнообразные умные» программы, чьи изощренные правила сделали их труднопонимаемыми для других. Вот почему принцип «поступай с другими так, как они поступали с тобой» – работает.

Ну как, вы согласны с этим? Или все еще есть сомнения?

С уважением, Алексей Глазков.

» 61 мнений

  • 1 Око за око! Месть более справедлива, чем всепрощение « Эффективный человек // Янв 29, 2009 at 01:26

    [...] Почему гуманизм Библии терпит неудачу? Чтобы это понять, нужно изучить такие понятия, как "ненулевая сумма", "дилемма узника" и "реципроктный альтруизм". Давайте объясню на примерах. [...]

  • 2 Штудер // Янв 29, 2009 at 09:42

    Напрямую на общество эти утверждения переносить сложнее. Тут действуют дополнительные факторы. Например можно не сразу распознать что под маской дружелюбия скрываются эксплуататорские намерения, ведь часто выстраивается целая цепочка действий, а не один ход. Да и слишком много людей, поэтому возможна эксплуатация в короткие сроки в чужой местности с дальнейшим переездом.

    Да и люди по разному реагируют. Вон Кактус например недавно жаловался: «не делай добра и не получишь зла». А некоторым под диферамбы делаешь гадости, а они считают тебя лучшим другом… вообще человек существо странное

  • 3 Sergey Ivanov // Янв 29, 2009 at 09:50

    Мне кажется у этой стратегии есть огромный минус, а именно отсутствие умения прощать. Представим двух детей который следуют стратегии «око за око», сначала они доброжелательно отнеслись друг к другу, но потом один ребенок случайно совершил поступок который другой расценил как «злой поступок». И теперь даже если ребенок совершивший ошибку захочет исправится, то другой ему все равно ответит злом. Начнется эскалация конфликта, который в рамках программы «око за око» не может быть решен. Нужно чтобы эта программа иногда отвечал добром на зло, это поможет улучшить отношения между реальными людьми, а не виртуальными роботами.

  • 4 Алексей Глазков // Янв 29, 2009 at 11:36

    Штудер,
    да, это важный момент. Общество сильно дифференцировано, и практически могут существовать целые общины, народности, страты, в которых условия будут искажены в пользу других стратегий. Типичный пример – тюрьма, где есть свои, искуственно поддерживаемые извне правила.

    Но в долгосрочном рассмотрении TIT FOR TAT побеждает, и это выглядит достаточно логично :) Поэтому я готов ее выбрать, чтобы в итоге принести обществу побольше пользы.

    К тому же, греет сама мысль, что отплатить мошеннику той же монетой – это более гуманно, чем простить и забыть.

  • 5 Алексей Глазков // Янв 29, 2009 at 11:50

    Сергей, программа, которую ты предлагаешь, Аксельродом была проверена. И сдохла :)

    Кого и за что нужно прощать? Ведь это «откровенно честная» стратегия. Совершил ошибку – признай и исправь ее! А если не хочешь исправлять – сам виноват, и не надо обижаться, что получишь в ответ сполна.

    Грубо говоря, TIT FOR TAT заставляет понимать: за все плохое последует расплата. Либо ты не будешь делать плохого (и исправлять свои случайные промахи), либо получишь назад все, что натворил.

  • 6 Штудер // Янв 29, 2009 at 12:36

    Хех… глядя на лес упустили из виду дерево которое нам показывалось. А основной смысл ведь был в заголовке…

    Сергей, а у детей это проще решается принял добро за зло – стукнул обидчика по носу, тот в ответ, возникает драка в которой собственно говоря зло с обоих сторон нивелируется. Но это только до определенного возраста, пока дети еще не способны аккумулировать обиды. О-о-о-о, из этого можно вывести еще один постулат, отомстил – забудь. Точнее как, не совсем забудь, а просто перестань нести груз обиды. Легче будет.

    И повторюсь еще раз. Теперь правда более детализированно. Люди не программы, им сложно определить последствия взаимодействий. Кроме того возможны ошибки коммуникации. Плюс еще психология человеческая. Поэтому настолько детально алгоритм действовать не будет, хотя в общем будет…

  • 7 Sergey Ivanov // Янв 29, 2009 at 12:44

    [..]Кого и за что нужно прощать? Ведь это “откровенно честная” стратегия. Совершил ошибку – признай и исправь ее![..]

    А как это можно сделать в рамках стратегии «око за око» ? никак нельзя. вот и получается что если два человека действуют только по программе, то получается фигня.

    Да и опредлить свою ошибку, чтобы ее исправить не каждый раз получается. Например в Ср Азии в национальных семьях, нет ничего зазорного чтобы рыгнуть за столом, а в русских семьях это признак бескультурья. Вот и получается, что пригласила русская семья себе гостя (хороший поступок), а тот взял и рыгнул ( плохой поступок). А потом гость пригласил к себе русских ( хороший поступок), а те взяли и пришли пьяными ( так как они по стратегии считают, что раз гость не уважает их стол, то они не буду уважать стол гостя). Как ни крути, а прощать лучше, чем принципиально следовать стретегии.

    А то что сдохла, это только повод подумать, ведь программа взаимодействовала только с такимиже ущебными программами которые дают реакцию только на последние действие контрагента.

  • 8 Мизо // Янв 29, 2009 at 13:15

    Месть более проста и по нятна

  • 9 Алексей Глазков // Янв 29, 2009 at 15:15

    Сергей,
    ты подменяешь понятия. Проблемы, порождаемые непониманием между людьми – это не проблемы, порождаемые стратегией TIT FOR TAT. Непонимание существует всегда и действует на все стратегии одинаково.

    Кстати, учти: Аксельрод смоделировал мир достаточно четко. Он не придумывал какую-то идеальную реальность; он смоделировал мир вместе со всеми его плохими и хорошими стратегиями. А ты моделируешь мир, где люди делают случайные ошибки, а всех прочих рисков вроде бы и не существует.

    Давай разовьем твою мысль. Вот пригласила семья гостя, а он рыгнул. TIT FOR TAT говорит, что в этом случае нужно ответить, но ты прощаешь. Хорошо, но где грань? А если гость спиздил вилки – простить его, или как? А если он дочку хозяина в ванной ублажил?

    Замучаешься разбираться. И в итоге простишь что-то очень страшное. Будь проще.

  • 10 Sergey Ivanov // Янв 29, 2009 at 15:24

    :) а если .. , а если ..

    я к тому веду, что стратегия «око за око» без исключений, это путь в никуда. А, что считать исключением, а что нет – это личное дело каждого.

  • 11 Илья Весенний // Янв 29, 2009 at 16:01

    Алексей, спасибо за короткий, но очень дельный анализ!
    Хочется только добавить, что в нынешнем мире предсказуемость – опасное свойство. Если заранее известно, как мы поступим (»ответим тем же»), то нами уже можно управлять. А это серьёзная уязвимость.
    Поэтому в более сложной среде, чем моделировал Аксельрод, зуб-за-зуб будет побеждён программой несимметричный-ответ :)

  • 12 Алексей Глазков // Янв 29, 2009 at 17:25

    Сергей,
    ты меня специально раздражаешь? :) Кто ты такой, чтобы говорить подобные слова? «Путь в никуда»… Как громко сказано! Ты проверял? Ты ставил опыты? Ты вывел на основе многолетних исследований доказательство гипотезы? У тебя есть хотя бы теоретические выкладки? Нет. Все, что у тебя есть – обывательское мироощущение. А я ему не очень-то верю, потому что обыватель никогда не копает глубоко. Ему лень. Обыватель = дилетант.

    И ты вот, вместо того, чтобы подумать, примерить – отвергаешь. Это глупо. Это шоры на глазах.

    И еще. НИКОГДА не говори мне что-то вроде «каждый решает сам», «все люди разные» или «личное дело каждого». Это просто пиздец какая удобная отмазка, чтобы не думать дальше. Ну да, каждый решает сам, и что с того? Что мне теперь, руки опустить? Не делать ничего?

  • 13 Алексей Глазков // Янв 29, 2009 at 17:30

    Илья,
    возможно :) У меня есть такая идея-фикс: повторить опыт Аксельрода, но усложнить мир, введя в него некие социальные отношения. Очень интересно посмотреть, какой человек побеждает в итоге: добрый или злой? Скупой или щедрый? А может, вообще получатся некие немыслимые сочетания, вроде наглого честного вора? Интересно :)

    Насчет управления – да, это возможно, но пока не представляю себе выгоды. Если TIT FOR TAT всегда возвращает полученный вред его источнику – в чем этому источнику выгода от управления?

  • 14 Nadi // Янв 29, 2009 at 20:37

    Как-то прочитала «Поступай с другими, как хочешь! По-моему, у Ричарда Баха. Мне понравилось это правило. В отличие библейского, В котором нужно поступать так, как хочешь, чтобы поступали с тобой. Да, не просто поступить, как хочешь. Самой. А уж другим- то догадаться – тем более сложно. Главное – поступать в соответствии с самыми высокими идеалами. Чтобы потом не было стыдно. Самому. За свой выбор.

  • 15 Алексей Глазков // Янв 30, 2009 at 00:08

    Нади,
    разумно :) самоограничение с помощью высоких ценностей – вполне разумно.

  • 16 rufus.spb // Янв 30, 2009 at 00:49

    С обывательской точки зрения, этот подход не всегда применим, я думаю. Зло может быть непреднамеренным, если считать случайное вредительство злом. Да и все факторы реального мира не учесть.

    Было бы очень неожиданно увидеть реально полезные, не только для общества в целом, но и для себя любимого, результаты, если вот так вот поиграть в запрограммированных робокопов месяц-другой. Хотя с теорией в целом я согласен, понравилась. Следовали бы мы все этому принципу, давно уже человеческие космические корабли бороздили центр галактики и жили бы все долго и если не счастливо, то просто нормально. Но мы в большинстве даже библейским принципам то не следуем; повышаем потихоньку мировую энтропию своими собственными.

    А вот насчет повторения эксперимента.. Очень интересно :) Думаю, что победит нормальный, в смысле сбалансированный, персонаж, если вы имеете в виду компьютерный римейк.

  • 17 Сергей Фёдоров // Янв 30, 2009 at 01:22

    Есть одно интересное замечание (2 часа назад рассказывал человеку): мир поступает с тобой не в отвте на твои действия, а в соответствии с твоим внутренним состоянием.
    Если в тебе много гордыни – гордыня будет унижена и степень воздействия будет нарастать пока гордыня не исчезнет. Правда не все это замечают…
    И так во всех аспектах.
    Многие допущения не учитывают все факторы. Так например, «нулевая сумма» не учитывает полезность времени. Можно 100 минут потратить без пользы дела и 1 минуту с м аксимальной пользой. Например, в машине едет хирург на срочную оперцию.
    «Дилема узника» из разряда игр «выйграть-выйграть». Хорошая игра, но когда ты говоиршь о программах… то это не люди и анализировать людское поведение или целесообразность людского поведения по ним абсурдно. Часто в наши действия включаются неведомые нам силы. «Почему ты так поступил?» – спрашиваем мы человека. А он не знает, просто не может объяснить причину поступка. А это и есть та неопределённость, которая напрочь выбивает возможность использования простейших алгоритмов.
    Простейшие алгоритмы – это как изучение идеальных систем. Не все учтено – результат приблизительный.
    Кроме логики у человека присутствует интуиция. На сегодняшний день нет моделей описывающих этот механизм. Есть теории, но мы не их обсуждаем.
    Что касается логики. Она опирается на имеющиеся знания, или вернее сказать информацию. А ведь информации намного больше. Есть:
    1. я знаю то, что я знаю
    2. я знаю то, что я не знаю
    3. я не знаю то, что я не знаю
    и пункт 3 самый большой…

  • 18 Sergey Ivanov // Янв 30, 2009 at 08:48

    Это Ваш журнал, я не буду Вам хамить в ответ.

    [..]И еще. НИКОГДА не говори мне что-то вроде “каждый решает сам”, “все люди разные” или “личное дело каждого”. Это просто пиздец какая удобная отмазка, чтобы не думать дальше.[..]

    не согласен, я вижу что Вам нравится принцип «око за око» без всяких исключений, мне не нравится. Я высказал свою позицию, Вам она не нравится, вы ее с ходу отвергаете основываясь на синтетическом эксперименте, который провели не даже не Вы. Чем Ваша позиция лучше моей? с моей точки зрения ни чем. Я не могу убедить вас, вы не приводите аргументов и следовательно не можете убедить меня, поэтому лучше оставить друг другу право на самостоятельное мнение.

    Я Вам привел пример когда случайная ошибка в передачи информации приводит к дедлоку между двумя агентами, это и есть путь в никуда, на который вы так разозлились. В качестве еще одного примера приведу программу BitTorrent, которая тоже работает по по модифицированной программе «око за око» допускающей прощение.

    Я не знаю какие материалы вы использовали для своей статьи, но я тоже поискал в интеренете материал. и вот что нашел

    [..]The analysis of the data from these tournaments reveals four properties which tend to make a strategy successful:
    avoidance of unnecessary conflict by cooperating as long as the other player does,
    provocability in the face of an uncalled-for defection by the other
    forgiveness after responding to a provocation
    clarity of behavior so that the other player can recognize and adapt to your pattern of action. [..]

    Это слова из книги The Evolution of Cooperation by Robert Axelrod
    Те из четырех условий для успешности стратегии вы рассмотрели только одно условие.

  • 19 Алексей Глазков // Янв 30, 2009 at 13:14

    Сергей,
    извините, если я вас обидел. На самом деле, позиция ваша мне по-человечески понятна. Но она не имеет обоснования (даже такого «синтетического», как у меня) и потому непригодна для построения выводов. Вы даже не представляете, сколько раз мне приходилось спорить с людьми, которые отстаивают свою «правду» только потому, что им «кажется, что…»

    Вы неплохо покопались в вопросе, и это очень здорово :) Но нужно копаться еще, потому что цитата, которую вы нашли, ничуть не опровергает мою т.з. и не подтверждает вашу. Если вольно перевести на русский, она говорит:
    «Анализ результатов этого эксперимента выявил 4 правила, которые делают стратегию успешной:
    - избегать конфликтов путем кооперации, пока партнер стремится к тому же самому
    - не оставлять внезапные чужие провокации без ответа
    - после ответа на провокацию – не держать зла (начать с чистого листа)
    - действовать честно и открыто, чтобы партнер мог понять твою стратегию и приспособиться к ней»

    Ну и скажите теперь, что из этого не было упомянуто в статье и в тех комментариях, которыми я пытался донести истину? И что из этого подтверждает вашу стратегию «предварительного прощения»? :)

  • 20 Алексей Глазков // Янв 30, 2009 at 13:35

    Сергей (Федоров),
    ты прав. Интуиция великая вещь, и ее нельзя просчитать. И недостаток информированности тоже скажется на результате.

    Сижу, просчитываю модель с учетом всех этих тонкостей :) через годик, наверное, накоплю статистику.

  • 21 Sergey Ivanov // Янв 30, 2009 at 16:08

    С цитатой я действительно ошибся, признаю это. Но думаю спор на этом не закончен. Но чтобы прояснить ситуацию хочу уточнить предмет нашего не согласия.

    Ваша позиция:
    Выгоднее всего следовать стратегии «око за око», те сначала предлагать сотрудничество, а потом всегда поступать с другими так, как они поступили с тобой.
    Аргументы:
    Это правильно так как в эксперементе именно эта стратегия заняла первое место, те была проверена эмпирически.

    Моя позиция: Стратегия Око за Око будет более эффективной в общении между людьми, если иногда она будет прощать. В противном случае возможны ситуации когда из-за малейшего искажения передаваемой информации стратегия не сможет эффективно взаимодействовать с себе подобными.

    Вас в моей позиции не устраивает, что мои слова об эффективности модифицированной стратегии не аргументированы.

    я правильно понимаю?

  • 22 Алексей Глазков // Янв 30, 2009 at 17:29

    Да, именно :) Нужны либо логически выверенные аргументы, либо подтверждающие факты/статистика. Ситуации искажения, разумеется, возможны, но насколько они опасны? Вполне возможно, что 1) их частотой можно пренебречь, или 2) они не оказывают какого-то особого влияния на конкретно эту стратегию, или 3) что прощение в итоге окажется опаснее, чем месть по мелочам…

    Я, кстати, склоняюсь к третьему варианту, так как избирательное прощение открывает возможности для манипуляции.

  • 23 Сергей Фёдоров // Янв 30, 2009 at 19:33

    Если строить модель, то надо учесть громадное количество информации, которую человек транслирует в мир… давай начнем с этого. Какие аспекты поведения человека кроме прямого действия мы должны уточнить. Ведь действия не всегда отражают основную мысль человека, часто это бывают завуалированые цели, то есть действия для достижения скрытых целей. По каким признакам мы можем это распознать? Иначе наши ответные действия будут неадекватны. Для примера руская народная сказка про колобка, когда его лиса съела… развите событий не предвещало такого окончания, но тем не менее. Как часто такая модель поведения встречается на работе… мы говорим так – «подсидел», «выжил» и так далее.

  • 24 Алексей Глазков // Янв 30, 2009 at 19:52

    Есть один проект, который мы сейчас задумываем в Башне. По сути, он должен помочь собрать необходимую статистику и построить модель человека с ограниченным количеством наиболее значимых человеческих качеств. Тогда все это «громадное количество информации» можно отсечь как малозначимое, и модель социума будет немного проще.

    Пытаться распознать намерения эмпирически – невозможно, ты прав. Только на основе динамической статистики.

    Ну посмотрим :)

  • 25 Сергей Фёдоров // Янв 30, 2009 at 20:29

    Что будет являться оценивающим критерием, что брать в расчет, а что нет?
    Значение информации может меняться во времени. И если это не учесть, то резульаты моделирования будут неверными.

  • 26 Балезин Дмитрий // Янв 30, 2009 at 21:49

    Удивляешь, Алексей, ты меня выбором своих статей… либо ты действительно столь начитан, либо второго не дано:-). Статья хорошая и история с виртуальным миром интересная.

    Вот только мне представляется, что программы отражали лишь ПОЛОВИНУ стратегии поведения. Собственно, именно поэтому возник у вас спор с Сергеем.

    Я думаю, тут должны быть две стратегии:
    1) Активная – твое личное действие по отношению к другим (склонность выбирать определенное действие при первом контакте)
    2) Ре-Активная – твоя реакция на стороннее поведение (прощать или нет, отвечать ОКО ЗА ОКО или нет)…

    У Стивена Кови есть что-то подобное – промежуточная позиция «Выиграл – Выиграл или не связываться»…

    Т.е. невсегда есть возможность поступать с другими так, как хочешь, чтобы они поступали с тобой (могут тебя использовать), в этом случае лучше не связываться.

    Еще мне интересен следующий момент. Комментариев у тебя на блоге на каждую статью множество. С чем это связано? Как тут реализована стратегия ОКО ЗА ОКО?

  • 27 Татьяна // Янв 30, 2009 at 23:02

    Гм, любопытно, конечно. Однако схема, предложенная Аксельродам слишком упрощенная. Поэтому при переносе ее на реальные человеческие отношения она работать не будет. В мире людей все гораздо сложнее. В частности, хотелось бы выделить несколько факторов, которые могут сыграть существенную роль в мире людей, и которые не учтены в эксперименте Аксельрода (по крайней мере из того, как я поняла суть эксперимента из вашего пересказа).
    На мой взгляд такая схема не учитывает следующие аспекты:
    - случайность (иногда один человек поступает с другим нехорошо из-за случайности. Например, я другу машину дал, а он на ней разбился. Как оценивать поступок будем? По мотиву или по результату? Знаете ведь как – хотел как лучше, получилось как всегда.
    -недопонимание (по сути, та же случайность). Даже если мы будем «действовать честно и открыто, чтобы партнер мог понять твою стратегию и приспособиться к ней”, никто не гарантирует, что партнер поймет твою стратегию именно так, как ты ее декларируешь. В упрощенном эксперименте все работает, в мире людей может и не сработать, ибо говорим на одном языке, а очень часто друг друга не понимаем. Природа языка, увы, такова, прояснять и запутывать одновременно, а другого способа коммуницировать у людей нет.
    -извечный поиск человеком наилучшей модели и копирование чужих моделей. Грубо говоря, пусть субъективно, но мы прикидываем окружающие нас модели поведения людей, оцениваем их на эффективность, и постоянно примериваем их на себя. Следовательно, количество носителей одной модели поведения постоянно меняется. В частности, допустим в обществе обратили внимание, что модель «око за око» весьма эффективна, и уже большинство будет исповедовать ее, не получится ли так, что в результате победит сторонняя стратегия, как выше предложил Илья Весенний – программа-несимметричный ответ. В конце концов Аксельрод проводил эксперимент в среде различных моделей поведения, а если рассмотреть среду, где у большинства модель поведения одна, пусть и самая эффективная, Око за око, например, какой будет результат?
    -внешний фактор. Порой в отношения людей вмешиваются внешний фактор, который предполагает резкое изменение стратегии, в частности действие в сторону всепрощения. Пример, я действую в соответствии с моделью ОКО ЗА ОКО, вы мне сделали бяку, по идее в следующем ходе я должна ответить вам бякой, однако в наши с вами отношения вмешивается внешний фактор – стихийное бедствие, например. Выжить мы можем только при условии совместной кооперации и доверия, иначе погибнем оба. Ну понятно, что будет, если я буду действовать в соответствии с моделью ОКО за ОКО.
    Ну и так далее, это то, что с ходу в голову пришло. Так, что я думаю, что вы переоцениваете работу Аксельрода, ее можно рассматривать только как сухую схему, рассматривать ее как полноценное доказательство эффективности такой модели поведения я бы не стала, определенно.

  • 28 Алексей Глазков // Янв 31, 2009 at 01:19

    Дима,
    так ведь TIT FOR TAT учитывает оба приведенных тобой фактора. Сначала она инициирует контакт с предложения сотрудничества, а потом действует, зеркалируя партнера. И проактивность, и реактивность тут присутствует. Кстати, хорошая аналогия с Кови, видимо поэтому она мне бессознательно нравится :)

    Про комментарии не понял, поясни.

  • 29 Алексей Глазков // Янв 31, 2009 at 01:23

    rufus.spb,
    пропустил комментарий, извини.
    Очень емко, кстати, излагаешь мысль – коротко, по делу, без перегибов :) если есть блог или еще твои статьи – кинь ссылки, пожалуйста. Интересно.

  • 30 Алексей Глазков // Янв 31, 2009 at 01:50

    Татьяна,
    вы делаете ту же ошибку, что и предыдущие несогласные. Случайность, недопонимание, извечный поиск, внешние факторы – это недостатки СРЕДЫ, а не самой стратегии. Они в равной мере воздействуют и на все другие варианты стратегий поведения.

    К тому же, вы недооцениваете Роберта; он, как истинный исследователь, провел несколько тысяч разных исследований. Он ведь писал: “Откровенно честная” ТО ЗА ТО оказалась, в конце концов, вполне самодостаточной, обойдя “неожиданно подлые”, “настойчиво милые”, равно как и “разнообразные умные” программы, чьи изощренные правила сделали их труднопонимаемыми для других». Это повод задуматься о том, так ли важно стараться приспосабливаться к внешним условиям, как кажется.

    «если рассмотреть среду, где у большинства модель поведения одна, пусть и самая эффективная» – Аксельрод делал и такие замеры. С удовольствием рассказываю: TIT FOR TAT 1) самодостаточна, то есть если остается только она, эффективность всего сообщества становится максимальной; 2) ниболее устойчива, то есть при попадании в среду с сильной концентрацией любой другой модели (и разных неприятных комбинаций моделей) она выживает дольше, чем любая другая, и способна «победить» с худшими начальными условиями, чем у любой другой.

    Кстати, почитайте: http://ru.wikipedia.org/wiki/Дилемма_заключённого. Там есть описание других интересных вариантов :) Хотя TIT FOR TAT все равно в итоге оказывается лучшей.

  • 31 Sergey Ivanov // Фев 1, 2009 at 13:18

    отлично, что мы определили предмет спора. Попробу теперь доводы в защиту своей позиции.

    1) [..]Случайность, недопонимание, извечный поиск, внешние факторы – это недостатки СРЕДЫ, а не самой стратегии. Они в равной мере воздействуют и на все другие варианты стратегий поведения.[..]

    Я согласен что стратегия око за око, самя эффективная в той среду которую предложил Роберт. К особенностям среды Роберта относятся

    a) Все сигналы предаются без искажений
    b) Игра идет до конца, из нее не возможно выйти

    Я показал примерами, что условие A иногда не соблюдается.

    Условие B также не соблюдается, каждый из нас волен в любой момент времени сказать «ты дурак и просто не понял мою мысль,я больше спорить не буду», и ничего с этим поделать нельзя.

    Исходя из того, что условия А и B не соблюдаются,следовательно среда в который мы взаимодействуем уже не похожа на среду в которой Роберт тестировал стратегию. Поэтому говорить об эффективности око за око в реальной жизни преждевременно.

    2)[..]Ситуации искажения, разумеется, возможны, но насколько они опасны? Вполне возможно, что a) их частотой можно пренебречь, или b) они не оказывают какого-то особого влияния на конкретно эту стратегию, или c) что прощение в итоге окажется опаснее, чем месть по мелочам…[..]

    a) Вы же читали Талеба, если мы будем пренебрегать черным лебедем, но обязательно рано или позно он нам отомстит

    b) Оказывают, я построил компьютерную модель, так вот искажение всего 1% сигналов приводит к уменьшению эффективности в 3,69 раз ( допускаю, что я ошибаюсь, так как модель была написана в течении 40 минут пока я ехал с работы домой). Также см пункт 3 моего ответа.

    с) не нашел по этому аргументу никаких данных

    3) Цитирую Роберта

    It is well known that the Tit for Tat strategy suffers from even small amounts of noise because a single mistaken defection can echo indefinitely (Molander 1985). Three approaches have been proposed to deal with noise in the iterated Prisoner’s Dilemma (see Wu and Axelrod 1995). The first two are variants of Tit for Tat. Generous Tit for Tat allows some percentage of the other player’s defections to go unpunished. Contrite Tit for Tat avoids responding to the other player’s defection after ones own unintended defection. A completely different approach is based on the learning principle that the same choice is repeated if and only if the most recent payoff was high (i.e., R or T). Wu and Axelrod (1995) show that Generous Tit for Tat and Contrite Tit for Tat both did well when noise was added to the environment of the second round of the Prisoner’s Dilemma tournament.10 Thus when Tit For Tat is modified with generosity or contrition it remains a highly robust strategy in a noisy environment.

    Резюмируя.

    1) Все наши коммуникации происходят в среде допускающей искажения сигналов.
    2) Эффктивность оригинальной «око за око» падает даже при малейшем искажении сигналов.
    3) Модифицированная «око за око» остается эффективной в «шумной» среде

    Вывод, модифицированная «око за око» более эффективна в реальном общении чем оригинальная «око за око»

    PS: Кстати, даже предположив, все сигналы передаются без искажений все равно можно улучшить «око за око»

    The Edk-Group (2000) analyzes the effect of allowing players to exit from an unsatisfactory relationship. This extension of the standard Prisoner’s Dilemma is accomplished by including in the player’s strategy an option to end the bilateral relationship based on the history of the game so far. The analysis is conducted by computer simulation using a set of fifteen strategies specified by the authors.
    ….
    Yet the most successful strategy is one that cooperates until the other player defects, and then immediately exits.

    PPS: Надеюсь мое знание английского не подвело меня еще раз :)

  • 32 Алексей Глазков // Фев 2, 2009 at 13:49

    Не подвело :)

    Отличный материал. Честно говоря, не ожидал: я считал, что модель «с раскаянием» и есть оригинальная.

    Я понял, в чем наше расхождение, Сергей: в определении очередности и необходимости МЕСТИ, а вовсе не прощения. Прощение – это хорошо! Аксельрод писал же: «ТО ЗА ТО воздерживается от кооперации до тех пор, пока программа не исправится…» – то есть, она готова к сотрудничеству и не держит зла. Вопрос в том, нужно ли мстить перед прощением, верно?

    Я утверждаю: нужно. Нужно отомстить и раскаяться, и при этом – не скрывать логики этого поведения. Тогда:
    1) система придет в равновесное положение (око за око)
    2) если партнер тоже готов к кооперации – зацикливания не будет

    Теперь вариант «что если…». Что если в системе есть шум? Положим, TFT случайным образом прощает 1% обманщиков, компенсируя этот шум в масштабе всей системы. Но ведь в масштабе одного партнера – это несправедливо! Он никого не обманывал, но из-за шума получил по зубам; а другой обманывал, но из-за «случайного» прощения не получил возмездия… В итоге – TFT начинает влиять на эффективность всех других стратегий, потому что – на самом деле – увеличивает уровень шума. И вот мы снова возвращаемся к вопросу, на который ни у тебя, ни у меня нет ответа: а не может ли преждевременное раскаяние в итоге оказаться опаснее, чем честная месть?

    ИМХО, самое правильное поведение – respond and contrite.

  • 33 Алексей Федчишин // Фев 2, 2009 at 13:50

    Наконец-то добрался до вашего блога! Как обычно, ваши статьи заставляют серьёзно пораскинуть мозгами :)
    Первое, что я не понял, почему вы противопоставляете “поступай с другими так, как хочешь, чтобы другие поступали с тобой” и “поступай с другими так, как они поступали с тобой”? Они являются лишь 2 стратегиями, упомянутыми Дмитрием. Первая – активная, вторая – реактивная. Думаю, в контексте статьи было бы уместнее ставить в противовес «если ударили по правой – подставь левую». Это лишь уточнение.
    Второе. Эксперимент безусловно интересный. Но как уже кто-то говорил, модель – лишь однобокое отражение реального мира. Любая программа – есть заранее заложенная последовательность действий. Человек же – иррациональное существо.
    Третье. «Я, кстати, склоняюсь к третьему варианту, так как избирательное прощение открывает возможности для манипуляции» Или я вас не понял, или это логическая ошибка. Как раз ЗАПРОГРАММИРОВАННОЕ поведение даёт возможность для манипуляции. А избирательное сложно предугадать, а значит, сложнее им управлять.
    Четвёртое. Действие по одной стратегии – это негибкость. Скажем, в менеджменте уже давно используется принцип «Выживает самый адаптивный» (основной принцип кибернетики), а не «сильнейший». Любая программа – жёсткая последовательность шагов. Только человек пока может действовать на своё усмотрение (нелогично) и наверное именно поэтому до сих пор и жив :)

  • 34 Sergey Ivanov // Фев 2, 2009 at 14:12

    :) [..] если партнер тоже готов к кооперации – зацикливания не будет [..]

    будет!! если не верите попробуйте по ходам разыграть. [..]It is well known that the Tit for Tat strategy suffers from even small amounts of noise because a single mistaken defection can echo indefinitely (Molander 1985).[..]

    [..]ИМХО, самое правильное поведение – respond and contrite. [..]

    Хоть вы и любите фраз типа «каждый решает сам», но мне кажется сейчас именно и нужно сказать. Есть Ваша позиция, с понятными агрументами. Есть моя позиция, я ее тоже аргументировал. У меня нет задачи переубедить Вас или оставить за собой последнее слово. Поэтому пусть каждый из нас сам решит по какой стратегии ему дальше жить.

  • 35 Сергей Фёдоров // Фев 2, 2009 at 18:45

    Давайте посмотрим на примеры в среде людей: правило «око за око» – ВИНДЕТА. Привожу материал Википедии:
    Кро́вная ме́сть (также венде́тта, от итал. vendetta — мщение) — принцип, согласно которому лицо, совершившее убийство, либо кто-либо из членов его семьи, рода, племени, клана, группировки, обязательно подлежит смерти в порядке возмездия, а не правосудия. Кровную месть осуществляет, соответственно, кто-либо из членов семьи, рода, племени, клана, группировки, к которой принадлежал убитый.
    Обычай кровной мести является элементом правовых систем, в которых государство либо не существует, либо не в состоянии обеспечить правопорядок (отсутствие монополии права на насилие у государства). В такой ситуации за убийство семья жертвы наказывает семью преступника, чтобы восстановить «семейную честь». В качестве семьи могут выступать, в зависимости от обычаев, не только биологические родственники, но и весь клан или преступная группировка. Кровная месть появилась в первобытном обществе, где отсутствовали иные средства правового регулирования.

    Кровная месть отражает принцип равного воздаяния за преступление, который в Ветхом Завете сформулирован как «око за око, зуб за зуб»: за нанесение вреда имуществу виновные отвечают соответствующим имуществом, за нанесение вреда здоровью — соответствующей материальной компенсацией, за убийство — изгнанием или смертью, что соответствует наиболее простому пониманию человеком справедливости. Возложение же ответственности на семью (род), с одной стороны, делает месть легче осуществимой, с другой — ставит убийцу в положение ответственного перед своей собственной семьёй, ведь если он избежит мести, она просто будет осуществлена по отношению к кому-то другому в семье.

    Кровная месть чревата опасными последствиями — месть нередко становится ещё более жестокой, чем предшествовавшее ей преступление, влечёт за собой ответную «месть за месть», и в итоге выливается в долгие кровавые конфликты, нередко приводящие к обескровливанию обеих враждующих групп или полному уничтожению одной из них. С одной стороны, это служит определённым фактором сдерживания, но с другой, как было понято уже очень давно, негативные последствия слишком значительны. Известны случаи, когда целые кланы мстили за события трёхсотлетней давности, в результате полностью уничтожая друг друга. Вследствие этого уже у древних народов существовали обычаи, позволяющие прекратить или предотвратить кровную месть. Так, у арабов-кочевников род совершившего непреднамеренное убийство мог откупиться достаточно большим выкупом.

  • 36 Алексей Глазков // Фев 3, 2009 at 09:17

    Алексей,
    ну давайте по пунктам :)

    1) в контексте статьи было бы уместнее ставить в противовес “если ударили по правой – подставь левую”

    Это уже не гуманизм получается, а садомазо какое-то. Нет, мне кажется, что сравнение выбрано вполне себе адекватное.

    2) Эксперимент безусловно интересный. Но как уже кто-то говорил, модель – лишь однобокое отражение реального мира

    Согласен, но, как бы… и что с того? Что вы предлагаете? Не делать ничего?

    3) Как раз ЗАПРОГРАММИРОВАННОЕ поведение даёт возможность для манипуляции. А избирательное сложно предугадать, а значит, сложнее им управлять.

    Ерунда, опять то же самое обывательское мировоззрение. Попробуйте поуправлять поездом. Влево-вправо. Или убедить девочку на кассе Сбербанка дать вам скидку на кварплату. Попробуйте.

    4) Действие по одной стратегии – это негибкость. Скажем, в менеджменте уже давно используется принцип “Выживает самый адаптивный” (основной принцип кибернетики), а не “сильнейший”.

    TFT и есть максимально адаптивная стратегия, разве вы не видите? Что же до «негибкости» – повторите эксперимент Аксельрода, и вы поймете, что «разнообразно умные» и «случайные» стратегии действительно подыхают первыми. Вот уж воистину, гимн отсутствию логики.

  • 37 Алексей Глазков // Фев 3, 2009 at 09:44

    Sergey,

    1) Действительно, будет, прошу прощения. Если контакт инициирован первым игроком, а ошибка передачи возникла со стороны второго – мы получим цикл, когда каждый считает, что второй его обманывает. НО!!! Вы не учитываете другую сторону зашумленной среды :) Точно так же через какое-то случайное время в цикл вклеится шум, который изменит поток ответов – и следуя стратегии, TFT тут же начнет сотрудничать, не держа зла.

    А мои аргументы вы так и не опровергли: а) что «случайное» прощение только повышает уровень шума в среде и б) что оно поэтому может оказаться намного опаснее, чем честное детерминированное поведение.

    2) Посему, я все-таки считаю, что заявление «пусть каждый из нас сам решит» – просто удобный предлог, чтобы уклониться от дискуссии и не думать дальше (как я и говорил).

    И вообще, это что, индульгенция? Разрешение решать? Как бы само собой подразумевается, что и вы, и я принимаем свои решения самостоятельно; вам для этого не требуется моего разрешения, а мне – вашего. ИМХО, эта фраза – трюизм, который никак не может служить аргументом в данной дискуссии.

    Но если вам очень уж нужно мое решение, вот оно: пока что никто не доказал, что утверждение, вынесенное в заголовок статьи – неверное, и поэтому я БУДУ продожать переубеждать и спорить. У вас нет такой задачи, а у меня – есть.

    Как-то так.

  • 38 Татьяна // Фев 3, 2009 at 16:15

    «Вот уж воистину, гимн отсутствию логики.» Скорее гимн многообразию мира. Зря вы так. Логику никто не отрицает. Логические схемы есть сухое, усредненное снятие с многообразной практики.
    Вы в данном случае говорите не о логике, вы говорите о конкретном эксперименте. Вам указывают, на то, что эксперимент не рассматривает всей полноты картины, а всего лишь часть ее, следовательно, ко всему многообразию мира приложен быть не может. Любой эксперимент узок, это искусственное воссоздание всего лишь части реальности. Экстраполировать результаты эксперимента можно, но с большими оговорками.
    Если на то пошло, то под библейское правило (библейское ли, кстати, сие золотое правило этики приписывают и Конфуцию) “поступай с другими так, как хочешь, чтобы другие поступали с тобой” тоже подведено рациональное доказательство. Как быть с кантовским «Поступай так, чтобы максима твоей воли могла бы быть всеобщим законодательством»? Может попробовать доказать, что оно неверное?
    И еще вопрос, если уж вы взялись защищать заголовок своей статьи, то возникает вопрос: справедливое и эффективное – это все-таки разные вещи. Почему вы так ловко подменили понятия? В эксперименте речь идет об эффективности, но не о справедливости. Справедливость – категория этическая, она конвенциональна. А уж на каком основании сия конвенция должна заключаться – это вопрос философский, конечно, но, не очевидно, что понятие справедливости строится на представлении об эффективности отдельно взятой стратегии.

  • 39 Татьяна // Фев 3, 2009 at 16:38

    «Ерунда, опять то же самое обывательское мировоззрение. Попробуйте поуправлять поездом. Влево-вправо. Или убедить девочку на кассе Сбербанка дать вам скидку на кварплату. Попробуйте.»
    Примеры некорректные, имхо. Манипулирование – это использование запрограммированного в своих собственных целях, а не создание новой программы. Манипулировать поездом влево и вправо можно, как раз при помощи же рельс. Если поезд запрограммирован ходить по рельсам, то мы просто поворачиваем рельсы, а не учим поезд летать.
    Девочку на кассе убедить в том, чтобы она вам дала скидку на квартплату невозможно не потому, что ее запрограммированное поведение не дает нам возможности ею манипулировать, а потому что это не в ее компетенции. Девочка на кассе запрограммирована не скидки выдавать, а платежи принимать, вот этой ее программой и манипулируйте. ;) В вашем случае манипулировать надо не девочкой, а со стандартными схемами Сбербанка, которые позволяют эту скидку получить.

  • 40 Федчишин Алексей // Фев 3, 2009 at 20:28

    Алексей, вы становитесь предсказуемы! :) Я так и знал, что вы снова обвините меня в «обывательстве». Я не буду использовать принцип «око за око» и делать вам комплименты в ответ :) И воспользуюсь стратегией «всепрощения». Не хочу конфликтовать.

    При этом вы даже не соизволили поглубже вдуматся в сказнное мной. И опять смотрите однобоко. Продолжим так же, по порядку.

    1) Я понял вашу мысль, но вы не ответили на вопрос. В вашем заголовке идёт речь о прощении (подставь щёку) и мести (TFT). А в тексте вы противпоставляете «Поступайте, как поступали» (реактивная стратегия) и поступайте, как хотите чтоб поступали (активная стратегия). Не вижу связи заголовка со смыслом статьи.

    2) Зачем же ничего не делать. Я такого не предлагал. Это вы уже сами додумали, за меня. Я говорю лишь о том, что пользоваться данными этого эксперимента для вывода о живучести стратегии в обществе нельзя. И наверное просто нужно учитывать множество «мелочей», опускаемых в эксперименте. Но вспомним «эффект бабочки» и станем более уважительно к ним (мелочам) отнгоситься.

    3) «Ерунда» – вы умеете вешать ярлыки. Посмотрим с другой стороны: предположим, мы хотим подложить под поезд бомбу. Он никуда не денется и проедет по тем же рельсам (предсказуемость) и обязательно встретися с бомбой. А теперь попробуйте подложить бомбу под проезжающий автомобиль – наверняка объедит :)

    4) «TFT и есть максимально адаптивная стратегия, разве вы не видите» Не вижу. Вы, видимо, не совсем правильно понимаете термин адаптивность. Это есть способность менять стратегии в зависимости от обстоятельств. Единственная «гибкая стратегия» – это применение нескольких стратегий. Простите за тавтологию :)

  • 41 Алексей Глазков // Фев 3, 2009 at 21:37

    Алексей:

    Однобоко, потому что со своей позиции. Опровергнуть ее пока некому.

    1) Противопоставляю не я, а Рапопорт :) но в общем-то, почему это не так? TIT FOR TAT показала, что она эффективнее, чем все прочие стратегии (по крайней мере, в идеальных условиях). TFT – это самая настоящая месть. Всепрощение – противоположность мести. Значит, месть более справедлива, чем всепрощение. Логика, имхо, понятна.

    2) вы это только сейчас говорите. А в том комментарии я мог только догадываться. Кстати, отличный повод продемострировать, почему я снова «обвинил» вас в обывательском подходе :) Вы утверждаете: «пользоваться данными этого эксперимента для вывода о живучести стратегии в обществе нельзя. И наверное просто нужно учитывать множество “мелочей”, опускаемых в эксперименте» – и, судя по всему, считаете это истиной. Но где доказательства? Так просто – сказать и я могу что угодно :) Давайте по сути: приведите статистику, факты, какую-то логику… А так, без обоснования – это действительно подход обывательский. Не аналитический. И тем более не научный.

    3) «Подложить бомбу» – это вы называете управлять? :) )))))))
    Ладно, уйдем от метафор. Давайте конкретно: есть человек А, известный тем, что не оставляет провокацию без ответа; и есть человек Б, стратегия которого – провоцировать и убегать. Он пойдет на риск с человеком А?

    4) О Боже мой. Это вы неправильно понимаете, Алексей :) Формально вы правы, но ситуативно… Я даже объяснять не буду. Думайте сами.

  • 42 Алексей Глазков // Фев 3, 2009 at 22:16

    Татьяна,
    спасибо! Комментарии заставили задуматься. Особенно кантовский императив – не знал… Можно спорить о том, что это высказывание носит скорее метафизический характер, и поэтому в принципе непредставимо в виде простой стратегии, но мне стало интересно попробовать :)

    Единственное сомнение – насчет примеров. Если так размышлять дальше, мы можем дойти до того, что птицы должны разучиться летать, ибо если они запрограммированы летать – ими легко манипулировать… и в итоге предположить, что идеально адаптированная стратегия – это абсолютный хаос :) А этот вывод, в общем-то, довольно бесполезен.

    В общем, тот же вопрос, что и к Алексею. Есть человек А, известный тем, что не оставляет провокацию без ответа; и есть человек Б, стратегия которого – провоцировать и убегать. Он пойдет на риск с человеком А? Я вот именно это имею в виду, когда говорю об эффективности и адаптивности TFT.

  • 43 Сергей Фёдоров // Фев 3, 2009 at 23:23

    Алексей, «TFT – это самая настоящая месть. Всепрощение – противоположность мести. Значит, месть более справедлива, чем всепрощение.» – логика отсутствует, это голое утверждение.
    Любой эксперимент строится в «идеальной системе», то есть отбрасываются факторы которые невозможно просчитать, или которые «определяем» как малозначительные. Но кто доказал их малозначительность? Соответственно выводы строятся на основании пердположений о малозначительности дургих условий. Переносить выводы на другую систему или систему с другими условиями нельзя, так как меняются вводные значения. Или необходимо доказать, что вводные значения аналогичны значениям в проведенном эксперементе.
    Возвращаясь к истокам.
    «В конце 1970-х Роберт Аксельрод (Robert Axelrod), американский ученый-политолог, придумал на основе теории “ненулевой суммы” компьютерный мир и приступил к его заселению.»
    Что есть теории “ненулевой суммы”?
    «“Ненулевую сумму” проще всего понять на следующем примере. Представьте, что вы – водитель, и в машине только вы один. На одном из перекрёстков, имея полное право проехать его первым, вы тем не менее пропускаете вперед переполненный автобус с сотней пассажиров. Вы теряете при этом, допустим, 1 минуту – а все 100 пассажиров автобуса в сумме выигрывают 100 минут. Ненулевая сумма составит 99 минут – именно столько времени всё общество выиграет от жертвы вашим автомобилем одной минуты.»
    Добавляем параметр «ценность минуты» и имеем другую картину: доктор спешащий к умирающему человеку и 100 людей едущих за город развлекаться… У кого выше ценность времени: у врача или у отдыхающих?
    А ведь мы просто не учли в рассуждения параметр от которого зависит ЖИЗНЬ… тогда к чему эти рассуждения. Мертвому человеку от них нет пользы. вот мы опять вернулись к понятию «ценность».
    Я просто хочу показать, что в жизни гораздо больше факторов, чем учитывают идеальные модели про которые идет разговор.
    Ещё мысль: если мы добавляем в эксперимент самообучаемую модель, которая может определять стратегию других участников эксперимента и действовать в соответствии с этим в своих целях? К сожалению моих навыков не хватит, чтобы поставить такой эксперимент, но может найдутся люди которые смогут… было бы интресно. Дело в том, что часть людей и есть те самые «самообучаемые участники»… думаю, что их стратегия будет максимально эффективной. Правда это пока только рассуждения.
    Кстати, а как же на счет Виндетты? Это уже из нашей истории и как раз «ОКО за ОКО». Модель, которая включила в себя «ошибки» во взаимосвязях между людьми.

  • 44 Алексей Глазков // Фев 3, 2009 at 23:59

    Сергей,
    ну давай по пунктам.

    1) логика отсутствует, это голое утверждение

    Прочитай еще раз :) ты упустил начало.

    2) Любой эксперимент строится в “идеальной системе”, то есть отбрасываются факторы которые невозможно просчитать, или которые “определяем” как малозначительные. Но кто доказал их малозначительность?

    Долго объяснять, Сергей. Если есть время – почитай «Теорию игр» Неймана. Я начал с Талеба, потом пролистал Оуэна, сейчас дочитываю Неймана. Могу сказать, что все критерии значимости определены, и вполне понятно, почему чаще используются упрощенные модели с неполной информацией, чем статистически сложные. Но я не смогу это объяснить достаточно компетентно :)

    3) Добавляем параметр “ценность минуты”

    Ты начинаешь играть в игру «а что если…», как и другой Сергей :) Я, конечно, могу привести антипримеры, но чего мы этим добъемся? Учитывать ценность – это верно, но в данном примере считается, что ценность – время. Это ведь просто иллюстрация к понятию «ненулевой суммы». Это не доказательство чего-то серьезного.

    4) Ещё мысль: если мы добавляем в эксперимент самообучаемую модель

    Отличная мысль :) Вот мы и подошли вплотную к ИИ, давней моей идее-фикс. Действительно, было бы очень интересно посмотреть: ВЫРАБОТАЕТ ли ИИ стратегию, подобную TFT, или в условиях псевдоэволюции резльтат будет совсем другим?

    5) Вендетта – это не совсем TFT. Это НЕПРОПОРЦИОНАЛЬНАЯ месть, потому что решение о значимости потерь в случае кровной мести принимает заинтересованная сторона. Вот судопроизводство на основе прецедента – это гораздо более равновесная и законная схема возмездия.

  • 45 Сергей Фёдоров // Фев 4, 2009 at 00:22

    По поводу экперимента: в нем не учитывалась возможно влияния участников программы друг на друга! В среде людей это обычное явление. Писать о возможных последствиях не буду так как это будут голые измышления. Просто есть такой факт. В среде людей есть понятие «ценность»… я бедаю шаг дружелюбный и не зависимо от раекции в этот раз получаю точное знание, что в следующий раз будет дружелюбие, но следубщее событие более важное для меня… то есть приности дополнительную выгоду, соотвтетсвенно мои дивиденды будут выше. Для примера оценим два события из жизни людей: пойти на дискотеку и взять кредит в банке. Кто готов поручиться за человека, который сходил с тобой на дискотеку и там угостил тебя пивом (проявил дружелюбие в предыдущем контакте).
    Просто в нашей жизни события имеют разную «ценность»… или Алексей мы не правы? Любое событие мы можем оценить с точки зрения значимости для нашей жизни. В эаксперименте такого показателя нет… идеальная система)))
    И это не пример, это оценочный показатель. Человек «оценивает» свои поступки, вернее их возможный результат. Иначе может вмешаться третья сила.
    Виндета – классный пример, так как решение принимает сторона на основе предыдущего контакта, в данном случае сторона – сообщество людей клан/семья. В эксперименте решение тоже принималось участником/заинтересованной стороной на основе его опыта/информации о пердыдущем контаке. И ответ пропорциональный «жизнь за жизнь» – «око за око»! Где ошибка?
    Кстати, о третьей силе: удар ножем – за удар ножем… равноценный обмен. Но потом приходит ь так наша третья сторона – правоохранительные органы. И это не игра… жизнь так наша устроена)))

  • 46 Алексей Федчишин // Фев 4, 2009 at 02:08

    «…и, судя по всему, считаете это истиной. Но где доказательства?» – мне не нужно изобретать велосипед. Доказательства важности мелочей, статистику, факты уже привёл Эдвард Лоренц, открыв забытый вами эффект бабочки. Кроме того, вы видимо не заметили слово «наверно» (что выражает неуверенность в высказываемом суждении) :)

    С бомбой вам не понравилось и вы требуете доказательств. Во-первых, это можно назвать управлением (снова направляю вас к толковому словарю. Если вы прочтёте определение слова «управление», вы убедитесь в этом). С людьми А и Б неудачный пример. Конечно же Б пойдёт, если ему это будет выгодно в целях управления А: скажем, намеренная провокация.

    Научность подхода? – не вам меня упрекать. Я не вижу научности с вашей стороны. Я тоже могу сказать: докажите, что я – обыватель. Откуда вы знаете, может, я притворяюсь? Я со своей стороны могу утверждать, что вы ничего не соображаете в менеджменте, основываясь на ваших ответах. Глупости? 100% – полный бред. Но вы пользуетесь теми же непроверенными фактами, что и я: смотрите по моим ответам. А они ничего не доказывают.

  • 47 Алексей Глазков // Фев 4, 2009 at 13:25

    «Доказательства … уже привёл Эдвард Лоренц»

    Вот этих слов я и ждал :) просто одно дело – когда человек говорит про «эффект бабочки», посмотрев популистичный фильм Грубера, и другое – когда он хоть немного покопался в теории хаоса.

    «С людьми А и Б неудачный пример»

    Видимо, мы подразумеваем разное под одними и теми же словами. Вероятно, влияет эмоциональный окрас слов «месть» и «провокация» в русском языке. На всякий случай: я не наделяю их эмоциями, Аксельрод вроде бы тоже. Это просто символическое описание действия-противодействия. Давайте на этом закончим.

    «Я тоже могу сказать: докажите, что я – обыватель. Откуда вы знаете, может, я притворяюсь»

    Какая разница, притворяетесь вы или нет? Я ведь не оскорбляю вас лично :) Сами по себе вы, Алексей, можете быть неимоверно умным человеком. Просто конкретно в данных комментариях вы руководствуетесь обыденным мировоззрением. Не принимайте все на свой счет.

    «вы пользуетесь теми же непроверенными фактами, что и я: смотрите по моим ответам»

    Не совсем понял. Это еще что за утверждение? Откуда?

    И хватит отправлять к словарям. Ни в одном словаре нет точного совпадения с вашим представлением (равно как и с моим). Давайте думать головой.

  • 48 zz // Фев 4, 2009 at 18:42

    @Алексей
    ТФТ попробуйте на своих детях и родителях сначала, потом вернемся к священным писаниям и всяким там высоким материям :)

  • 49 Алексей Глазков // Фев 4, 2009 at 19:13

    zz,
    у меня, знаете ли, все отлично с родителями и детьми :) иначе бы не предлагал такой подход.

  • 50 Алексей Федчишин // Фев 5, 2009 at 01:18

    Согласен, давайте закончим. Думаю, мы с вами просто «говорим на разных языках».

    А насчёт словарей не обижайтесь. Просто они являются как раз тем средством, которые позволяют находить общий язык. То есть, понимать под одними и теми же словами одно и то же :)

  • 51 Кадик // Фев 11, 2009 at 16:32

    Око за око, жизнь за жизнь – это Коранический принцип. В Коране сказано, что возмездие спасает нам жизни. Коран как завершающее послание человечеству учитывает все аспекты нашей жизни. В нем учтено и то, что Библия была подвержена изменению и переписана обычными людьми. Пусть и апостолами, но все же не пророками.

  • 52 Алексей Глазков // Фев 11, 2009 at 17:52

    Спасибо за подсказку, и наверное поддержку :) Нашел Коран, читаю

  • 53 Кадик // Фев 13, 2009 at 17:12

    Я рад за понимание и поддержку с Вашей стороны, спасибо Алексей!

  • 54 Кадик // Фев 13, 2009 at 17:13

    Я рад за понимание и поддержку с Вашей стороны, спасибо Алексей, успехов!

  • 55 Сергей Фёдоров // Мар 4, 2009 at 23:58

    Последний комментарий к этой статье.
    Берем детей. У кого они есть, тот в курсе… Как бы ни вел себя ребенок, я максимально долго показываю куак надо себя вести. То есть языком модели «сотрудничаю», даже если ребенок дерется)) Наказание используется крайне редко.

  • 56 Надежда Гаева // Мар 18, 2009 at 00:32

    «Библия говорит: “поступай с другими так, как хочешь, чтобы другие поступали с тобой”.:(
    Вот интересно мне, как звучит точная формулировка?

    Сдаётся мне иначе:
    НЕ поступай с другими так, rак НЕ хочешь, чтоб поступали с тобой!

  • 57 Алексей Глазков // Мар 18, 2009 at 00:46

    Надя, узнал вас :) здравствуйте.

    «Во всем, как хотите, чтобы с вами поступали люди, так поступайте и вы с ними, ибо в этом закон.»
    Библия, Евангелие от Матфея, 7:12

    А то, о чем вы говорите – это кантовский этический императив. Как раз сейчас читаю.

  • 58 Проект «Эффективный человек» — Ястребы vs Голуби // Ноя 23, 2009 at 21:15

    [...] ← Око за око! Месть более справедлива, чем всепрощение Бог сокрыт в мелких деталях → 1,461 [...]

  • 59 manson // Мар 9, 2010 at 19:12

    Больше склонен к тому что мне неприемлемы христианские принципы «отношения и подставления щеки».
    Жизнь человека этопостоянная вниути и внешне видовая борьба. Тот кто перегинает палку с агрессией терпит встречную агрессию, но кто не проявляет ничего исповедуя благие намерения, подгибается под других и расстаптывается.
    Око за око считаю более правильной и гуманной мерой поведения – это позволяет не подгибать неагрессивных индивидов и давать должный отпор разным агрессорам.
    Моё мнение, что именно благодаря этому, я пока ещё барахтаюсь в этой жизни в том направлении которое сам себе задаю…

  • 60 Nadi // Мар 9, 2010 at 20:14

    Как долго обсуждается пост!
    Недавно прочитала в ЖЖ6
    Отвечать добром на добро – добро;
    Отвечать злом на зло-добро;
    Отвечать злом на добро- зло;
    Отвечать добром на зло – двойное зло…
    Прочитала. Подумала. И согласилась…

  • 61 Алексей Глазков // Мар 9, 2010 at 21:54

    Да, хорошо сказано.

Ваше имя:

Email:

Ваш блог:

Пожалуйста, указывайте нормальное имя/ник, а ссылку ставьте только на свой личный блог! Комментарии с ключевиками в имени/теме или ссылками на непонятные сайты - будут удаляться