Симулятор Теории Игр - Неадекватные Равновесия

Изучение концепций из 'Inadequate Equilibria' Элиезера Юдковского

Дилемма Заключенного

Классическая проблема, показывающая, как индивидуальная рациональность может привести к коллективной иррациональности.

Матрица Выигрышей

Противник: Сотрудничать
Противник: Предать
Вы: Сотрудничать
3 , 3
Награда
0 , 5
Простак
Вы: Предать
5 , 0
Искушение
1 , 1
Наказание
Формат: Ваш выигрыш, Выигрыш противника

Выберите Вашу Стратегию

Ваш Счет: 0
Счет Противника: 0
Раунды: 0

Анализ Равновесия Нэша

В Дилемме Заключенного, Предать - всегда ваш лучший ответ, независимо от выбора противника. Поэтому (Предать, Предать) - единственное равновесие Нэша. Однако, если бы оба сотрудничали, каждый получил бы 3 вместо 1. Это неадекватное равновесие - система застряла в субоптимальном состоянии.

Охота на Оленя - Игра Координации

Игра, показывающая, как проблемы координации могут привести к субоптимальным равновесиям.

Матрица Выигрышей

Противник: Охотиться на Оленя
Противник: Охотиться на Зайца
Вы: Охотиться на Оленя
4 , 4
Оптимально
0 , 2
Координационный Сбой
Вы: Охотиться на Зайца
2 , 0
Безопасный Выбор
2 , 2
Безопасно
Формат: Ваш выигрыш, Выигрыш противника

Выберите Вашу Стратегию

Ваш Счет: 0
Счет Противника: 0
Раунды: 0

Множественные Равновесия Нэша

Охота на Оленя имеет два равновесия Нэша: (Олень, Олень) и (Заяц, Заяц). Первое дает более высокий выигрыш (доминантно по выигрышу), но второе менее рискованно (доминантно по риску). Если вы не уверены, что противник будет охотиться на оленя, охотиться на зайца безопаснее. Это объясняет, почему системы могут застрять в субоптимальных равновесиях.

Доминантно по Выигрышу (Охотиться на Оленя) Оба Охотятся на Оленя (4,4)
Доминантно по Риску (Охотиться на Зайца) Оба Охотятся на Зайца (2,2)

Динамика Популяции

Наблюдайте, как стратегии эволюционируют поколения в популяции, играющей в повторяющиеся игры.

200
2%

Распределение Стратегий

Сотрудничающие:
50%
Предатели:
50%

Эволюция во Времени

Поколение: 0

Понимание Неадекватных Равновесий

Что такое Неадекватные Равновесия?

Неадекватное равновесие - это ситуация, когда система застревает в субоптимальном состоянии, потому что ни один индивид не имеет стимула менять свое поведение. Хотя всем было бы лучше, если бы они могли скоординироваться для изменений, индивидуальные стимулы поддерживают статус-кво.

1. Индивидуальная Рациональность ≠ Коллективная Оптимальность

То, что рационально для каждого индивида, может привести к плохим результатам для группы. Дилемма Заключенного демонстрирует это идеально.

2. Проблемы Координации

Даже когда все хотят достичь лучшего равновесия, они могут не суметь скоординироваться. Охота на Оленя показывает, как страх быть 'простаком' может поймать людей в субоптимальных выборах.

3. Путевая Зависимость

Исторические случайности могут заблокировать системы в неадекватных равновесиях. Как только система установлена, затраты на переключение и сетевые эффекты поддерживают ее.

Реальные Примеры из Книги

Статистика Больничной Смертности

Больницы не публикуют данные о смертности, потому что это заставит их выглядеть плохо по сравнению с другими. Если бы все публиковали, пациенты могли бы принимать обоснованные решения, и здравоохранение в целом улучшилось бы. Но ни одна отдельная больница не имеет стимула быть первой в публикации потенциально неблагоприятных данных.

Prisoner's Dilemma

Академические P-значения

Научное сообщество заблокировано на использовании p < 0,05 как порога статистической значимости, несмотря на известные недостатки. Существуют лучшие альтернативы, но журналы, рецензенты и исследователи все стимулированы поддерживать статус-кво. Любой, кто отклоняется, рискует публикацией и карьерным продвижением.

Coordination Problem

Суеверие 'Рыжий Предприниматель'

Если успешный предприниматель случайно рыжий, люди могут неправильно ассоциировать рыжие волосы с предпринимательским успехом. Это суеверие сохраняется, потому что: (1) дорого тестировать, (2) контрпримеры отбрасываются как исключения, и (3) соответствие сигнализирует, что вы понимаете 'культуру'.

Information Cascade

Раскладка Клавиатуры QWERTY

Раскладка клавиатуры QWERTY была разработана для предотвращения застревания пишущих машинок, а не для оптимальной скорости печати. Существуют лучшие раскладки, но затраты на переключение и сетевые эффекты поддерживают доминирование QWERTY. Производители, учителя и машинистки все имеют стимулы поддерживать статус-кво.

Path Dependence

Когда Доверять Экспертизе vs Когда Вопросить Системы

Доверять Экспертизе Когда:

  • Область имеет сильные механизмы обратной связи и исправления ошибок
  • Эксперты имеют личную заинтересованность (личные последствия за ошибки)
  • Есть активная конкуренция и инновация
  • Вы значительно менее компетентны, чем эксперты
  • Пример: Доверять инженерам по дизайну мостов

Вопросить Системы Когда:

  • Есть слабые механизмы обратной связи или долгие задержки
  • Эксперты сталкиваются с разными стимулами, чем результаты
  • Область застойна с малой инновацией
  • Вы замечаете системные сбои, которые сохраняются
  • Пример: Вопросить академические практики публикации

Как Сбежать Неадекватных Равновесий

1. Скоординировать Одновременное Действие

Заставьте всех согласиться переключиться одновременно. Это требует доверия и каналов связи.

2. Изменить Структуру Стимулов

Измените выигрыши, чтобы желаемое равновесие стало индивидуально рациональным. Регулирования или вознаграждения могут помочь.

3. Снизить Затраты на Переключение

Облегчите индивидам попытку альтернатив. Более низкие барьеры позволяют исследование.

4. Создать Критическую Массу

Постройте достаточно принятия альтернативы, чтобы сетевые эффекты начали работать в вашу пользу.

Дальнейшее Чтение

  • "Inadequate Equilibria" by Eliezer Yudkowsky Основной источник для этих концепций
  • "The Evolution of Cooperation" by Robert Axelrod Классическая работа о Дилемме Заключенного и Око за око
  • "Thinking Strategically" by Avinash Dixit and Barry Nalebuff Отличное введение в теорию игр