策略推理工作台

Game Theory Playground

通过运行选择来学习博弈论，而不是背定义。

每个模拟都会把真实处境压缩成参与者、策略、收益和一个问题：当某个人单独改变时，什么会跟着改变？

打开博弈从囚徒困境开始

确认参与者

移动一个策略

读懂收益变化

策略形式

把冲突写成可运行的模型

玩家

A 与 B

策略

合作 / 背叛

规则

收益取决于双方选择

问题

谁会单独改变？

-1,-1

0,-5

-5,0

-3,-3

每个页面都按：规则 → 行动 → 计算 → 解释运行。

冯·诺依曼

先把规则形式化，再讨论结果。

摩根斯特恩

把经济行为看作相互依赖的选择。

纳什

寻找没人能单独变好的位置。

谢林

注意信号、承诺和焦点。

夏普利 / 奥斯特罗姆

追问合作、公平与公地如何维持。

10 个可运行模型

选择一个博弈，然后运行推理。

交互被刻意做得紧凑：改变一个变量，观察机制响应，再读懂这个响应为什么重要。

Game 01

公平分摊房租

用密封报价把复杂的房间偏好转化为公平租金。

运行步骤

Game 02

囚徒困境

看看为什么个人理性的选择可能让所有人更糟。

运行步骤

Game 03

纳什均衡

拖动竞争者，观察什么时候没人愿意单独改变。

运行步骤

Game 04

维克里拍卖

最高报价者获胜，但只支付第二高价格。

运行步骤

Game 05

无嫉妒分配

切蛋糕，让每个人都不更喜欢别人的那一份。

运行步骤

Game 06

夏普利值

平均每位队友在所有加入顺序中的边际贡献。

运行步骤

Game 07

伯特兰竞争

调整价格，观察顾客如何流向更便宜的同质商品。

运行步骤

Game 08

公地悲剧

提高个人使用量，观察共享资源如何被消耗。

运行步骤

Game 09

最后通牒博弈

提出分配方案，并比较严格理性与人类公平感。

运行步骤

Game 10

匹配市场

逐步运行延迟接受算法，观察稳定匹配如何出现。

运行步骤

什么是博弈论？

研究“我的最佳选择取决于别人怎么选”的学科。

这里把每个概念当作一个小实验室：定义参与者，限制可选行动，计算后果，再判断结果是否稳定、公平、有效或脆弱。

收益

每个参与者得到或失去什么。

激励

为什么某个行动变得诱人。

稳定性

是否有人想单独偏离。

学习进度0%

公平分摊房租囚徒困境纳什均衡维克里拍卖无嫉妒分配夏普利值伯特兰竞争公地悲剧最后通牒匹配市场

学习路径

快速进入 Playground

route 1

公平分摊房租

三位室友合租一套 1600 美元的公寓，每个房间的吸引力都不一样。

route 2

囚徒困境

两位室友被怀疑偷吃外卖，必须选择保持沉默或背叛对方。

route 3

纳什均衡

两家奶茶店在市中心人流和郊区安静之间选择位置。

route 4

维克里拍卖

三位室友用密封报价竞争最好的卧室。

route 5

无嫉妒分配

Ava 喜欢奶油，Ben 喜欢巧克力，Chloe 喜欢水果。

route 6

夏普利值

三位队友完成价值 1000 美元的项目，但价值取决于谁和谁合作。

术语表

收益

参与者从某个结果中得到的价值。

策略

参与者的完整行动计划。

占优策略

无论别人怎么做都最优的策略。

均衡

所有人都在最好回应时形成的稳定状态。

剩余

获得的价值减去支付的价格或成本。

分配

把物品、房间、任务或资源分给不同人。

联盟

一起合作的一组参与者。

稳定匹配

不存在一对双方都更想选择彼此的匹配。