策略推理工作台

Game Theory Playground

通过运行选择来学习博弈论,而不是背定义。

每个模拟都会把真实处境压缩成参与者、策略、收益和一个问题:当某个人单独改变时,什么会跟着改变?

01

确认参与者

02

移动一个策略

03

读懂收益变化

策略形式

把冲突写成可运行的模型

玩家
A 与 B
策略
合作 / 背叛
规则
收益取决于双方选择
问题
谁会单独改变?
B
A
-1,-1
0,-5
-5,0
-3,-3
每个页面都按:规则 → 行动 → 计算 → 解释运行。

冯·诺依曼

先把规则形式化,再讨论结果。

摩根斯特恩

把经济行为看作相互依赖的选择。

纳什

寻找没人能单独变好的位置。

谢林

注意信号、承诺和焦点。

夏普利 / 奥斯特罗姆

追问合作、公平与公地如何维持。

10 个可运行模型

选择一个博弈,然后运行推理。

交互被刻意做得紧凑:改变一个变量,观察机制响应,再读懂这个响应为什么重要。

什么是博弈论?

研究“我的最佳选择取决于别人怎么选”的学科。

这里把每个概念当作一个小实验室:定义参与者,限制可选行动,计算后果,再判断结果是否稳定、公平、有效或脆弱。

收益

每个参与者得到或失去什么。

激励

为什么某个行动变得诱人。

稳定性

是否有人想单独偏离。

学习路径

快速进入 Playground

术语表

收益

参与者从某个结果中得到的价值。

策略

参与者的完整行动计划。

占优策略

无论别人怎么做都最优的策略。

均衡

所有人都在最好回应时形成的稳定状态。

剩余

获得的价值减去支付的价格或成本。

分配

把物品、房间、任务或资源分给不同人。

联盟

一起合作的一组参与者。

稳定匹配

不存在一对双方都更想选择彼此的匹配。