基于 Agent 的模型入门:Python 实现隔离仿真
2005 年诺贝尔经济学奖得主托马斯·谢林(Thomas Schelling)在上世纪 70 年代就纽约的人种居住分布得出了著名的 Schelling segregation model,这是一个 ABM(agent-based model),当年谢林只能通过铅笔在纸上进行模拟,而这次则利用 Python 进行仿真实现这个模型。
在计算机科学中,基于 Agent 的模型(agent-based models)被用来评估独立(autonomous)agent(诸如个体、群组或物体)在整个系统中的影响。这个强大的分析工具常被用在实验难以开展或者费用太高的时候。在社会科学,计算机科学,经济学和商务各领域,这个模型都有着相当广泛的应用。
在本文中,我会向你介绍用基于 Agent 的模型理解复杂现象的威力。为此,我们会用到一些 Python,社会学的案例分析和 Schelling 模型。
1. 案例分析
如果你观察多民族(multi-ethnic)混居城市的种族(racial)分布,你会对不可思议的种族隔离感到惊讶。举个例子,下面是美国人口普查局(US Census)用种族和颜色对应标记的纽约市地图。种族隔离清晰可见。
许多人会从这个现象中认定人是偏隘的(intolerant),不愿与其它种族比邻而居。然而进一步看,会发现细微的差别。2005 年的诺贝尔经济学奖得主托马斯·谢林(Thomas Schelling)在上世纪七十年代,就对这方面非常感兴趣,并建立了一个基于 Agent 的模型——“Schelling 隔离模型”的来解释这种现象。借助这个极其简单的模型,Schelling 会告诉我们,宏观所见并非微观所为(What’s going down)。
我们会借助 Schelling 模型模拟一些仿真来深刻理解隔离现象。
2. Schelling 隔离模型:设置和定义
基于 Agent 的模型需要三个参数:1)Agents,2)行为(规则)和 3)总体层面(aggregate level)的评估。在 Schelling 模型中,Agents 是市民,行为则是基于相似比(similarity ratio )的搬迁,而总体评估评估就是相似比。
假设城市有 n 个种族。我们用唯一的颜色来标识他们,并用网格来代表城市,每个单元格则是一间房。要么是空房子,要么有居民,且数量为 1。如果房子是空的,我们用白色标识。如果有居民,我们用此人的种群颜色来标识。我们把每个人周边房屋(上下左右、左上右上、左下右下)定义为邻居。
Schelling 的目的是想测试当居民更倾向于选择同种族的邻居(甚至多种族)时会如果发生什么。如果同种族邻居的比例上升到确定阈值(称之为相似性阈值(Similarity Threshold)),那么我们认为这个人已经满意(satisfied)了。如果还没有,就是不满意。
Schelling 的仿真如下。首先我们将人随机分配到城里并留空一些房子。对于每个居民,我们都会检查他(她)是否满意。如果满意,我们什么也不做。但如果不满意,我们把他分配到空房子。仿真经过几次迭代后,我们会观察最终的种族分布。
3. Schelling 模型的 Python 实现
早在上世纪 70 年代,Schelling 就用铅笔和硬币在纸上完成了他的仿真。我们现在则用 Python 来完成相同的仿真。
为了模拟仿真,我们首先导入一些必要的库。除了 Matplotlib
以外,其它库都是 Python 默认安装的。
1
2
3
4
5
|
plt
itertools
random
copy
|
接下来,定义名为 Schelling
的类,涉及到 6 个参数:城市的宽和高,空房子的比例,相似性阈值,迭代数和种族数。我们在这个类中定义了 4 个方法:populate
,is_unsatisfied
,update
,move_to_empty
, 还有 plot
)。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
:
:
width
height
races
empty_ratio
similarity_threshold
n_iterations
]
}
:
.
:
.
.
:
.
:
.
|
poplate
方法被用在仿真的开头,这个方法将居民随机分配在网格上。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
:
)
)
)
]
]
]
:
# 为每个种族创建 agent
(
+
)
|
is_unsatisfied
方法把房屋的 (x, y)
坐标作为传入参数,查看同种群邻居的比例,如果比理想阈值(happiness threshold)高则返回 True
,否则返回 False
。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
|
:
]
0
0
:
:
1
:
1
:
:
1
:
1
:
:
1
:
1
:
:
1
:
:
:
1
:
1
:
:
1
:
:
:
1
:
:
:
1
:
1
:
False
:
_threshold
|
update
方法将查看网格上的居民是否尚未满意,如果尚未满意,将随机把此人分配到空房子中。并模拟 n_iterations
次。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
:
:
)
0
:
:
]
)
agent_race
]
)
)
1
n_changes
:
break
|
move_to_empty
方法把房子坐标(x, y)
作为传入参数,并将 (x, y)
房间内的居民迁入空房子。这个方法被 update
方法调用,会把尚不满意的人迁入空房子。
1
2
3
4
5
6
7
8
|
:
]
)
race
]
)
)
|
plot
方法用来绘制整个城市和居民。我们随时可以调用这个方法来了解城市的居民分布。这个方法有两个传入参数:title
和 file_name
。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
:
)
# 如果要进行超过 7 种颜色的仿真,你应该相应地进行设置
}
:
)
)
)
)
)
)
)
|
4. 仿真
现在我们实现了 Schelling 类,可以模拟仿真并绘制结果。我们会按照下面的需求(characteristics)进行三次仿真:
- 宽 = 50,而高 = 50(包含 2500 间房子)
- 30% 的空房子
- 相似性阈值 = 30%(针对仿真 1),相似性阈值 = 50%(针对仿真 2),相似性阈值 = 80%(针对仿真 3)
- 最大迭代数 = 500
- 种族数量 = 2
创建并“填充”城市。
1
2
3
4
5
6
7
8
9
|
)
)
)
)
)
)
|
接下来,我们绘制初始阶段的城市。注意,相似性阈值在城市的初始状态不起作用。
1
2
|
)
|
下面我们运行 update
方法,绘制每个相似性阈值的最终分布。厦门叉车出租
1
2
3
4
5
6
7
8
|
)
)
)
)
)
)
|
观察以上的绘图,我们可以发现相似性阈值越高,城市的隔离度就越高。此外,我们还会发现即便相似性阈值很小,城市依旧会产生隔离。换言之,即使居民非常包容(tolerant)(相当于相似性阈值很小),还是会以隔离告终。我们可以总结出:宏观所见并非微观所为。
5. 测量隔离
以上仿真,我们只通过可视化来确认隔离发生。然而,我们却没有对隔离的计算进行定量评估。本节我们会定义这个评估标准,我们也会模拟一些仿真来确定理想阈值和隔离程度的关系。
首先在 Schelling
类中添加 calculate_similarity
方法。这个方法会计算每个 Agent 的相似性并得出均值。我们会用平均相似比评估隔离程度。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
|
:
]
:
0
0
]
]
]
:
:
1
:
1
:
:
1
:
1
:
:
1
:
1
:
:
1
:
:
:
1
:
1
:
:
1
:
:
:
1
:
:
:
1
:
1
:
)
:
)
)
|
接下去,我们算出每个相似性阈值的平均相似比,并绘制出相似性阈值和相似比之间的关系。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
}
:
)
)
)
)
)
)
)
)
)
)
)
)
|
通过上图,可以发现即便相似性阈值非常小,依然会得到很高的隔离度(由平均相似性评估)。举个例子,相似阈值为 0.3,会得到 0.75 的平均相似性。我们可以通过量化再次确定宏观所见并非微观所为。
6. 总结
在本文中,我们介绍了一个基于 Agent 的模型——“Schelling 隔离模型”,并用 Python 实现。这个十分简单的模型帮助我们理解了非常复杂的现象:多民族城市中的种族隔离。我们可以发现城市种族的高度隔离不必解读成个体层面的偏隘。