学习《JavaScript 数据结构与算法》读书笔记
9 图
9.1 图的相关术语
图是网络结构的抽象模型。图是一组由边连接的节点(或顶点)。
一个图G=(V, E)由以下元素组成
V: 一组顶点
E: 一组边,连接V中的顶点
由一条边连接在一起的顶点称为相邻顶点。比如,A和B是相邻的,A和D是相邻的,A和C是相邻的,A和E不是相邻的。
一个顶点的度是其相邻顶点的数量。比如,A和其他三个顶点相连接,因此,A的度为3;E和其他两个顶点项链,因此,E的度为2。
路径的顶点v1, v2, … , vk的一个连续序列,其中vi和vi+1是相邻的。
简单路径要求不包含重复的顶点。除去最后一个顶点(因为它和第一个顶点是同一个顶点),环也是一个简单路径。
如果图中不存在环,则称该图是无环的。如果图中每两个顶点都存在路径,则该图是连通的。
有向图和无向图
图可以是无向的(边没有方向)或是有向的。有向图的边有一个方向。
如果图中每两个顶点间在双向上都存在路径,则该图是强连通的。
图还可以是未加权的或是加权的,加权图的边被赋予了权值。
我们可以使用图来解决计算机科学世界中的很多问题,比如搜索图中的一个特定顶点或搜索一条待定边,寻找图中的一条路径(从一个顶点到另一个顶点),寻找两个顶点之间的最短路径,以及环检测。
9.2 图的表示
从数据结构的角度来说,我们有多种方式来表示图。在所有的表示法中,不存在绝对正确的方式。图的正确表示法取决于待解决的问题和图的类型。
9.2.1 邻接矩阵
图最常见的实现是邻接矩阵。每个节点都和一个整数相关联,该整数将作为数组的索引,我们用一个二维数组来表示顶点之间的连接。如果索引为i的节点和索引为j的节点相邻,则 array[i][j] === 1
,否则 array[i][j] === 0
。
不是强连通的图(稀疏图)如果用邻接矩阵来表示,则矩阵中将会有很多0,这意味着我们浪费了计算机存储空间来表示根本不存在的边。例如,找给定顶点的相邻顶点,即使该顶点只有一个相邻顶点,我们也不得不迭代一整行。邻接矩阵表示法不够好的另一个理由是,图中顶点的数量可能会改变,而2维数组不太灵活。
9.2.2 邻接表
我们也可以使用一种叫作邻接表的动态数据结构来表示图。邻接表由图中每个顶点的相邻顶点列表所组成。存在好几种方式来表示这种数据结构。我们可以用列表(数组)、链表,甚至是散列表或是字典来表示相邻顶点列表。
尽管邻接表可能对大多数问题来说都是更好的选择,但以上两种表示法都很有用,且它们有着不同的性质(例如,要找出顶点v和w是否相邻,使用邻接矩阵会比较快)。
9.2.3 关联矩阵
我们还可以用关联矩阵来表示图、在关联矩阵中,矩阵的行表示顶点,列表示边。我们使用二维矩阵来表示两者之间的连通性,如果顶点v是边e
的入射点,则 array[v][e] === 1
;否则 array[v][e] === 0
。
关联矩阵通常用于边的数量比顶点多的情况下,以节省空间和内存。
9.3 创建Graph类
1 | function Graph() { |
1 | this.addVertex = function(v) { |
1 | this.addEdge = function(v, w) { |
1 | this.toString = function() { |
测试下面这段代码
1 | var graph = new Graph(); |
1 | A -> B C D |
9.4 图的遍历
和树数据结构类似,我们可以访问图的所有节点,有两种算法可以对图进行遍历:广度优先搜索(Breadth-First Search, BFS) 和 深度优先搜索(Depth-First Search, DFS)。图遍历可以用来寻找特定的顶点或寻找两个顶点之间的路径,检查图是否连通,检查图是否含有环等。
图遍历算法的思想是必须最总每一个第一次访问的节点,并且追踪有哪些节点还没有被完全探索。对于两种图遍历算法,都需要明确指出第一个被访问的顶点。
完全探索一个顶点要求我们查看该顶点的每一条边。对于每一条边所连接的没有被访问过的顶点,将其标注为被发现的,并将其加进待访问顶点列表中。
为了保证算法的效率,务必访问每个顶点至多两次。连通图中每条边和顶点都会被访问到。
广度优先搜索算法和深度优先搜索算法基本上是相同的,只有一点不同,那就是待访问顶点列表的数据结构。
算法 | 数据结构 | 描述 |
---|---|---|
深度优先搜索 | 栈 | 通过将顶点存入栈中,顶点是沿着路径被搜索的,存在新的相邻顶点就去访问 |
广度优先搜索 | 队列 | 通过将顶点存入队列中,最先入队列的顶点先被探索 |
当要标注已经访问过的顶点时,我们用三种颜色来反映它们的状态。
白色: 表示该顶点还没有被访问
灰色: 表示该顶点被访问过,但并未被探索过
黑色: 表示该顶点被访问过且被完全探索过
这就是之前提到的务必访问每个顶点最多两次的原因。
9.4.1 广度优先搜索
广度优先搜索算法会从指定的第一个顶点开始遍历图,先访问其所有的相邻点,就像一次访问图的一层。换句话说,就是先宽厚深地访问顶点。
以下是从顶点 v 开始的广度优先搜索算法所遵循的步骤:
创建一个队列 Q
将 v 标注为被发现的(灰色),并将 v 入队列 Q
如果 Q 非空,则运行以下步骤
将 u 从 Q 中出队列
将标注 u 为被发现的(灰色)
将 u 所有未被访问过的邻点(白色)入队列
将 u 标注为已被探索的(黑色)
1 | var initializeColor = function() { |
1 | this.bfs = function(v, callback) { |
1 | function printNode(value) { |
1 | Visited vertex: A |
1. 使用BFS寻找最短路径
给定一个图G和源顶点v,找出对每个顶点u,u和v之间最短路径的距离(以边的数量计)
对于给定顶点v,广度优先算法会访问所有与其距离为1的顶点,接着是距离为2的顶点,以此类推。因此可以用广度优先算法来解这个问题。可以修改bfs方法以返回给我们一些信息
从v到u的距离d[u]
前溯点pred[u],用来推导出从v到其他每个顶点u的最短路径
1 | this.BFS = function(v) { |
1 | var shortestPathA = graph.BFS(myVertices[0]); |
1 | distances: [A: 0, B: 1, C: 1, D: 1, E: 2, F: 2, G: 2, H: 2 , I: 3], |
通过前溯点数组,我们可以用下面这段代码来构建从顶点A到其他顶点的路径
1 | /* 用顶点A作为源顶点 */ |
1 | A - B |
这样,我们得到了从顶点A到图中其他顶点的最短路径(衡量标准是边的数量)
2.深入学习最短路径算法
本章中的图不是加权图。如果要计算加权图中的最短路径(例如,城市A和城市B之间的最短路径:GPS和Google Maps中用到的算法),广度优先搜索未必合适。
举些例子,Dijkstra算法解决了单源最短路径问题。Bellman-Ford算法解决了边权值为负的单源最短路径问题。A*搜索算法解决了求仅一对顶点间的最短路径问题,它用经验法则来加速搜索过程。Floyd-Warshall算法解决了求所有顶点对间的最短路径这一问题。
9.4.2 深度优先搜索
深度优先搜算法将会从第一个指定的顶点开始遍历图,沿着路径知道这条路径最后一个顶点被访问了,接着原路退回并探索下一条路径。换句话说,它是先深度后广度的访问顶点。
深度优先搜索算法不需要一个源顶点。在深度优先搜索算法中,若图中顶点v未访问,则访问改顶点v
标注v为被发现的(灰色)
对于v的所有未访问的邻点w,访问顶点w,标注v为已被探索的(黑色)
深度优先搜索的步骤是递归的,这意味着深度优先搜索算法使用栈来存储函数调用(由递归调用所创建的栈)。
1 | this.dfs = function(callback) { |
1 | graph.dfs(printNode); |
1 | Visited vertex: A |
1.探索深度优先算法
对于给定的图G,我们希望深度优先算法搜索算法遍历图G的所有节点,构建“森林”(有根树的一个集合)以及一组源顶点(根),并输出两个数组:发现时间和完成探索实践。我们可以修改dfs方法来返回给我们一些信息
顶点u的发现时间d[u]
当顶点u被标注为黑色时,u的完成探索实践f[u]
顶点u的前溯点p[u]
1 | var time = 0; |
深度优先算法思想:边是从最近发现的顶点u处被向外探索的。只有连接到未发现的顶点的边被搜索了。当u所有的边都被探索了,该算法回退到u被发现的地方去探索其他的边。这个过程持续到我们发现了所有从原始顶点能够触及的顶点。如果还留有任何其他未被发现的顶点,我们对新源顶点重复这个过程。重复个算法,直到图中所有顶点都被探索了。
对于改进过的深度优先算法,有两点需要注意
时间time变量值的范围只可能在图顶点数量的一倍到两倍之间
对于所有的顶点u,d[u] < f[u](意味着,发现时间的值比完成事件的值小,完成事件意思是所有顶点都已经被探索过了)。
在这两个假设下,我们有如下的规则:1 <= d[u] < f[u] <= 2|V|
2.拓扑排序 使用深度优先搜索
有向无环图(DAG)
当我们需要编排一些任务或步骤的执行顺序时,这称为拓扑排序(topological sorting,亦写作topsrt或toposort)
拓扑排序只能应用于DAG
1 | graph = new Graph(); |
执行改进版本的深度优先搜索算法,以倒序来排序完成事件数组
1 | B - A - D - C - F - E |
这个拓扑排序结果仅是多种可能性之一。如果稍微修改一下算法,就会有不同的结果
1 | A - B - C - D - F - E |
这也是众多其他可能性中的一个
9.5 最短路径算法
9.5.1 Dijkstra 算法
Dijkstra算法是一种计算从单个源到所有其他源的最短路径的贪心算法。
首先先声明图的邻接矩阵1
2
3
4
5
6
7
8var graph = [
[0, 2, 4, 0, 0, 0],
[0, 0, 1, 4, 2, 0],
[0, 0, 0, 0, 3, 0],
[0, 0, 0, 0, 0, 2],
[0, 0, 0, 3, 0, 2],
[0, 0, 0, 0, 0, 0]
];
1 | this.dijkstra = function(src) { |
要计算顶点间的minDCistance,就要搜索dist数组中的最小值,返回它在数组中的索引:
1 | var minDistance = function(dist, visited) { |
对本节开始的图执行以上算法,会得到如下输出1
2
3
4
5
60 0
1 2
2 3
3 6
4 4
5 6
也可以修改算法,将最短路径的值和路径一同返回
9.5.2 Floyd-Warshall算法
Floyd-Warshall算法是一种计算图中所有最短路径的动态规划算法。通过该算法,我们可以找出所有源到所有顶点的最短路径1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29this.floydWarshall = function() {
var dist = [],
length = this.graph.length,
i,
j,
k;
/* 把dist数组初始化为每个顶点之间的权值 */
for (i = 0; i < length; i++) {
dist[i] = [];
for (j = 0; j < length; j++) {
dist[i][j] = this.graph[i][j];
}
}
/* 通过k,得到i途径顶点0至k,到达j的最短路径 */
for (k = 0; k < length; k++) {
for (i = 0; i < length; i++) {
for (j = 0; j < length; j++) {
/* 判断i经过顶点k到达j的路径是否比已有的最短路径更短 */
if (dist[i][k] + dist[k][j] < dist[i][j]) {
/* 如果是更短的路径,更新 */
dist[i][j] = dist[i][k] + dist[k][j];
}
}
}
}
return dist;
};
对本节开始的图执行以上算法,会得到如下输出
1 | 0 2 3 6 4 6 |
9.6 最小生成树
最小生成树(MST)
9.6.1 Prim算法
Prim算法是一种求解加权无向连通图的MST问题的贪心算法,它能找出一个边的子集,使得其构成的树包含图中的所有顶点,且边的权值之和最小
1 | this.prim = function() { |
对上节开始的图执行以上算法,会得到如下输出
1 | Edge Weight |
9.6.2 Kruskal 算法
和Prim算法类似,Kruskal算法也是一种求加权无向连通图的MST的贪心算法。
1 | this.kruskal = function() { |
下面是find函数的定义。它能防止MST出现环路1
2
3
4
5
6var find = function(i, parent) {
while (parent[i]) {
i = parent[i];
}
return i;
};
union函数定义如下1
2
3
4
5
6
7var union = function(i, j, parent) {
if (i !== j) {
parent[j] = i;
return true;
}
return false;
};