Directed Acyclic Graph
Directed Acyclic Graph(DAG)
沒有環、無向圖,就是先前提到的「樹」、「森林」;沒有環、有向圖,就是現在提到的「有向無環圖」。由於英文名稱很長,所以大家習慣採用縮寫「DAG」,字母皆大寫。
先前我們用延伸拓展的觀點來看待Tree;同樣地,我們也可以用延伸拓展的觀點來看待DAG。
DAG沒有環,不走回頭路、永遠不回頭、不斷向前進。DAG可以重新繪製,讓所有邊朝著同一個方向延伸拓展、讓所有點有著先後次序。
在各式各樣的圖之中,Tree與DAG是十分重要的特例,往往存在速度極快的演算法。由於Tree和DAG沒有環、方向明確,所以我們很容易安排出一個計算順序(一般是採用拓撲順序),循序漸進求得答案,不必受到環的折騰。
現實生活當中的DAG
不斷前進、不會後退,有時分化、有時聚合,就是DAG的最佳寫照。
是DAG:課程擋修規則、族譜、水系、閃電、洗澡。
非DAG:道路交通、食物鏈、人體血脈、山脈、氣流。
以時間軸當作主角,緣起緣滅、緣聚緣散,凡事都是DAG。
UVa 925
Topological Ordering
楔子
在枚舉所有排列的問題之中,如果我們另外再限制誰要排在誰前方、誰要排在誰後方,那麼在這些限制之下,合理的排列還會剩下哪些呢?
【註:枚舉所有排列,讀者們可另行參考「Enumerate Permutations」一文。】
先後限制與圖
誰要排在誰前方、誰要排在誰後方,其實就是兩兩之間的關係,故可以改用圖來表示:把圖上一條由A點連向B點的邊,想成是A必須排在B前方(B必須排在A後方)。
當然啦,也可以把圖上一條由A點連向B點的邊,想成是A必須排在B後方。不過一般來說我們習慣成自然地使用前者。
Topological Sort與Topological Ordering
「拓撲排序」是排序一張有向圖的點的方式。把圖上一條由A點連向B點的邊,想成是A必須排在B前方(B必須排在A後方)。「拓撲排序」用來找出合理的排列順序,讓每一個點的先後順序,符合每一條邊所規定的先後順序。
「拓撲順序」是指一張有向圖經過「拓撲排序」後,每一個點的先後順序。一張圖有許多種「拓撲順序」。只要不違背圖上每一條邊的先後規定,要怎麼排列圖上的點都行。
圖上不能有環
當圖上有環,拓樸順序就不存在。因為環上每一個點都會有連向自己的邊,意味著環上每一個點必須排在其他點的後方,環上每一個點都不能在排列順序中拔得頭籌,所以合理的排列順序不存在。
找出一個合理的排列順序(Kahn's Algorithm)
要找出合理的排列順序,首先得決定第一點!知道如何找出第一點,那麼就可以循序漸進的再找出第二點、第三點了。
可以作為第一點的點,想必它不必排在其他點後方。也就是說,沒有被任何邊連向的點,就可以作為第一點。如果有很多個第一點,那麼找哪一點都行。
決定第一點之後,那麼剩下所有點都會在第一點後方。所有關於第一點的先後規定,都已經符合了,規定存不存在都無所謂。因此,決定第一點之後,就可以刪去此點,以及刪去由此點連出去的邊──原問題可以遞迴地縮小!
只要反覆尋找沒有被任何邊連向的點,然後刪去此點以及刪去由此點連出去的邊,就可以找出一個合理的排列順序了。
附帶一提,要找出合理的排列順序,也可以由最後一點開始決定!無論要從第一點找到最後一點,或是從最後一點找到第一點,都是可以的。各位可以想想看該怎麼做。
儘管這個問題有遞迴的性質,可以用遞迴語法來實作,但由於遞迴的分支只有一條,故亦可以用迴圈語法。我想大家都會選擇以比較簡單的迴圈語法來實作吧?
實作時,可以利用變數記錄圖上每一個點目前仍被多少條邊連到。尋找沒有被任何邊連向的點,就直接看該變數是不是零;刪去由此點連出去的邊,就順便更新變數的值。
Lowest Common Ancestor
Depth
DAG可以仿照Tree來定義「深度」:一張有向無環圖,每個點的「深度」,就是起點到每個點的最遠距離。
DAG的起點和終點有許多個,抵達一個點的路線有許多條。DAG的「深度」也就是邊數最多的那一條路線的邊數(即Longest Path的長度)。
利用拓樸順序、取最大值,就可求得各點的深度。
應該也有最近距離的版本,但是我不知道專有名詞是什麼。
Lowest Common Ancestor
DAG可以仿照Tree來定義「最低共同祖先」:一張有向無環圖,圖上兩點的共同祖先當中,離起點最遠、深度最深的那一個共同祖先。
Tree只有唯一一個LCA;DAG可能有許多個LCA、也可能沒半個。
如果定義成最近距離,會產生什麼問題呢?留給讀者想想看。
演算法
求出有向無環圖上所有點對的LCA。
一、每個點,求深度:拓樸順序、取最大值。 二、每個點,找出祖先們:每個點,作為起點,逆向Graph Traversal。 三、每個點對,找出LCA:窮舉共同祖先,深度最深的共同祖先就是LCA。
時間複雜度分成三部份討論:
一、一次Graph Traversal的時間。
二、V次Graph Traversal的時間。圖的資料結構為Adjacency Matrix,時間複雜度O(V³);圖的資料結構為Adjacency List,時間複雜度O(V(V+E)),或者簡單寫作O(VE)。
三、求出一個點對的LCA需時O(V),總共O(V²)個點對,時間複雜度O(V³)。
總時間複雜度O(V³)。
UVa 11457
演算法
http://www.dcs.warwick.ac.uk/~czumaj/PUBLICATIONS/DRAFTS/LCA-Max-witness.pdf
時間複雜度O(VE)。