connected component

connected component(maximal connected subgraph)
(1-connected component in undirected graph)

譯作「連通分量」、「連通成分」、「連通元件」、「連通單元」,簡稱「分量」,沒有正式翻譯。

當一張無向圖不連通、分隔成幾個區塊的時候,每一個區塊都是一個「連通分量」。一個獨立的點也是一個連通分量。

一張無向圖的連通分量們,不可能互相重疊。一個連通分量是指在連通的情況下,點數盡量最多、擴展範圍最大的一個子圖;因此,從一個連通分量當中,切下一小塊仍舊連通的子圖,並不能叫做連通分量。

運用graph traversal就能找到一張無向圖的所有連通分量。

UVa 459 10765

biconnected component(block)
(2-vertex-connected component in undirected graph)

一張無向圖上,不會產生關節點的連通分量,稱作「雙連通分量」。一張無向圖的雙連通分量們,通常會互相重疊,重疊的部分都是原圖的關節點。

把一個雙連通分量視作一個點,把一個關節點也視作一個點,凡有接觸就添上一條邊,如此可以建立出一棵樹,通常稱作block-cutvertex tree或者block-cutvertex graph。

bridge-connected component
(2-edge-connected component in undirected graph)

一張無向圖上,不會產生橋的連通分量,稱作「橋連通分量」。

兩個點之間沒有橋,就至少有兩條不同的路徑。這兩條路徑勢必形成一個環。一個橋連通分量,想必是由很多環交疊而成的。

把一個這樣的連通分量視作一個點,凡有接觸就添上一條邊,如此可以建立出一棵樹。

ICPC 5135 4839 7605

strongly connected component
(1-connected component in directed graph)

一張有向圖的「強連通分量」,是所有兩點之間,雙向皆有路可通的連通分量。一張有向圖的強連通分量們,不可能互相重疊。

兩個點來回都有路徑,這兩條路徑勢必形成一個有向環。一個強連通分量,想必是由很多有向環交疊而成的。

要是把一張圖的各個強連通分量,各自收縮成一個點,如此圖上就沒有環,形成有向無環圖(DAG)。這個手法很有用處──沒有環的圖,常常會有效率極佳、令人眼睛一亮的演算法。當遇到一張有環的圖,不妨先把每個強連通分量統統收縮,簡化問題的複雜程度。

UVa 11504 11709 11770 11838

weakly connected component

一張有向圖的「弱連通分量」,是所有兩點之間,至少單向有路可通的連通分量。一張有向圖的弱連通分量們,通常會互相重疊。

一個弱連通分量,可以看作是強連通分量的縮圖當中的一條有向路徑。要找最大的弱連通分量,即是縮圖當中,涵蓋最多原點的一條有向路徑。

UVa 11324

connected component: Tarjan's algorithm

演算法

一張無向圖,找到所有的bridge-connected component。亦可進一步收縮所有的BCC、收縮所有的環,讓原圖變成一叢森林。

一張有向圖,找到所有的strongly connected component。亦可進一步收縮所有的SCC、收縮所有的環,讓原圖變成一張有向無環圖。

為什麼要收縮呢?當圖上有環,難以設計有效率的演算法。收縮所有的環,讓圖變成樹、有向無環圖,就容易解決問題了!

無向圖:
尋找所有的bridge-connected component、收縮所有的環

利用尋找所有橋的演算法,輔以堆疊,找到所有的BCC。

一、實施DFS。
二、拜訪階段,
  針對每一個點,計算自身與子孫所能觸及的最高祖先。
  (觸及是指:不斷往下走tree edge、往上走back edge。)
三、回溯階段,
  每當發現某一點恰是最高祖先,即表示此點與子孫已經形成BCC。
  從堆疊之中刪除BCC,避免再次處理。

時間複雜度等於一次DFS的時間。圖的資料結構為adjacency matrix是O(V²);圖的資料結構為adjacency lists是O(V+E)。

有向圖:
尋找所有的strongly connected component、收縮所有的環

與無向圖幾乎相同。不必擔心多重邊的問題,但是要小心處理forward edge和cross edge。

一、實施DFS。
二、拜訪階段,
  針對每一個點,計算自身與子孫所能觸及的最高祖先。
  觸及是指:不斷走任意邊,但是不能走到曾經形成的SCC。
  (forward edge和cross edge可能連往已經移除的SCC,不得計算。)
三、回溯階段,
  每當發現某一點恰是最高祖先,即表示此點與子孫已經形成SCC。
  從堆疊之中刪除SCC,避免再次處理。

connected component: Kosaraju's algorithm

演算法

一張有向圖,找到所有的strongly connected component。亦可進一步收縮所有的SCC、收縮所有的環,讓原圖變成一張有向無環圖。

原圖,顛倒每一條邊的方向,得到新圖。所有SCC的位置依舊相同!

縮圖亦然!原縮圖、新縮圖都是有向無環圖。以原縮圖的拓樸順序,遍歷新縮圖,依序摘下每個點,每個點都是一個SCC。而且只有入邊、沒有出邊。

改以尚未收縮的原圖、新圖來詮釋。以原圖的「偽」拓樸順序,遍歷新圖,依序摘下每個連通分量,每個連通分量都是一個SCC。而且沒有出邊,不怕走過頭。

原圖有環,沒有拓樸順序,只好以偽物代替:「DFS離開點的順序,然後頭尾顛倒」或簡述為「DFS離開點的逆序」。雖然這個順序既非原圖、亦非縮圖的拓樸順序,但是可以優先遇見應該摘下的連通分量。

一、原圖實施DFS,找偽拓樸順序。
  (每一棵SCC子樹,必然連續遍歷。)
二、新圖實施DFS/BFS,以偽拓樸順序找連通分量。
  每一棵DFS tree/BFS tree,對應到每一個SCC。
  (確認哪些點是同一個SCC。)

時間複雜度是兩次DFS的時間,以及顛倒所有邊的時間。

圖的資料結構為adjacency matrix,不必變動資料結構就可以達到顛倒所有邊的效果,時間複雜度O(V²);圖的資料結構為adjacency lists,需要特地顛倒所有邊,時間複雜度O(V+E)。

2-connected component

有向圖:尋找所有的2-connected component

《Finding 2-Edge and 2-Vertex Strongly Connected Components in Quadratic Time》

O(V²)。

有向圖:尋找所有的2-connected component

《Faster Algorithms for Computing Maximal 2-Connected Subgraphs in Sparse Directed Graphs》

O(EsqrtE)。

有向圖:在線尋找所有的2-connected component

《Incremental Strong Connectivity and 2-Connectivity in Directed Graphs》

O(VE)。

3-connected component

k-connected component

2-satisfiability

兩個至少選一個

首先介紹嘮叨媽媽和偏食小孩的討價還價問題。

青椒、菠菜至少選一個。青椒、番茄至少選一個。番茄、苦瓜至少選一個。苦瓜、菠菜至少選一個。不吃苦瓜、不吃青椒,至少選一個。選擇哪些菜色,才能成全媽媽的愛心,滿足小孩的任性?

2-satisfiability(2-SAT)

邏輯學有一個相似的問題。

變數X₀、X₁、……,變數值true或false。變數可以重複出現。變數可以加上not。括號之間是and,括號裡面是or,格式是固定的。

括號之間是and:每個括號都是true,整個式子才是true。

括號裡面是or:「左右皆true」或者「左true右false」或者「右true左false」,整個括號才是true。

如何設定變數值,讓整個式子成為true呢?

2-satisfiability另一種觀點

N個變數。每個變數都要設定數值為true或false。

一個變數X,要嘛X = true,要嘛X = false。換句話說,要嘛X = true,要嘛¬X = true。兩個元件X與¬X二選一。

N個變數,一共2N個元件。最後選出N個元件。

一個括號裡面有兩個元件,括號必須成為true。

正向思考:左右皆選、左選右不選、左不選右選。

可選可不選。這樹立了模稜兩可的規則,難以設計演算法。

逆向思考:不選這個,就必須選另外一個。

一定要選。這樹立了一定要遵守的規則,容易設計演算法。

以有向圖作為模型

把元件之間的「依賴關係」建立成有向圖。

一、依序處理每個括號。
 甲、變數不同。例如(X or Y)。
  口、不選X(選了¬X),就一定要選Y:建立一條有向邊¬X → Y。
  口、不選Y(選了¬Y),就一定要選X:建立一條有向邊¬Y → X。
 乙、變數相同。例如(X or X)。
  口、一定要選X,一定不能選¬X:建立一條有向邊¬X → X。
    (一旦選¬X,就連帶選X,產生矛盾。只好選X。) 
 丙、變數相同,一正一反。例如(X or ¬X)。
  口、無論選X或選¬X都行:不必建立邊。

判斷是否有解

無解⇔遞移閉包上必有一個環同時穿過X與¬X。證明如下。

(⇐)選了一個點,可及之處也得選。X與¬X必須二選一。當X與¬X同屬一環,無論選哪一個,都會連帶選到對方,導致無解。

(⇒)引發無解的情況是X必選,而X同時可及Y與¬Y。既然X⤳Y,則同時存在逆否命題¬Y⤳¬X。既然X⤳¬Y,則同時存在逆否命題Y⤳¬X。最後使得X和¬X同屬一環。

實作時,判斷X與¬X是否在同一個SCC即可。SCC裡面是一群交織的環,SCC之間沒有環。

找出其中一組解

依序檢查每一對元件X與¬X。若是祖孫,則選擇孫,避免矛盾;若不是祖孫,則任一皆可,但是必須避免跟先前元件產生衝突。

可以找出字典順序最小的解。時間複雜度O(VE)。

一、建立有向圖。
二、依序判斷每一對元件X與¬X何者為解:
 甲、嘗試X作為解:若X可及之處存在非解者,則X非解。
 乙、嘗試¬X作為解:若¬X可及之處存在非解者,則¬X非解。
 丙、確認X與¬X何者為解之後,將其可及之處全數標記為解。

找出其中一組解

採用逆向拓樸順序。時間複雜度O(V+E)。

一、建立有向圖。
二、尋找所有SCC。
三、收縮每個SCC,成為有向無環圖DAG。
  (同一個SCC裡面的點,必須同進退;要嘛全選,要嘛全不選。)
四、尋找縮圖的拓樸順序。
五、在縮圖上,以逆向拓樸順序,設定解。

兩個只能選一個

把or改成xor。留給讀者解決。

UVa 10319 11294 11861 11930 ICPC 3211 3713 4452 4849

3-satisfiability

三個至少選一個

括號裡面改成三個變數,稱作3-SAT。NP-complete。沒有快速的演算法。

3-SAT被認為是最根本的NP-complete問題。凡是NP-complete問題都可以重新改寫成3-SAT問題,再用3-SAT演算法求解。然而式子繁雜冗長,導致實務上沒有人這麼做。