all pairs shortest paths: Floyd–Warshall algorithm

用途

一張有向圖,找出所有兩點之間的最短路徑。

演算法

Warshall's algorithm」套用到最短路徑問題。

d(i, j, k) = min( d(i, k, k-1) + d(k, j, k-1), d(i, j, k-1) )
                  ^^^^^^^^^^^^^^^^^^^^^^^^^^^  ^^^^^^^^^^^^
                  經過第k點                    沒有經過第k點

d(i, j, k):由i點到j點的最短路徑長度。中繼點只能是第0點到第k點。

兩點之間的所有路徑,依照中繼點來分類。

一條路徑的中繼點,可能有第0點、第1點、…… 第V-1點。現在把i點到j點的路徑分成兩種:經過第V-1點、未經過第V-1點。接著兩種再各自細分為:經過第V-2點、未經過第V-2點。如此不斷細分下去直到:經過第0點、未經過第0點。

時間複雜度

時間複雜度O(V³),空間複雜度O(V²)。由於計算順序以及最小值運算的關係,記憶體得以重複使用,只需要二維陣列。

演算法:找出所有兩點之間最短路徑長度

bottom-up dynamic programming,三層迴圈填表格。逐次添加一個中繼點,更新所有路徑長度。

演算法:找出所有兩點之間最短路徑

兩種記錄最短路徑的方法:紀錄中繼點、紀錄第二點。

中繼點順序

分類時,其實可以採用任意的中繼點順序。

舉例來說,把i點到j點的路線分成兩種:經過第8點、未經過第8點。接著兩種再各自細分為:經過第5點、未經過第5點。如此不斷細分下去,直到圖上每一點都用過為止。

也就是說,在k的迴圈當中,k值並非一定要從0跑到V-1。k值可以隨意變動,只要0到V-1的數字都剛好出現一次就行了。

演算法:偵測負環

除了使用label correcting algorithm的方式以外,另外還有個更直觀的檢查方法:

d[i][j]是由i點走到j點的最短路徑長度,d[i][i]則是由i點出外繞一圈回到i點的最短路徑長度。如果d[i][i]的長度是負值,就表示這條路徑就是負環、或者包含負環(以負環作為捷徑)。

只要檢查每個環的所有可能的起點i(窮舉圖上所有點),檢查d[i][i]的長度,就可以知道圖上有沒有負環。

UVa 104 125 423 436 534 544 567 10048 10099 10246 10342 10985 10987 ICPC 4524

all pairs shortest paths: Johnson's algorithm

用途

一張有向圖,找出所有兩點之間的最短路徑。

首先重新調整邊的權重為非負數,順便檢查圖上是否有負環。接著放心使用label setting algorithm計算所有兩點之間的最短路徑。

重新調整權重

如何調整權重,才不會影響最短路徑、負環的位置呢?

這裡介紹一個巧妙的方法:首先圖上每一個x點都設定一個權重h(x),然後將一條由i點到j點的邊的權重w(i,j),重新調整成w'(i,j) = w(i,j) + h(i) - h(j)。

一、一條路徑s⤳t,權重變成了:

  w'(s⤳t)
= w'(s→a→b→…→z→t)
= w'(s,a) + w'(a,b) + … + w'(z,t)
= [ w(s,a)+h(s)-h(a) ] + [ w(a,b)+h(a)-h(b) ] + … + [ w(z,t)+h(z)-h(t) ]
= w(s,a) + w(a,b) + … + w(z,t) + h(s) - h(t)
= w(s→a→b→…→z→t) + h(s) - h(t)
= w(s⤳t) + h(s) - h(t)

一加一減相消,得到簡潔的結果。

h(s)和h(t)都是定值。由s點到t點的每一條路徑,權重的變動量都一樣,權重大小關係保持不變,於是乎由s點到t點的最短路徑保持不變。圖上的最短路徑,調整權重之後,依然保持不變。

二、一個環s⤳s,權重變成了:

  w'(s⤳s)
= w'(s→a→b→…→s)
= w(s→a→b→…→s) + h(s) - h(s)
= w(s⤳s)

環的權重保持不變,於是乎由s點到s點的負環保持不變。圖上的負環,調整權重之後,依然保持不變。

重新調整權重為非負數:利用單源最短路徑長度

調整權重而不會影響最短路徑和負環的方法已經有了。現在要妥善設定h(x)的值,讓每一條邊的權重都調整為非負數。

找到最短路徑樹之後,圖上每一條邊都不可能再做relaxation,數學式子d(i) + w(i,j) ≥ d(j),移項w(i,j) + d(i) - d(j) ≥ 0,正好就是調整權重的式子。

因此,令h(x)是由一個起點到各個x點的最短路徑長度,就能重新調整權重為非負數;無論起點是哪一點,數學式子都會成立。

起點應該選誰呢?因為圖上每一條邊都必須調整權重、圖上每一個點都必須設定h(x)值,所以起點必須能夠到達圖上每一個點,如此圖上每一個點才有h(x)值。

巧妙的解決方式:增加一個超級起點,連向圖上每一個點,權重設定為零。

順帶一提,以單源最短路徑長度重新調整權重,所有最短路徑的所有邊,權重都會變成零。這是一個很好用的特性。

演算法

一、增加一個超級起點,連向原圖每一個點,權重設定為零。
二、以超級起點作為起點,實施label correcting algorithm。
 甲、求得超級起點到原圖每一個點的最短路徑長度,作為h(x)。
 乙、順便檢查原圖是否有負環。
三、調整原圖每一條邊(i,j)的權重:
  w'(i,j) = w(i,j) + h(i) - h(j)
四、原圖每一個點分別作為起點,
  分別實施label setting algorithm with binary heap,
  找出圖上任兩點之間的最短路徑。
五、找出最短路徑後,對照原圖求出正確的最短路徑長度。
  或者利用h(x)逆推:w(s⤳t) = w'(s⤳t) - h(s) + h(t)。

時間複雜度

一次label correcting algorithm以及V次label setting algorithm with binary heap的時間。

圖的資料結構為adjacency lists是O(V² + VElogV)。當圖上的邊很少,比Floyd–Warshall algorithm來得快。

point-to-point shortest path: A* search

用途

一張有向圖,選定一個起點與一個終點,找出起點到終點的最短路徑。

single source shortest paths的label setting algorithm

實施單源最短路徑演算法,一旦遇到終點就馬上停止。比起點到終點還要長的最短路徑,得以略過計算,節省時間。

無法抵達終點的最短路徑,能不能也略過計算呢?

state space tree的A* search

請見本站文件「state space tree」。

運用估計函數h(x),容易直奔終點,解決了方才的問題。

二維平面上的最短路徑,可以用「當前點到終點的直線距離」作為估計函數h(x)。一般的圖的最短路徑,沒有規律可循,無法估計距離。

時間複雜度

儘管label setting algorithm與A* search的時間複雜度相同,但是A* search容易直奔終點、計算時間較少。現行的時間複雜度標記方式,無法明確區分兩者的快慢差異。

point-to-point shortest path: label setting algorithm with reweighting

估計函數用來改變遍歷順序

估計函數h(x)用來改變遍歷順序。一個估計函數,如同一個排列函數(permutation),重新排列所有點,得到一個點順序(vertex ordering)。

權重函數、成本函數,功效相同。

label setting algorithm使用權重函數w(i,j)、uniform-cost search使用成本函數g(x),兩者的遍歷順序完全相同!

  argmin { d(s⤳i) + w(i,j) }   label setting algorithm
     ʲ                         尋找不在樹上、離起點最近的點
= argmin { d(s⤳j) }
     ʲ
= argmin { g(j) }              uniform-cost search
     ʲ                         尋找成本最小的點

調整函數、估計函數,功效相同。

label setting algorithm引入調整函數-h(x)讓權重變成w(i,j) - h(i) + h(j)、A* search引入估計函數h(x)讓成本變成g(x) + h(x),兩者的遍歷順序完全相同!

  argmin { d'(s⤳i) + w'(i,j) }      label setting algorithm with reweighting
= argmin { d(s⤳i) - h(s) + h(i) + w(i,j) - h(i) + h(j) }
= argmin { d(s⤳i) + w(i,j) + h(j) - h(s) }
= argmin { d(s⤳j) + h(j) - h(s) }
= argmin { g(j) + h(j) - h(s) }
= argmin { g(j) + h(j) } - h(s)     h(s)是定值,不影響最小值位置
= argmin { g(j) + h(j) }            A* search

label setting algorithm with reweighting = A* search

我們可以堂堂正正回到圖論領域。我們可以直接使用label setting algorithm的一系列演算法了!

運用調整函數-h(x),改變遍歷順序,容易直奔終點!

point-to-point shortest path: Goldberg–Harrelson algorithm (ALT algorithm)🚧

這是個專利

此演算法是Microsoft的專利。照理來說,我不可以介紹。

說文解字

ALT是指A* search、landmark、triangle inequality。

triangle inequality:利用單源最短路徑長度,調整權重為非負數。
landmark:單源最短路徑的起點。
A* search:遍歷時容易直奔地標。

調整函數:單源最短路徑長度

d⁺(x)和-d⁻(x)都可以重新調整權重為非負數。

令d⁺(x)是由一個起點a到各個x點的最短路徑長度。最短路徑之三角不等式d⁺(i) + w(i,j) ≥ d⁺(j),移項w(i,j) + d⁺(i) - d⁺(j) ≥ 0。因此w'(i,j) = w(i,j) + d⁺(i) - d⁺(j)可以重新調整權重為非負數。

令d⁻(x)是由各個x點到一個終點a的最短路徑長度。最短路徑之三角不等式w(i,j) + d⁻(j) ≥ d⁻(i),移項w(i,j) - d⁻(i) + d⁻(j) ≥ 0。因此w'(i,j) = w(i,j) + (-d⁻(i)) - (-d⁻(j))可以重新調整權重為非負數。

估計函數:單源最短路徑長度

令d⁺(x)是由a點到各個x點的最短路徑長度。最短路徑之三角不等式d⁺(x) + d(x⤳t) ≥ d⁺(t),移項d(x⤳t) ≥ -d⁺(x) + d⁺(t)。因此h(x) = -d⁺(x) + d⁺(t)可以當作估計函數、-h(x)可以重新調整權重為非負數。

令d⁻(x)是由各個x點到a點的最短路徑長度。最短路徑之三角不等式d(x,t) + d⁻(t) ≥ d⁻(x),移項d(x,t) ≥ d⁻(x) - d⁻(t)。因此h(x) = d⁻(x) - d⁻(t)可以當作估計函數、-h(x)可以重新調整權重為非負數。

合併調整函數

兩個調整函數h₁(x)與h₂(x)一旦能夠調整權重為非負數,兩者的最大值max(h₁(x), h₂(x))也能夠調整權重為非負數。最小值亦然。

{ w(i,j) + h₁(i) - h₁(j) ≥ 0
{ w(i,j) + h₂(i) - h₂(j) ≥ 0
max( w(i,j), w(i,j) ) + max( h₁(i), h₂(i) ) - max( h₁(j), h₂(j) ) ≥ 0
w(i,j) + max( h₁(i), h₂(i) ) - max( h₁(j), h₂(j) ) ≥ 0

取最大值的好處,以估計函數的立場來看,就是估計更加精準,仍舊不高估。

按照本站行文風格,我應該講最小上界與最大下界,不過我想最大值與最小值比較好懂吧。

演算法

一、建立超級起點,調整權重為非負數。
 (調整權重為非負數,以便實施高速演算法。)
二、選擇數個地標,調整權重為非負數。
 (調整權重,即是調整遍歷順序,以便直奔地標。)
 甲、選擇數個地標。
 乙、分別計算單源最短路徑長度。
  (調整權重為非負數,以便取最大值。)
  (順帶一提,取最小值,即是一齊計算多源最短路徑。)
 丙、取最大值,合併成一個調整函數。
三、點到點最短路徑:label setting algorithm系列。

選擇地標

如何選擇地標,目前還沒有定論。地標均勻分布、地標呈蜘蛛網狀散開、地標兩兩相距最遠、地標放在主幹道上宛如收費站、地標放在交通要衝四通八達之處、地標放在經常路過的地方、……。

一邊更新地標、一邊計算最短路徑,這樣又可以發幾篇論文了。

最短距離的下限與上限

估計函數h(x)負責下限,reach函數r(x)負責上限。

d(i⤳j)最短距離的下限:max( -d⁺(i) + d⁺(j), d⁻(i) - d⁻(j) )
d(i⤳j)最短距離的上限:min { max d⁻(x) + max d⁺(x) } = min { r⁻(x) + r⁺(x) }
                      max { min d⁻(x) + min d⁺(x) }

加速技巧:reach

抵達x點的所有最短路徑的長度最大值。一旦超過最大值,就不必relaxation。計算過程當中,最短路徑長度只增不減,一旦超過最大值,甚至可以直接丟掉x點。離開x點亦然。

r⁻(x) = max d(i⤳x)
         i
r⁺(x) = max d(x⤳j)
         j

if d(s⤳i) + w(i,j) ≤ r⁻(j) and h(j⤳t) ≤ r⁺(j) then relaxtion

前後兩段路徑可能共用路徑,導致效果變差。改為窮舉穿過x點的所有最短路徑,前後兩段路徑取長度最小值。

r(x) = max { min( d(i⤳x) , d(x⤳j) ) }
      shortest path i⤳x⤳j

if min( d(s⤳i) + w(i,j) , h(j⤳t) ) ≤ r(j) then relaxtion

加速技巧:shortcut

建立便道,降低reach。

加速技巧:transit node routing

一塊土地的出入口們,求得所有點對最短路徑。穿越土地,直接查表。

加速技巧:highway hierarchy / highway graph

收縮必經之路。遞迴下去。

加速技巧:contraction hierarchy

收縮冷門地點,改成便道。遞迴下去。

加速技巧:hub labelling

每個點的最短路徑樹,只存一部分。起點與終點,查表找到共同中繼點。