dynamic programming

長江後浪催前浪，一替新人趲舊人。《張協狀元》

資之深，則取之左右逢其原。《孟子》

dynamic programming

先透過一個簡單的例子，感受一下「動態規劃」吧！

範例：階乘（factorial）

1 × 2 × 3 × ⋯ × N。整數1到N的連乘積。N階乘。N!。

N!源自(N-1)!，如此就遞迴分割問題了。

陣列的每一格對應每一個問題。設定第一格的答案，再以迴圈依序計算其餘答案。

UVa 623 568 10220 10323

時間複雜度

總共N個問題，每個問題花費O(1)時間，總共花費O(N)時間。

空間複雜度

求1!到N!：總共N個問題，用一條N格陣列儲存全部問題的答案，空間複雜度O(N)。

只求N!：用一個變數累計乘積，空間複雜度O(1)。

dynamic programming - recurrence

dynamic programming
= divide-and-conquer method + memoization

動態規劃是分治法的延伸。當分治法分割出來的問題，一而再、再而三出現，就運用記憶法儲存這些問題的答案，避免重複求解，以空間換取時間。

動態規劃的過程，就是反覆地讀取數據、計算數據、儲存數據。

1. 把原問題遞迴分割成許多更小的問題。（recurrence）
   1-1. 子問題與原問題的求解方式皆類似。（optimal sub-structure）
   1-2. 子問題會一而再、再而三的出現。（overlapping sub-problems）
2. 設計計算過程：
   2-1. 確認每個問題需要哪些子問題來計算答案。（recurrence）
   2-2. 確認總共有哪些問題。（state space）
   2-3. 把問題一一對應到表格。（lookup table）
   2-4. 決定問題的計算順序。（computational sequence）
   2-5. 確認初始值、計算範圍。（initial states / boundary）
3. 實作，主要有兩種方式：
   3-1. top-down
   3-2. bottom-up

1. recurrence

遞迴分割問題時，當子問題與原問題完全相同，只有數值範圍不同，我們稱此現象為recurrence，再度出現、一再出現之意。

【註：recursion和recurrence，中文都翻譯為「遞迴」，然而兩者意義大不相同，讀者切莫混淆。】

此處以爬樓梯問題當作範例。先前於遞歸法章節，已經談過如何求踏法，而此處要談如何求踏法數目。

踏上第五階，只能從第四階或從第三階踏過去。因此「爬到五階」源自兩個子問題：「爬到四階」與「爬到三階」。

「爬到五階」的踏法數目，就是總合「爬到四階」與「爬到三階」的踏法數目。寫成數學式子是「f(5) = f(4) + f(3)」，其中「f(‧)」表示「爬到某階之踏法數目」。

依樣畫葫蘆，得到「f(4) = f(3) + f(2)」、「f(3) = f(2) + f(1)」。

「爬到兩階」與「爬到一階」無法再分割、沒有子問題，直接得到「f(2) = 2」、「f(1) = 1」。

整理成一道簡明扼要的遞迴公式：

f(n) =
 ⎧ 1                , if n = 1
 ⎨ 2                , if n = 2
 ⎩ f(n-1) + f(n-2)  , if n >= 3 and n <= 5

爬到任何一階的踏法數目，都可以藉由這道遞迴公式求得。n代入實際數值，遞迴計算即可。

為什麼分割問題之後，就容易計算答案呢？因為分割問題時，同時也分類了這個問題的所有可能答案。分類使得答案的規律變得單純，於是更容易求得答案。

2-1. recurrence

f(n) =
 ⎧ 1                , if n = 1
 ⎨ 2                , if n = 2
 ⎩ f(n-1) + f(n-2)  , if n >= 3

2-2. state space

想要計算第五階的踏法數目。

全部的問題是「爬到一階」、「爬到二階」、「爬到三階」、「爬到四階」、「爬到五階」。

至於「爬到零階」、「爬到負一階」、「爬到負二階」以及「爬到六階」、「爬到七階」沒有必要計算。

2-3. lookup table

建立六格的陣列，儲存五個問題的答案。

表格的第零格不使用，第一格是「爬到一階」的答案，第二格是「爬到二階」的答案，以此類推。

如果只計算「爬完五階」，也可以建立三個變數交替使用。

2-4. computational sequence

因為每個問題都依賴「階數少一階」、「階數少二階」這兩個問題，所以必須由階數小的問題開始計算。

計算順序是「爬到一階」、「爬到二階」、……、「爬到五階」。

2-5. initial states / boundary

最先計算的問題是「爬到一階」與「爬到二階」，必須預先將答案填入表格、寫入程式碼，才能繼續計算其他問題。心算求得「爬到一階」的答案是1，「爬到二階」的答案是2。

最後計算的問題是原問題「爬到五階」。

為了讓表格更順暢、為了讓程式碼更漂亮，可以加入「爬到零階」的答案，對應到表格的第零格。「爬到零階」的答案，可以運用「爬到一階」的答案與「爬到兩階」的答案，刻意逆推而得。

最後可以把初始值、尚待計算的部份、不需計算的部分，統整成一道遞迴公式：

f(n) =
 ⎧ 0                , if n < 0               [exterior]
 ⎪ 1                , if n = 0               [initial state]
 ⎨ 1                , if n = 1               [initial state]
 ⎪ f(n-1) + f(n-2)  , if n >= 2 and n <= 5   [computation]
 ⎩ 0                , if n > 5               [exterior]

UVa 11069

3. 實作

直接用遞迴實作，而不使用記憶體儲存各個問題的答案，是最直接的方式，也是最慢的方式。時間複雜度O(f(n))。問題一而再、再而三的出現，不斷呼叫同樣的函式求解，效率不彰。剛接觸DP的新手常犯這種錯誤。

正確的DP，是一邊計算，一邊將計算出來的數值存入表格，以後便不必重算。這裡整理了兩種實作方式，各有優缺點：

1. top-down
2. bottom-up

3-1. top-down

這個實作方式的好處是不必斤斤計較計算順序，因為程式碼中的遞迴結構會迫使最小的問題先被計算。這個實作方式的另一個好處是只計算必要的問題，而不必計算所有可能的問題。

這個實作方式的壞處是程式碼採用遞迴結構，不斷呼叫函式，執行效率較差。這個實作方式的另一個壞處是無法自由地控制計算順序，因而無法妥善運用記憶體，浪費了可回收再利用的記憶體。

UVa 10285 10446 10520

3-2. bottom-up

訂定一個計算順序，然後由最小的問題開始計算。特色是程式碼通常只有幾個迴圈。這個實作方式的好處與壞處，與前一個方式恰好互補。

首先建立表格。

心算「爬到零階」的答案、「爬到一階」的答案，填入表格當中，作為初始值。分別填到表格的第零格、第一格。

尚待計算的部份就是「爬到兩階」的答案、……、「爬到五階」的答案。通常是使用迴圈，按照計算順序來計算。

計算過程的實作方式，有兩種迥異的風格。一種是「往回取值」，常見的實作方式。

另一種是「往後補值」，罕見的實作方式。

計算完畢之後，最後印出答案。

UVa 495 900 10334

總結

第一。先找到原問題和其子問題們之間的關係，寫出遞迴公式。如此一來，便可利用遞迴公式，用子子問題的答案，求出子問題的答案；用子問題的答案，求出原問題的答案。

第二。確認可能出現的問題全部總共有哪些，這樣才能知道要計算哪些問題，才能知道總共花多少時間、多少記憶體。

第三。有了遞迴公式之後，就必須安排出一套計算的順序。大問題的答案，總是以小問題的答案來求得的，所以，小問題的答案是必須先算的，否則大問題的答案從何而來呢？

一個好的安排方式，不但使程式碼容易撰寫，還可重複利用記憶體空間。

第四。記得先將最小、最先被計算的問題，心算出答案，儲存入表格，內建於程式碼之中。一道遞迴公式必須擁有初始值，才有辦法計算其他項。

第五。實作DP的程式時，會建立一個表格，在表格存入所有大小問題的答案。安排好每個問題的答案在表格的哪個位置，這樣計算時才能知道該在哪裡取值。

切勿存取超出表格的元素，產生溢位情形，導致答案算錯。計算過程當中，一旦某個問題的答案出錯，就會如骨牌效應般一個影響一個，造成很難除錯。

dynamic programming - counting / optimization

範例：樓梯路線（staircase walk），計數問題

一個方格棋盤，從左上角走到右下角，每次只能往右走一格或者往下走一格。請問有幾種走法？

對於任何一個方格來說，只可能「從上走來」或者「從左走來」，答案是兩者相加。

「從上走來」是一個規模更小的問題，「從左走來」是一個規模更小的問題，答案是兩者相加。

二維陣列的每一格對應每一個問題。設定第零行、第零列的答案，再以迴圈依序計算其餘答案。

時間複雜度分析：令H和W是棋盤長寬。計算一個問題需要O(1)時間（兩個子問題答案相加的時間）。總共HW個問題，所以計算所有問題需要O(HW)時間。

空間複雜度分析：總共HW個問題，所以需要O(HW)空間，簡單來說就是二維陣列啦！如果不需要儲存所有問題的答案，只想要得到其中一個特定問題的答案，那只需要一維陣列就夠了，也就是O(min(H,W))空間。

節省記憶體是動態規劃的重要課題！

如果只打算求出一個問題，那麼只需要儲存最近算出來的問題答案，讓計算過程可以順利進行就可以了。

兩條陣列輪替使用，就足夠儲存最近算出來的問題答案、避免f[i-1][j]超出陣列範圍。

事實上，一條陣列就夠了。也不能再少了。

如果某些格子上有障礙物呢？把此格設為零。

如果也可以往右下斜角走呢？添加來源f[i-1][j-1]。

如果可以往上下左右走呢？不斷繞圈子，永遠不會結束，走法無限多種。

UVa 10599 825 926

遞迴公式

若瞭解遞迴關係，就不必強記遞迴公式。若瞭解圖片意義，就不必強記數學符號。

f(i, j) =
 ⎧ 0                      , if i < 0 or j < 0     [exterior]
 ⎪ 1                      , if i = 0 or j = 0     [initial states]
 ⎨ f(i-1, j) + f(i, j-1)  , if i > 0 and i < 8    [computation]
 ⎪                          and j > 0 and j < 8
 ⎩ 0                      , if i >= 8 or j >= 8   [exterior]

f(i, j)：從格子 (0, 0) 走到格子 (i, j) 的走法數目。

遞歸方向

這個問題雙向都可以遞歸。對於任何一個方格來說，只可能「向右走出」或者「向下走出」。

範例：樓梯路線（staircase walk），極值問題

動態規劃的問題，可以分為「計數問題」和「極值問題」。方才介紹「計數問題」，現在介紹「極值問題」。

一個方格棋盤，格子擁有數字。從左上角走到右下角，每次只能往右走一格或者往下走一格。請問總和最小的走法？（或者總和最大的走法？）

想要印出路線，另外用一個陣列，記錄從哪走來。

額外介紹一個技巧。為了避免減一超出邊界，需要添補許多程式碼。整個棋盤往右下移動一格，就能精簡許多程式碼。

範例：樓梯路線（staircase walk），極值問題

節省記憶體是動態規劃當中重要的課題！

方才的分割方式：分割最後一步，窮舉最後一步從哪走來；方才的實作方式：由小到大的迴圈。問題答案f[i][j]，可以精簡成一維陣列。路線來源p[i][j]，無法精簡成一維陣列。

想讓路線來源精簡成一維陣列，必須採用另一種分割方式：從地圖中線分割，窮舉穿過中線的所有地點；同時採用另一種實作方式：由大到小的遞迴。

dynamic programming - state / DAG

state / DAG

以state和DAG的觀點，重新看待動態規劃。

動態規劃得類比成「狀態state」：「問題」變「狀態」，「全部問題」變「狀態空間」，「遞迴關係」變「狀態轉移函式」。

動態規劃得類比成「有向無環圖DAG」：既然遞迴關係不能循環，顯然就是DAG。「問題」變「點」，「遞迴關係」變「邊」，「計算順序」變「拓撲順序」。

即便讀者不懂state和DAG也沒關係，只要抓住兩個要點：每個小問題各是一個狀態，只有數值範圍不同；狀態之間是單行道，依序求解，不能循環。

範例：爬樓梯（climbing stairs）

f(n) =
 ⎧ f(n-1) + f(n-2)  , if n > 2
 ⎨ 2                , if n = 2
 ⎩ 1                , if n = 1

一維狀態。兩個子問題。

時間複雜度O(N)。空間複雜度O(1)。

範例：河內塔（tower of Hanoi）

f(n) =
 ⎰ f(n-1) + 1 + f(n-1)  , if n > 1
 ⎱ 1                    , if n = 1

除了子問題，還附帶其他成本。

時間複雜度O(N)。空間複雜度O(1)。

範例：樓梯路線（staircase walk）

f(h, w) =
 ⎰ f(h-1, w) + f(h, w-1)  , if h > 1 and w > 1
 ⎱ 1                      , if h = 1 or w = 1

二維狀態。兩個子問題。

時間複雜度O(HW)。空間複雜度O(HW)。

表格可以重複利用。空間複雜度降為O(W)甚至O(min(H,W))。

範例：組合（combination）

f(n, m) =
 ⎰ f(n-1, m-1) + f(n-1, m)  , if n > 1 and m > 1 and m < n
 ⎱ 1                        , if n = 1 or n = m

二維狀態。兩個子問題。

時間複雜度O(N²)。空間複雜度O(N²)。

組合數表格，即是巴斯卡三角形。巴斯卡三角形靠左對齊，視覺上就可以一一對應至表格。巴斯卡三角形左右對稱，對稱部分可以精簡。

🡲

表格可以只用一半。空間複雜度仍然相同。但是沒有意義。個人電腦記憶體充足，節省一半差別不大。

表格可以重複利用。空間複雜度降為O(N)。但是沒有意義。與其重複利用表格，不如直接使用公式解。

範例：矩陣相乘次序（matrix chain multiplication）

一連串矩陣相乘，無論從何處開始相乘，計算結果都一樣。

然而，計算時間卻有差異。兩個矩陣，大小為a x b及b x c，相乘需要O(abc)時間（當然還可以更快，但是此處不討論）。那麼一連串矩陣相乘，最少需要多少時間呢？

一連串矩陣，從最後一次相乘的地方分開，化作兩串矩陣相乘。考慮所有可能的分開方式。

f(i, k) =  min  { f(i, j) + f(j+1, k) + r[i] ⋅ c[j] ⋅ c[k] }
         j=i⋯k-1

f(i, k)：從第i個矩陣乘到第k個矩陣，最少的相乘次數。
r[i]：第i個矩陣的row數目。
c[i]：第i個矩陣的column數目。

時間複雜度O(N³)。空間複雜度O(N²)。

計算順序可以調整成online版本。

同類型的動態規劃問題（只是順手整理，不是本節重點）：

matrix chain multiplication
optimal binary search tree
Hu–Tucker compression
minimum weight triangulation of convex polygon
Cocke–Younger–Kasami algorithm

UVa 348 442

範例：longest increasing subsequence

一連串數字，從左到右挑選數字，越來越大。最多幾個？

一連串數字，保留開頭幾個數字，隔離最後一個數字，化作一小串數字與一個新數字。考慮所有可能的保留方式。

f(j) = max ( 1, max { f(i) + ( a[i] < a[j] ? 1 : -∞ ) } )
              i=0⋯j-1

f(j)：前j個數字可以挑出的數字數量，而且第j個數字被挑出。
a[j]：第j個數字。

遞迴公式內含判斷式：嘗試讓數字更大且更多。

正確答案必須搜尋表格：枚舉每個問題，其答案最大者。

時間複雜度O(N²)。空間複雜度O(N)。

同類型的動態規劃問題（只是順手整理，不是本節重點）：

longest increasing subsequence
longest common subsequence
longest palindromic subsequence

UVa 10900

設計狀態

設計狀態，目前沒有標準流程。變化多端、層出不窮。

正因如此，演算法競賽經常出現動態規劃問題，以便考驗選手思維。也因如此，選手經常探討如何設計狀態，以便應對各種動態規劃問題。關於設計狀態，也許大家可以請教競賽選手。競賽選手的網路文章、專家學者的學術論文，兩者相比，前者比較平易近人。

以下姑且提供一些個人經驗，即便我不擅長設計狀態。

設計狀態：狀態變數

簡易策略：所有未知變因，通通納入狀態變數。

一般來說，狀態變數越多，表格維度越大，計算時間越久。一般來說，狀態變數越少越好。

變數不一定是表面上看到的變因。例如「人潮最多的時段」，遞增的標的，是時刻，而不是訪客。

變數也有優先順序。例如「儲存座標」，變數有「點編號」和「座標軸編號」，優先順序導致表格造型改變、遞迴公式改變。

變數甚至可以是答案。答案納入狀態變數，等同於枚舉各種可能的答案。宛如試誤法。

變數甚至可以跟答案缺乏直接關聯。答案需要從表格抽取數字、重新計算而得。宛如預計算。

設計狀態：遞歸策略

變數減一。也可能減更多數值。

也可能需要枚舉許多個數值。

也可能需要複雜的公式。

也可能仰賴其他變數。

也可能包含判斷式。

dynamic programming - bitset

bitset

bitset是一個二進位數字，每一個bit分別代表每一件東西，1代表開啟，0代表關閉。例如現在有十個燈泡，編號設定為零到九，其中第零個、第三個、第九個燈泡是亮的，剩下來的燈泡是暗的。我們用一個10 bit的二進位數字1000001001，表示這十個燈泡的亮暗狀態。

建立一個大小為2¹⁰的陣列，便囊括了所有可能的狀態。陣列的每一格，就代表一種燈泡開關的狀態。

當狀態數量呈指數成長，可以利用bitset作為狀態。

UVa 10952

範例：maximum matching

以線相連的兩物，可以配對在一起。求最大配對數目暨配對方式。

「maximum matching」有多項式時間演算法，可是很難實作；動態規劃雖然慢了些，是指數時間演算法，但是容易實作。移除匹配成一對的點，就得到遞迴公式。

f(S+{i}+{j}) = max { f(S) + adj(i, j) }
              i,j∉S

f(S) = max { f(S-{i}-{j}) + adj(i, j) }
      i,j∈S

使用bitset，已匹配標成1，未匹配標成0。時間複雜度O(2ᴺ N²)，空間複雜度O(2ᴺ)。

這個演算法可以再修正，讓時間複雜度降為O(2ᴺ N)。各位可以試試看。

這個演算法需要大量記憶體，所以無法計算N很大的情況，何況編譯器也不准我們建立太大的陣列，N=28就是極限了。這個演算法同時也需要大量時間，以現在的個人電腦來說，N=17就已經要花上幾分鐘才能求出答案了。

UVa 10888 10911 11439 10296 11156

範例：Hamilton path

找到一條路徑，剛好每一個點都去過一次。有可能找不到。

「Hamilton path」尚無多項式時間演算法。直覺的解法是backtracking，窮舉所有點的各種排列方式，一種排列方式當作一條路徑，判斷是不是Hamilton path。

運用動態規劃，可以減少計算時間。拆掉一條路徑的最後一條邊，就得到遞迴公式。需要額外維度，記錄路徑終點。

f(S+{j}, j) = or { f(S, i) and adj(i, j) }   where j∉S
              i∈S

f(S, j) = or { f(S-{j}, i) and adj(i, j) }   where j∈S
          i∈S
          i≠j

時間複雜度O(2ᴺ N²)，空間複雜度O(2ᴺ)。

UVa 216 10068 10496 10818 10937 10944 10605 10890 265

範例：骨牌平舖（domino tiling）

中文網路稱作「插头DP」或「轮廓线DP」。

UVa 11741

範例：子集子集和（subset sum of subset）

英文網路稱作「sum over subsets DP」。

範例：不重複路線（self-avoiding walk），計數問題

先前介紹過樓梯路線（staircase walk）。樓梯路線問題，只能往兩個方向走，可以簡單的遞迴分割，得到多項式時間演算法。不重複路線問題，可以往四個方向走，無法簡單的遞迴分割，只有指數時間演算法。儘管如此，不重複路線還是可以使用動態規劃。

UVa 10572 10531

範例：不重複路線（self-avoiding walk），極值問題

極值問題反而存在多項式時間演算法！原問題化作圖：點有權重，邊無權重。原問題化作最短路徑：點權重挪至入邊權重。

請見本站文件「shorest path」。

dynamic programming speedup

極值問題有許多手法可以降低時間複雜度。根據recurrence的樣式，採取對應的手法。

詳細來說，一個問題（狀態）通常有許多個子問題。

計數問題：每一個子問題都納入統計。窮舉全部。

極值問題：找到最好的那一個子問題。挑選一個。

極值問題，只需要找到一個子問題，其答案最小（最大）。所有子問題，依照答案大小排序，就能快速找到那一個子問題，而不必逐一檢查。根據recurrence的樣式，採取對應的排序手法。

即時排序

詳細來說，極值問題當中，一個問題通常有許多個子問題（候選解），從中找到最好的那一個子問題（最佳解）。

正常做法：枚舉所有候選解，找出一個最佳解。

取巧做法：即時排序候選解，只枚舉一部分的候選解。

巧妙地安排計算順序，方便即時排序候選解。每個問題的候選解，彼此之間有關聯。下一個問題的候選解，繼承了上一個問題的候選解。不必重頭排序，只需微調順序。

候選解數值、候選解位置

詳細來說，即時排序的對象，可以分為兩種：候選解數值（樓梯路線的f陣列）、候選解位置（樓梯路線的p陣列）。

候選解數值：大家已經發現許多經典手法，例如stack/deque、envelope/convex hull、unimodal function、Monge matrix。

候選解位置：手法極少，例如Knuth–Yao speedup。

dynamic programming speedup - stack / deque

概論

F[n] = min/max { F[i] ⋅ W[i] + C[i] }
       i=0⋯n-1

F[n]是未知數，F[i] W[i] C[i]是已知數。計算到F[n]時，F[i]早已計算完畢，因此F[i]是已知數。

這種形式的recurrence，直接計算是O(N²)。此處介紹更快的演算法，降為O(N)。

stack

括號配對極值。stack保持嚴格遞增（嚴格遞減），即時移除多餘數值，即時獲取過往最大值（最小值）。

          for finding maximum,
          keep monotone increasing  ---->
      ┌──────┬──────┬──────┬─────────┬───────╯
stack │ M[2] │ M[4] │ M[6] │   ...   │ M[10]
      └──────┴──────┴──────┴─────────┴───────╮
                                      ^^^^^^^ extract maximum
               clean tails until monotonicity
               then push new M[i] into tail

M[i] = F[i] ⋅ W[i] + C[i]塞入尾端。塞入前，先彈出尾端數值們，使得M[i]塞入尾端之後，stack嚴格遞增。最大值從尾端取得。

範例：largest empty rectangle

詳見「largest empty rectangle」。

範例：all nearest smaller values

deque

滑動視窗極值。deque保持嚴格遞增（嚴格遞減），即時移除多餘數值，即時獲取過往最小值（最大值）。

           for finding minimum,
           keep monotone increasing  ---->
      ╰──────┬──────┬──────┬─────────┬───────╯
deque   M[2] │ M[4] │ M[6] │   ...   │ M[10]
      ╭──────┴──────┴──────┴─────────┴───────╮
       ^^^^^^                         ^^^^^^^
       extract minimum      clean tails until monotonicity
                            then push new M[i] into tail

M[i] = F[i] ⋅ W[i] + C[i]塞入尾端。塞入前，先彈出尾端數值們，使得M[i]塞入尾端之後，deque嚴格遞增。塞入後，再彈出頭端數值們，使得deque符合滑動視窗範圍。最小值從頭端取得。

中文網路稱作「单调队列优化」。

範例：maxium sum subarray

詳見「maxium sum subarray」。

範例：maximum average subarray

詳見「maxium average subarray」。

由於斜率是關鍵，因此中文網路稱作「斜率优化」。

dynamic programming speedup - envelope / convex hull

概論

F[n] = min/max { F[i] ⋅ W[n] + C[i] }
       i=0⋯n-1

W[i]換成W[n]。處理方式大幅改變。

這種形式的recurrence，直接計算是O(N²)。此處介紹更快的演算法，降為O(Nlog²N)。

先備知識是「convex hull」、「point-line duality」、「Fenchel duality」。

envelope

直線y = F[i] x + C[i]，鉛直線x = W[n]，交點Y軸座標F[n]。

最小（大）值對應最低（高）交點。

最小（大）值位於下（上）包絡線。

convex hull

如果討厭包絡線，可透過點線對偶，從包絡線變成凸包。

直線穿過點(F[i], -C[i])，斜率W[n]，Y軸截距-F[n]。

垂直方向翻轉，讓最小（大）值對應最低（高）截距。

直線穿過點(F[i], C[i])，斜率-W[n]，Y軸截距F[n]。

最小（大）值位於下（上）凸包的切線，跟Y軸的交點。

如果不熟悉點線對偶，可透過移項推導，得到相同結論：

概論

根據F[i]與W[n]的性質，時間複雜度隨之變化：

一、W[n]皆相同：不必維護凸包，只需維護每個點在「斜率-W[n]的直線的垂直方向上」的先後順序，彷彿先前章節「deque加速」。一個常見的例子是W[n] = 1。O(N)。

中文網路稱作「单调队列优化」。

二、F[i]與W[n]皆單調：Andrew's monotone chain維護下凸包（求最小值時）。切線斜率-W[n]遞減/增。直接從上次切點開始，往左/右找到新切點。O(N)。

由於斜率遞增，中文網路也將此手法稱作「斜率优化」。

三、F[i]單調：Andrew's monotone chain 維護下凸包（求最小值時）。切線斜率-W[n]會變。三分搜尋找到切點，或者二元搜尋凸包斜率找到切點。O(NlogN)。

中文網路稱作「WQS二分」。

四、無特別性質：動態凸包資料結構。O(Nlog²N)。

中文網路稱作「李超线段树」。

UVa 12524

範例：1D p-median problem

詳見「p-median problem」。

範例：bounded knapsack problem

詳見「bounded knapsack problem」。

dynamic programming speedup - unimodal function

概論

F[n] = min/max { M[i] }
       i=0⋯n-1

M[i] is monotone/unimodal

根據M[i]的性質，時間複雜度隨之變化：

一、F[n]的子問題們，其答案M[0]...M[n-1]恰好是單調函數：根本沒啥好算，最佳解顯然是第一個（最後一個）子問題。O(N)。

二、F[n]的子問題們，其答案M[0]...M[n-1]恰好是單峰函數：三分搜尋山峰，或者二元搜尋斜率。O(NlogN)。

三、每個問題的單峰函數，山峰位置恰好遞增（往右移動）：用同一條掃描線尋找山峰。O(N)。

概論

什麼時候會是單峰函數呢？舉兩個例子。

F[n] =  min  { max(F[i], G[i]) + 5 }
      i=0⋯n-1

(1) F[i] is increasing
(2) G[i] is decreasing
(=>) max(F[i], G[i]) + 5 is unimodal

F遞增、G遞減，則max(F[i], G[i]) + 5是單峰函數。不過這個例子有點蠢，山谷恰好永遠不動。

F[n] =  min  { F[i] + G[i] }
      i=0⋯n-1

(1) F[i] is convex
(2) G[i] is convex
(=>) F[i] + G[i] is convex (also unimodal)

F G皆是凸函數，則F[i] + G[i]是凸函數，即是單峰函數。不過這個例子也有點蠢，山谷恰好永遠不動。

範例：egg drop

一堆蛋，已知耐力皆相同，不知耐力為多少。試求耐力。

耐力是以樓層衡量：大於某樓層，摔下必破，無法重複使用；小於等於某樓層，摔下必不破，完全不會折損，可以重複使用。

這個問題有許多變形，此處討論實驗場地是n層樓的情況：

一、最少摔破幾顆蛋？需要事先準備幾顆蛋？

答：一顆蛋。從一樓開始摔，逐步上樓，直到摔破為止。

二、無限多蛋，運氣不好時，最少摔幾次？

答：二元搜尋。F[0] = 0, F[1] = 1, F[n] = F[ceil((n-1)/2)] + 1。

三、一顆蛋，運氣不好時，最少摔幾次？

答：n次。耐力不幸是n樓，從一樓開始摔，要摔n次。

四、兩顆蛋，運氣不好時，最少摔幾次？

答：首發選在i樓。如果摔破了，剩下一顆蛋，只好從一樓開始測試；最差的情況，耐力是i-1樓，要摔i-1次。如果沒有摔破，仍是兩顆蛋，問題仍相同，範圍縮小成n-i樓。兩種情況取最大值。窮舉i，找到次數最少者。

F[n] = 1 +  min  { max(i-1, F[n-i]) }
           i=1⋯n

F[n] = 1 +  min  { max(i, F[n-1-i]) }   調整索引值
          i=0⋯n-1

i遞增，F[n-1-i]遞減，因此max(i, F[n-1-i])是單峰函數，而且山谷持續往右移動，可以使用掃描線解決。另外也有數學公式解：

五、k顆蛋，運氣不好時，最少摔幾次？

答：留給讀者。

UVa 10934 882

範例：isotonic regression

英文網路稱作「slope trick」。

範例：word wrap

詳見「word wrap」。

dynamic programming speedup - Monge matrix

概論

F[n] = min/max { M[i][n] }
       i=0⋯n-1

M[i][n] is upper-triangular monotone/totally monotone/Monge

根據M[i][n]的性質，時間複雜度隨之變化：

一、M[i][n]是上三角monotone matrix：似乎沒有特別快的演算法，仍是O(N²)。

二、M[i][n]是上三角totally monotone matrix：兩個演算法，O(NlogN)與O(Nα(N))。此處只談第一個。

三、M[i][n]是上三角Monge matrix：至今仍然沒有專屬演算法。大家直接沿用totally monotone matrix的演算法。

三種矩陣皆細分成凹凸兩種情況。兩種情況的演算法稍微不同。此處均介紹。

三種矩陣當中，以Monge matrix最為常見。它也是性質最強的矩陣，若三成立則二成立，若二成立則一成立。

本文當中，「上三角Monge matrix」並非是「下三角恰為0的Monge matrix」，而是「僅上三角符合Monge matrix」。

Monge matrix的定義，在古代曾經稱作quadrangle inequality，導致中文網路稱作「四边形不等式优化」。

先備知識是「pairwise distance」。

概論

F[n] = min/max { F[i] ⋅ W[i] + C[i][n] }
       i=0⋯n-1

(1) C[i][n] is upper-triangular Monge
(=>) M[i][n] = F[i] ⋅ W[i] + C[i][n] is upper-triangular Monge

Monge matrix橫條加上同一數，仍是Monge matrix。藉由這個數學性質，我們得以處理這種形式的recurrence。

這種形式的recurrence，直接計算是 O(N²)。此處介紹更快的演算法，降為O(NlogN)。

convex totally monotone matrix

大意：直條最小值位置往上遞減。使用stack。

首先畫出C[i][n]，一個上三角矩陣。圖片省略了實際數值。

計算F[1]：F[0] ⋅ W[0]加到C[0][1]即得。

計算F[2]：F[0] ⋅ W[0]加到C[0][2]，F[1] ⋅ W[1]加到C[1][2]，取直條C[:][2]最小值。

以此類推。時間複雜度O(N²)。

重新反省計算過程，改良演算法：

一、算出F[i]之後，F[i] ⋅ W[i]加到對應的橫條，比較省事。

二、計算F[i]，即是取直條最小值。隨時記錄每個直條的最小值位置，每次F[i] ⋅ W[i]加到對應的橫條，順手更新最小值位置。

得到一個更容易解釋的演算法。時間複雜度仍是O(N²)。

凸全單調矩陣（直條版本），每個子矩陣都是凸單調矩陣，直條最小值位置總是往上遞減！

算出F[i]之後，從左往右更新最小值位置。最小值位置可能變i、可能不變。變與不變有著唯一一條分界線，左側一律變i，右側一律不變，以滿足遞減性質。

雖然可以提早break，但是時間複雜度仍是O(N²)。

位置相同者，合併成一個區間，最多N個區間。每當更新最小值位置，從左往右判斷每個區間的右端位置，直到遭遇不變的位置。然後二元搜尋該區間，找到分界線。

使用stack實作，一筆資料有兩個參數：區間右端的直條編號、最小值位置。每回合pop一些區間、做一次二元搜尋、push一個區間。時間複雜度O(NlogN)。

concave totally monotone matrix

大意：直條最小值位置往下遞增。使用deque。

改成從右往左更新最小值位置。時間複雜度O(NlogN)。

dynamic programming speedup - interval

概論

最佳解位置，恰好已排序。

每個問題，依照大小排序。最佳解位置，恰好也依照大小排序。

一個問題不必枚舉所有候選解。參考先前問題的最佳解位置，一個問題只需要枚舉一部分的候選解。

中文網路稱作「决策单调性」。

Knuth–Yao speedup

F[i,j] =  min  { F[i,k] + F[k+1,j] + C[i,j] }
        k=i⋯j-1

(1) C[i,j] is Monge*:  C[a,b] + C[a+1,b+1] ≤ C[a,b+1] + C[a+1,b]
(2) C[i,j] is sorted:  C[a,b] ≤ C[a,b+1] and C[a,b] ≤ C[a-1,b]
                       (C[a,b] ≤ C[c,d] when [a,b] ⊆ [c,d])
(=>) F[i,j] is Monge*
(=>) P[i,j] is sorted: P[a,b] ≤ P[a,b+1] and P[a,b] ≤ P[a+1,b]
                       (P[a,b-1] ≤ P[a,b] ≤ P[a+1,b])

*non-negative upper-trianglar concave Monge

(1) C[i,j] is Monge:   ↖ + ↘ ≤ ↗ + ↙       (concave)
(2) C[i,j] is sorted:  ← ≤ → and ↓ ≤ ↑     (toward ↗)
                       (←↙↓ ≤ →↗↑)
(=>) F[i,j] is Monge
(=>) P[i,j] is sorted: ← ≤ → and ↑ ≤ ↓     (toward ↘)
                       (↖ ≤ ↗ ≤ ↘)

這種形式的recurrence，直接計算是O(N³)。此處介紹更快的演算法，降為O(N²)。

附帶成本C[i,j]既是Monge matrix又是sorted matrix，導致最佳解數值F[i,j]是Monge matrix，也導致最佳解位置P[i,j]是sorted matrix。【待補證明】

一個問題的最佳解位置，範圍限縮。原本是a ≤ P[a,b] ≤ b，現在是P[a,b-1] ≤ P[a,b] ≤ P[a+1,b]。Monge matrix夾住左邊界，sorted matrix夾住右邊界。候選解變少，時間複雜度變低。

過程當中使用了Monge matrix，導致中文網路也將此手法稱作「四边形不等式优化」。

英文網路稱作「Knuth's optimization」。

範例：optimal binary search tree

N筆資料，欲建立成一棵「binary search tree」。並且預測了每筆資料的搜尋次數。

請問binary search tree是什麼形狀，才能讓拜訪到的節點數量最少呢？也就是說，每個節點的「深度」乘上「搜尋次數」，總和要最小。

遞迴公式類似於matrix chain multiplication，都是記錄區間。窮舉樹根，分割成左右兩棵子樹遞迴下去。問題總共O(N²)個，一個問題要窮舉O(N)種分割點，時間複雜度O(N³)。

由於第二層迴圈的c(i,k)維持定值，不會影響最大值的判斷結果，所以可以挪到迴圈外面，減少加法次數，減少執行時間。

總共O(N²)個問題，每個問題必須窮舉O(N)個分割點，時間複雜度O(N³)。

到這裡都和普通的dynamic programming沒兩樣。接下來要更進一步。

每次計算一個問題，總是得窮舉所有的分割點。然而有些分割點顯然是錯誤的，尤其是靠近區間邊界的那些分割點，實在不太可能將兩棵子樹分割的夠均勻、令總和最小。

相近的問題，其分割點也很相近。問題[a,b]，嘗試從從右端拿掉一筆資料，成為問題[a,b-1]。問題[a,b]、問題[a,b-1]的分割點很相近。

為了讓左右子樹均勻，[a,b]的分割點一定要大於等於[a,b-1]的分割點，才能降低總和。小於[a,b-1]的分割點，沒有窮舉的必要，樹只會越不平衡、總和只會更大不會更小！

問題[a+1,b]的情況也十分類似，不再贅述。

也就是說，問題[a,b]的分割點，必定位於更小的問題[a,b-1]和[a+1,b]的分割點之間。計算一個問題，大可不必窮舉所有的分割點。

觀察分割點表格，[a,b-1]是左方格子，[a+1,b]是下方格子。要計算一個分割點，窮舉範圍就是左方格子的值到下方格子的值。也就是說每一個格子都會大於等於左方格子、小於等於下方格子。

每一條左上右下斜線，左上最小值是0，右下最大值是N-1，每一條斜線最多窮舉2N = O(N)個分割點。

除了初始值之外，總共N-1條斜線，需要窮舉的分割點總共O(N²)個，所以時間複雜度降為O(N²)。

UVa 10304 10003 12057 12809

Hu–Shing speedup

F[i,j] =  min  { F[i,k] + F[k+1,j] + C[i,j,k] }
        k=i⋯j-1

這種形式的recurrence，直接計算是O(N³)。此處介紹更快的演算法，降為O(NlogN)。

範例：matrix chain multiplication

我沒有研究。論文上百頁，我不想讀。

【尚無正式名稱】

F[i][j] =  min  { F[i-1][k-1] + C[k,j] }
          k=1⋯j

(1) C[i,j] is Monge: C[a,b] + C[a+1,b+1] ≤ C[a,b+1] + C[a+1,b]
(=>) P[i][j] is row-sorted: P[i,j] ≤ P[i,j+1]

(2) C(|i-j|) is convex
(=>) F[i][j] is row-sorted
(=>) F[i-1][k-1] + C[k,j] is unimodal

這種形式的recurrence，直接計算是O(NM²)。此處介紹更快的演算法，降為O(NM)。

一、附帶成本C[i,j]恰是Monge matrix，導致最佳解位置P[i][j]是row-sorted matrix。【尚待確認】

一個問題的最佳解位置，範圍限縮。Monge matrix夾住左邊界。因為沒有夾住右邊界，所以用二分法處理右邊界。O(NMlogM)。

英文網路稱作「divide-and-conquer optimization」。

二、附帶成本C(|i - j|)恰是convex function，再導致最佳解數值F[i][j]是row-sorted matrix，也導致候選解數值F[i][k] + C[k,j]是unimodal function。【尚待確認】

一個問題的最佳解位置，範圍限縮。Monge matrix夾住左邊界。convex function夾住右邊界。O(NM)。

三、不管C[i,j]是什麼了。先前章節「convex hull加速」實施N次。W[n] = 1，彷彿「deque加速」。O(NM)。

範例：1D p-center problem

詳見「p-center problem」。

參考文獻

[envelope/convex hull] [unimodal function]
using geometric techniques to improve dynamic programming algorithms for the economic lot-sizing problem and extensions

[Monge matrix]
dynamic programming with convexity, concavity and sparsity
an almost linear time algorithm for generalized matrix searching

[Knuth–Yao speedup]
optimum binary search trees
efficient dynamic programming using quadrangle inequalities

[Hu–Shing speedup]
computation of matrix chain products, part I, part II
revisiting “computation of matrix chain products”