sweep line

sweep line

「掃描線」是計算幾何領域的基礎手法,可以用來解決許多計算幾何的問題,有如圖論中的BFS與DFS一樣經典。它並不是一個物品,而是一個概念。

平移的掃描線

一條(或兩條)無限長平行線,沿其垂直方向不斷移動,從畫面一端移動到另一端,只在頂點處停留。

實作時,通常是先按座標大小排序所有頂點,然後以兩索引值,記錄平行線的位置在哪個頂點上面。兩條平行線,一條為主,穿越整個畫面;一條為輔,跟著主線的狀況進行平移。這是陰陽的道理。

後面章節closest pair,將實際示範掃描線的實作方式。

UVa 920 972

旋轉的掃描線

一條(或兩條)從原點射出的射線,做360°旋轉,只在頂點處停留。

實作時,通常是先按極角大小排序所有頂點,然後以兩索引值,記錄射線的位置在哪個頂點上面。兩條射線,一條為主,轉過整個畫面;一條為輔,跟著主線的狀況進行平移。這是陰陽的道理。

UVa 270 10691 10927 11529 11696 11704 ICPC 3259 4064

sweep line的基本精神

說穿了,掃描線的基本精神就是:先排序、再搜尋。

計算幾何當中,有一個重要的特性是「區域性」。比如說,距離相近的點,總是群聚在一起;距離相遠的點,總是被距離相近的點隔開。

排序的目的,就是建立「區域性」,使得搜尋的條件更精確,搜尋的速度更快。

觀察問題是否有「不重疊」、「不相交」、「間隔」、「相聚」之類的性質,然後以掃描線進行掃描。或者換句話說,排序所有的頂點,進行搜尋。

平移的掃描線:座標排序

旋轉的掃描線:極角排序

rotating caliper

rotating caliper

「旋轉卡尺」也是計算幾何領域的基礎手法,它並不是一個物品,而是一個概念。

平面上的圖形,做360°旋轉;以兩條垂直線,隨時從左右夾緊圖形,找到極端頂點。

切換視點,就變成:兩條無限長平行線,做360°旋轉,嘗試夾緊平面上的圖形,找到極端頂點。

實作時,通常是以兩索引值,記錄平行線的位置在哪個頂點上面。兩條平行線,一條為主,轉過整個畫面;一條為輔,跟著主線的狀況進行鬆緊。這是陰陽的道理。

實作時,只需轉180°即可。轉半圈,兩條平行線對調,效果同360°。

後面章節farthest pair,將實際示範旋轉卡尺的實作方式。

UVa 303 10173 10416 11243

rotating caliper的基本精神

說穿了,旋轉卡尺的基本精神就是:窮舉斜率,判斷目標對象有多斜。

旋轉卡尺:凸包

使用旋轉卡尺夾住圖形,卡尺夾不進的地方,剛好是該圖形的凸包。旋轉卡尺夾到的頂點順序,就是凸包的頂點順序。因此,旋轉卡尺適合用於凸包、凸多邊形的相關問題。

尚未學過凸包的讀者,請見本站文件「convex hull」。

closest pair

closest pair

一群點當中,距離最近的兩個點叫作「最近點對」。

演算法(enumeration)

窮舉法,時間複雜度O(N²),可以找出所有的最近點對。

實作時,減少sqrt函式的呼叫次數,盡量記錄距離的平方,可以減少計算時間。

演算法(sweep line)

預先按照水平座標排序,再以水平距離裁減搜尋範圍。

一、先排序所有點,以X座標為主,Y座標無所謂。
二、從左往右掃,依序窮舉各點作為左端點。
 甲、從左端點開始往右掃,依序窮舉各點作為右端點。
 乙、若左右兩點距離差太遠、超過目前發現的最近點對距離,
   就可以停止窮舉右端點。

也可以先窮舉右端點、再窮舉左端點。下個段落會用到。

最差情況是所有點都在同一條垂直線上,將會窮舉到所有點對,完全無法裁減搜尋範圍。儘管時間複雜度仍是O(N²),但是實際效率極佳。我不清楚平均時間複雜度是多少。

實作時,避免直接排序原資料,複製一份指標或索引值來排序,可以減少計算時間。

UVa 10245 10750 11378 ICPC 6666

演算法(sweep line)

要避免最差情況,有個想法是:再將所有點依照垂直方向排序。如此一來,時間複雜度降低為O(NlogN)。

一、位於右端點左方、距離d以下的點,才有可能形成最近點對。也就是以右端點為圓心、左半圓涵蓋的點(包含邊界)。照理來說,我們只需要檢查半圓範圍裡面的點。

運用左掃描線作為輔助,跟隨右掃描線亦步亦趨,我們得以輕易的過濾出水平距離d以下的點,但是無法進一步過濾出半徑距離d以下的點。

折衷的方式是依照Y座標排序水平距離d以下的點,然後運用二元搜尋法找到右端點,然後找到Y座標比右端點稍大、稍小的點──這些點很可能就在半圓之內。

二、右端點左方的點,兩兩之間的距離,至少是d。

點與點之間無法太過密集擁擠,能夠組成最近點對的左端點並不多。其實只需檢查右端點的前兩點、後兩點,作為左端點,就能囊括所有最近點對!

最極端的情況,是以右端點為中心、左半正方形涵蓋的點(包含邊界)。

由於右掃描線不斷往右移動,水平距離d以下的點必須不斷重新排序,很花時間。運用binary tree資料結構,即可隨時保持排序,節省時間。

一、預先排序所有點,X座標為主,Y座標為輔。
二、建立一棵平衡二元樹(AVL tree),
  儲存右端點的左方、水平距離小於等於d的點。
  二元樹排序以Y座標為主,X座標為輔。一開始是空的。
  d是當下的最近點對距離。一開始是無限大。
三、右掃描線依序窮舉各點作為右端點。
 甲、二元樹刪除與右端點水平距離大於d的點們。
   (左掃描線視情況往右移動。)
 乙、二元樹加入右端點。
 丙、二元樹尋找右端點的前兩點與後兩點,嘗試更新最近點對。

掃描線輔以資料結構,是計算幾何的經典手法,請讀者牢記在心。

時間複雜度。排序O(NlogN)。掃描線O(N)。二元樹總共刪除N個點、加入N個點、尋找5N個點,O(NlogN)。

【待補程式碼】

演算法(divide-and-conquer method)

時間複雜度O(NlogN),可以找出所有的最近點對。原理是把平面切割成左右兩側,答案分為「最近點對在左側」、「最近點對在右側」、「最近點對橫跨兩側」三種情形。先將左側與右側分別遞迴求解之後,再利用左側與右側的答案,快速算出橫跨兩側的答案。

preprocessing:
一、排序所有點,以X座標為主,Y座標無所謂。O(NlogN)
二、檢查是否有共點。如果有,就找出所有共點,演算法結束。O(N)

divide:
把所有點分為左右兩側,左側、右側的點數盡量一樣多。

conquer:
左側、右側分別遞迴求解。

combine:
一、利用左側、右側的最佳解d,求出橫跨兩側的解:
 甲、首先找出靠近中線的點,水平距離小於d、包含d。O(N)
   (小於d、不包含d,則只找出其中一組最近點對。)
 乙、排序這些點,Y座標為主,X座標為輔。O(NlogN)
 丙、每一個點都找其上方鄰近的點,看看能不能形成最近點對。
   只需檢查至後三點。O(N⋅3) = O(N)
二、答案為左側、右側、橫跨兩側,三者當中的最佳解。

以下提供釋例。畫面上有一些點。

把點分為左側與右側,點數盡量一樣多。左側與右側的交界處可能會銜接,也可能不會銜接。左右兩側通常是不一樣寬的。

左側、右側分別遞迴求解,最後求得這兩種情況下的最近點對。最近點對的距離為d。

左側的每一個點,半徑d以內的範圍(不包含邊界),不會有其他左側的點存在,只可能出現另一側的點。右側亦然。

要找出橫跨兩側的點對,可以從左側的右邊線,往左距離d以內的範圍裡(包含邊界)的這些點,有可能與右側的點形成最近點對。

也可以以右側的左邊線為主。

從左側的右邊線,往右距離d以內的範圍裡的這些點,則是可能的另一頭端點的範圍。

要找出橫跨兩側的最近點對,只要依序窮舉左側右邊界距離d以內、位於左側的點,作為左端點;再找左側右邊界距離d以內、位於右側的點,作為右端點。

從這裡開始衍生兩種實作方式:

一、最容易理解的方式,是從下往上掃描左端點;針對每個左端點,找到合適的右端點。右側之中,點與點之間的距離至少是d。運用先前的分析手法,我們只需檢查掃描線的中下兩點、上兩點,作為右端點,就能囊括所有橫跨兩側的最近點對。

此處省略分析過程,讀者可以自行畫圖觀察。

實作時,運用右側掃描線作為輔助,跟隨左側掃描線亦步亦趨,就能快速找到中下兩點、上兩點,而不必使用二元搜尋法。

二、另一個難以理解、但是容易實作的方式,是把範圍內的這些點全部混在一起,不分左右,然後從下往上掃描。先窮舉下端點,再尋找上方鄰近的點作為上端點,檢查是否形成最近點對。

最多只需要檢查下端點的後四點,就一定囊括所有橫跨兩側的最近點對。

此處省略分析過程,讀者可以自行畫圖觀察。蠻複雜的喔!可以先將左側、右側的分布情形分開畫好,再將左右兩側拼在一起。

更進一步。第四點一定與同側的另外一點形成最近點對,之後還是能檢查到,所以不必檢查第四點、只需要檢查後三點。

以上圖例都是掃描線掃中左側的點,讀者可以自行分析掃描線掃中右側的點的所有情況。大功告成。

教科書通常只談到後五點;此處深入分析,從後五點逼近至後三點。儘管推理過程讓人感覺很有學問,但是執行時間遠遠高於窮舉法。這種鑽牛角尖又不切實際的學問,不如不學。

時間複雜度O(NlogN + Nlog(N/2) + Nlog(N/4) + ...) = O(NlogN)。

farthest pair

farthest pair

一群點當中,距離最遠的兩個點叫作「最遠點對」。

窮舉法,時間複雜度O(N²),可以找出所有的最遠點對。

旋轉卡尺,時間複雜度O(NlogN),可以找出所有的最遠點對。

距離變遠

距離變遠,就是擴張。無論是擴張兩點連線,或者是擴張邊界,距離都是變遠。

要找最遠點對,可以使用擴張邊界的概念。擴張邊界直到極限,碰觸到最偏遠的點,最後形成凸包。

因此,最遠點對一定是凸包的對角線。就如同日常生活中,邊邊角角的寬度是最寬的、最容易卡到。

凸多邊形範圍內,最遠的距離是對角線距離。

也許方才的論述太過抽象、不夠嚴謹。來詳細推敲一番吧!此處改用擴張兩點連線的概念。

凸多邊形範圍內任一線段,必定短於、等長於某一條對角線:

一、凸多邊形範圍內,任取兩點。

二、延長兩點連線,直到邊界。

三、挪動一點至頂點,盡可能遠離垂足。

四、挪動另一點至頂點,同上。

藉由此性質,以旋轉卡尺,窮舉最長對角線的斜率,量測最長對角線的長度,就能輕鬆找到最遠點對。

凸多邊形的最長對角線們,斜率皆不同。

同一個斜率,如果有兩條以上的最長對角線,就會產生矛盾──以兩條最長對角線描出平行四邊形,可以發現平行四邊形的對角線更長。凸多邊形範圍內一定可以順利描出平行四邊形,請參考凸的定義。

凸多邊形範圍內,同一個斜率,最多只有一條最長對角線。因此,同一個斜率,旋轉卡尺只能夾到一條最長對角線。

凸多邊形的最長對角線數目,不超過頂點數目。

平面上N個點,其凸包最多有N個頂點。隨著卡尺旋轉,每一個頂點,都可能作為下一條最長對角線的端點,可以推理出凸包最多有N條最長對角線,此時形成奇數個頂點的正多角星。

平面上N個點的最遠點對,最多只有N組。

演算法

一、求凸包,過濾出可能是最遠點對的點。O(NlogN)
二、旋轉卡尺,找出最長對角線,即是最遠點對。O(N)

實作旋轉卡尺,習慣用兩個指標記錄旋轉卡尺當前夾到的點。求出凸包之後,首先將兩個指標設定在凸包的最左最下點、最右最上點。要決定旋轉卡尺接下來夾住的點,就觀察夾角:夾角較小者,挪往下一點;夾角一樣者,同時挪往下一點(亦得擇一挪往下一點)。

除了觀察夾角之外,也可以觀察距離。要決定旋轉卡尺接下來夾住的點,就觀察點到直線距離:以另一邊的指標及其下一點作為直線,觀察指標及其下一點分別到直線的距離:距離變長者,挪往下一點;距離一樣者,同時挪往下一點(亦得擇一挪往下一點)。

上述兩種判斷方式都很麻煩,其實只需要一次叉積即可判斷,讀者可以動動腦想想看,謎底於程式碼揭曉。

迴圈部分亦可採一主一副的形式:每窮舉一個頂點,就立即找出對頂的點。

luogu P6247

segment intersection

判斷線段們是否相交

窮舉法,時間複雜度O(N²)。

平移的掃描線,時間複雜度O(NlogN)。

隨著掃描線移動,線段增增減減。如果線段沒有相交,線段的上下順序是固定的。如果線段相交,那就一定是上下相鄰的線段相交了。

每當線段增增減減,當下就可以檢查上下相鄰的線段是否相交。使用二元搜尋樹紀錄線段,快速找出上下相鄰的線段。

一、排序所有端點:
 甲、X座標,從小到大。
 乙、Y座標,從小到大。
 丙、左端點先於右端點。
   (垂直線段,以下端點為左端點,以上端點為右端點。)
 丁、下端點先於上端點。
二、從左往右掃描端點:
 甲、若為左端點,把線段塞入二元搜尋樹。
   判斷此線段、上一條線段是否相交。
   判斷此線段、下一條線段是否相交。
 乙、若為右端點,從二元搜尋樹取出線段。
   判斷上一條、下一條線段是否相交。

由於set不像vector一樣會自行搬動記憶體位址,所以可以將插入時的iterator記錄起來,稍後刪除時就能直接取用iterator,省下一次搜尋。

ICPC 8050

找出線段們所有交點

窮舉法,時間複雜度O(N²),可以求出所有交點。

平移的掃描線,時間複雜度O((N+K)logN),可以求出所有交點。K是交點個數,頂多C(N,2)個。

一、建立priority queue,排序所有端點:
 甲、X座標,從小到大。
 乙、Y座標,從小到大。
 丙、左端點先於右端點。
   (垂直線段,以下端點為左端點,以上端點為右端點。)
 丁、下端點先於上端點。
二、從左往右掃描端點暨交點:
 甲、若為左端點,把線段放入二元搜尋樹。
   計算此線段、上一條線段的交點,交點塞入priority queue。
   計算此線段、下一條線段的交點,交點塞入priority queue。
 乙、若為右端點,從二元搜尋樹取出線段。
   計算上一條、下一條線段的交點,交點塞入priority queue。
 丙、若為交點,顛倒所屬線段在二元搜尋樹當中的順序。
 回、甲乙丙都要小心處理多線共點的情況。

每次求得的交點,一定出現在目前的掃描線右側,所以不必擔心掃描線已經錯過了交點。

point–line duality

point–line duality

二維平面上的點和線,可以等價地轉換成線和點。轉換方式有許多種,此處採用第一種:斜率與截距。

一、點 (a,b) 轉換成直線 y = ax - b
  直線 y = ax - b 轉換成點 (a,b)
二、點 (a,b) 轉換成直線 ax + by = 1
  直線 ax + by = 1 轉換成點 (a,b)
三、點變直線:穿過該點的直線,法向量是(a,b)。
  直線變點:原點O投影到直線之後的座標。

一群點=一群線。兩點連線=兩線交點。多點共線=多線共點。

convex hull與envelope互為點線對偶

一群點的上凸包與下凸包=一群直線的下包絡線與上包絡線。

求凸包、求包絡線(半平面交集),同樣困難,複雜度相同。

UVa 11756

sweep line與rotating caliper互為點線對偶

旋轉卡尺夾住凸包=平移的掃描線經過包絡線。

平移的掃描線能解決的問題,旋轉卡尺也能解決。反之亦然。

minimum area triangle

minimum area triangle

二維平面一群點,挑三點作為三角形頂點,令面積最小。

枚舉第一第二頂點形成底線,平行挪動底線以找到第三頂點形成高峰。點線對偶,底線變成交點,平行挪動底線變成鉛直挪動交點(斜率相同變成X座標相同),高峰變成鉛直距離最近的線。

線段相交演算法,枚舉所有交點的上與下鉛直距離。交點數量K = C(N,2),時間複雜度O(N²logN)。

據說改用「arrangement」,時間複雜度降為O(N²)。

maximum area triangle

maximum area triangle

二維平面一群點,挑三點作為三角形頂點,令面積最大。

正解位於凸包頂點。固定第一頂點,枚舉第二頂點形成底線,枚舉第三頂點形成高峰。旋轉卡尺夾住底線與高峰,時間複雜度O(N)。每種第一頂點各自做一次旋轉卡尺,總時間複雜度O(N²)。

使用點線對偶似乎沒有任何好處。