function - 演算法筆記

linear function

「線性函數」。加權總和函數。

f(x₁, x₂, ..., xₙ) = w₁ x₁ + w₂ x₂ + ... + wₙ xₙ

線性函數是計算機科學經常使用的函數，熱門程度遠勝二元樹。現實世界相當複雜，經常出現難以計算的事物，此時工程師就會將事情簡化為線性函數。線性函數擁有強悍的數學性質和演算法，儘管艱深晦澀，但是質樸實用。

詳情請見本站文件「linear function」。

stochastic function

「隨機函數」。輸入是浮動數字。輸出顯然也是浮動數字。

f(X, Y, Z) = a X + Y Z     where X, Y, Z are random variable

古代數學家沒有仔細區分「浮動：有規矩」和「隨機：無規矩」的差別，把兩者都命名為隨機，混淆視聽。大家搞不清楚狀況的情況下，stochastic function跟random function被當作相同。

random function

「隨機函數」。輸入輸出隨機對應的函數。

隨機函數的輸入輸出，可以是連續數字、也可以是離散數字。

電腦做運算，數值皆離散。我們只能處理離散數字。

初次建立隨機函數，對應方式是隨機的；每次使用隨機函數，對應方式是固定的。

如果對應方式每次都是隨機的，那麼其實就是隨機數了。

隨機函數是計算機科學的核心思想之一，經典程度堪比二元樹。例如稍後提到的hash function，其中一種變種就是均勻隨機函數，可以使用在伺服器負載平衡、網路資料庫存取。

random permutation

「隨機排列」。一對一隨機函數。

利用下個小節的演算法，來製造隨機排列。

隨機排列是計算機科學的核心思想之一，經典程度堪比二元樹。隨機排列是加密演算法的基礎，加密演算法是網路傳輸的基礎，網路傳輸是上網閱讀文章、觀看影片的基礎。

random permutation（random shuffle）

方才是函數，此處是數列。

「隨機排列」或「隨機混洗」。兩種解讀方式：

一、所有排列挑出一種排列。機率都一樣。

二、一群數字不按順序排好、打亂順序。排序的相反。

隨機排列可以用於製造隨機輸入，用來測試程式是否穩健。隨機排列也可以用來製作視覺特效。

演算法是Fisher–Yates shuffle：跟後方任意數字交換、或者不交換。時間複雜度O(N)。

可以直接使用C++標準函式庫的shuffle()。

random k-combination（simple random sampling）

「隨機k組合」或「簡單隨機抽樣」。兩種解讀方式：

一、所有組合挑出一種組合，其大小為k。機率都一樣。

二、一群數字打亂順序，然後挑出前k個數字。

演算法是reservoir sampling：依序讀取數字，取代當下組合的任意數字，或者不取代。online演算法，當下組合是當下答案。時間複雜度O(N)。

改良版本是Li's algorithm：跳躍讀取數字，節省時間。背後原理是幾何分布。時間複雜度O(K + Klog(N/K))，到達理論下限。

可以直接使用C++標準函式庫的sample()。

hash function

「雜湊函數」。限制輸出範圍的函數。

雜湊函數有著形形色色的變種：限寬、均勻、保距、量化、混亂、單向、編碼。大家視情況需要，混用多個變種。

hash是一種菜式：肉、馬鈴薯、蔬菜，剁碎攪拌成為餡泥，然後烤炸。hash具有諸多意涵：均勻隨機、範圍壓縮、型態變化。

1. hash function

限寬。限制輸出範圍。簡易方式是mod運算。

用途是縮減數字範圍。

2. uniform hash function

均勻。輸出數字使用機率均等。簡易方式是mod最大公因數。

用途是均勻分散儲存。知名應用是hash table。

3. isometric mapping / locality-sensitive hashing

保距。所有數對，變換前的差異，大致等於變換後的差異。簡易方式是線性變換。

同樣道理，還可以發明保長、保角、保秩、保序等變種。

用途是以雜湊值估計相似度。

4. quantization / projection

量化。刪除數字的細節，降低精確度。簡易方式是floor運算。

用途是簡化數字。知名演算法是PCA、KNN。

5. random hash function

混亂。輸出是固定的隨機數。簡易方式是以輸入數字生成隨機數、隨機排列。

6. one-way hash function

單向。難以從輸出推算輸入。簡易方式是餘數連乘、三角函數。

用途是密碼、摘要、簽章，讓外人難以偽造變換前的原始資料。知名演算法如SHA-2、MD5。

請見本站文件「encryption」。

7. coding / indexing

編碼。輸入不是數字，而是其他元件，例如字串。簡易方式是先化作多項式、再化作數字。

用途是建立索引表，知名演算法如murmur、xxHash。

請見本站文件「string」。

conditional function

comparison function【尚無正式名稱】

「比較函數」。比較兩個元件。輸出是布林數。

例如實數運算之大於、小於、等於。

less-than function
f(x, y) = ⎰ true,   if x < y
          ⎱ false,  otherwise

例如集合運算之屬於、等於。

element-of function
f(x, A) = ⎰ true,   if x ∈ A
          ⎱ false,  otherwise

Iverson function

「艾佛森函數」。布林數轉成實數。輸入是布林數。

另有數學符號Iverson bracket，可以縮短數學式子。

Iversion function
f(x) = ⎰ 1,  if x is true     f(x) = [x]
       ⎱ 0,  otherwise

(conditional equation)        (Iverson bracket)

conditional function【尚無正式名稱】

「條件函數」。函數內含比較函數與艾佛森函數。

條件函數主要用來設計計算流程，尤其是程式語言與演算法。不僅是計算機科學，各種科學、各種工程都會偶爾使用它們。

indicator function
I_A(x) = ⎰ 1,  x ∈ A             I(x; A) = [x ∈ A]
       ⎱ 0,  otherwise

Kronecker delta function
δ(x; y) = ⎰ 1,  x = y           δ(x; y) = [x = y]
          ⎱ 0,  otherwise

threshold function
thr(x; y) = ⎰ 1,  x ≥ y         thr(x; y) = [x ≥ y]
            ⎱ 0,  otherwise

sign function
sgn(x) = ⎧ -1,  x < 0
         ⎨  0,  x = 0
         ⎩  1,  x > 0

absolute value function
abs(x) = ⎰ -x,  x < 0
         ⎱  x,  x ≥ 0

minimum function
min(x, y) = ⎰ x,  x < y
            ⎱ y,  otherwise

clamp function
clamp(x; [a, b]) = ⎧ a, x < a
                   ⎨ x, x ≥ a and x < b
                   ⎩ b, x ≥ b

稍微講解一下本文收錄的條件函數。

indicator function
指示函數：判斷元素是否存在。常見於數學。

Kronecker delta function
單位脈衝函數：一瞬間短暫的1。常見於數學、訊號處理。

threshold function
臨界值函數：判斷是否超過臨界值。常見於程式語言、訊號處理。

sign function
正負號函數：取得數值的正負號部分。常見於程式語言。

absolute value function
絕對值函數：取得數值的數字部分。常見於數學、程式語言。

minimum function
最小值函數：取得較小的數值。常見於數學、程式語言。

clamp function
鉗函數：取得範圍內的數值。常見於程式語言。

稍微實作一下本文收錄的條件函數。

順帶一提，分支的執行時間遠大於整數運算與布林數運算的執行時間。大家想方設法避開分支，改成整數運算、位元運算、組合語言指令。不過這不是本文主旨。

C++標準函式庫已經收錄絕大部分函數，已經想方設法降低執行時間。前人種樹後人乘涼，大可不必自己實作。

smooth function

「不連續函數discontinuous function」。函數曲線上下斷開。

函數曲線不連續的地方，有兩種繪圖方式。嚴謹的方式是空心圓形和實心圓形，簡易的方式是鉛直線。

「連續函數continuous function」。處處緊密銜接。

左鄰居函數值、右鄰居函數值，兩者趨近相同。

「可微函數differentiable function」。處處可以微分。

左鄰居導數值、右鄰居導數值，兩者趨近相同。

「k階可微函數Cᵏ function」。處處可以微分k次。

「平滑函數smooth function」。處處可以微分無限多次。

例如多項式函數（零函數、常數函數、一次函數、二次函數）、指數函數（自然指數函數）、弦型函數（正弦函數、餘弦函數）。

[polynomial function]
zero function                 f(x) = 0
constant function             f(x) = c
linear function               f(x) = ax + b
quadratic function            f(x) = ax² + bx + c

[exponential function]
natural exponential function  f(x) = exp(x)

[sinusoid function]
sine function                 f(x) = sin(x)
cosine function               f(x) = cos(x)

「平滑性smoothness」。函數的平滑程度。微積分是基本的函數運算。數學家利用微積分來描述平滑。數學家根據微分次數來區分平滑程度。

differentiable | name        | name
---------------+-------------+------------------------
for ≥ 0 times  | C⁰ function | continuous function
for ≥ 1 times  | C¹ function | differentiable function
:              | :           | :
for ∞ times    | C^∞ function | smooth function

可微次數　　　　　　丨名稱　　　　　丨簡易名稱
一一一一一一一一一一十一一一一一一一十一一一一
處處可以微分０次以上丨零階可微函數　丨連續函數
處處可以微分１次以上丨一階可微函數　丨可微函數
　　　　：　　　　　丨　　　：　　　丨　：　　
處處可以微分無窮次　丨無窮階可微函數丨平滑函數

目前沒有詞彙可以表達「k次以下」和「恰好k次」。大家不得已沿用Cᵏ。例如Cᵏ function是「k次以上、至少k次」，Cᵏ continuity at a point是「k次以下、至多k次」，成為歷史共業。

根據微分次數，無法辨別不連續函數，成為歷史共業。

piecewise function

「分段函數」。許多段平滑函數，拼成一個函數。

分段函數主要用來設計外觀造型。不僅是計算機科學，各種科學、各種工程都會經常使用它們。

介紹三個分段函數。微分與積分恰巧得到彼此。

Dirac delta function
f(x) = ⎰ 1,  x = 0      f(x) = [x = 0]
       ⎱ 0,  x ≠ 0

Heavide step function
f(x) = ⎰ 0,  x < 0      f(x) = [x ≥ 0]
       ⎱ 1,  x ≥ 0

rectifier activation function (ReLU)
f(x) = ⎰ 0,  x < 0      f(x) = x [x ≥ 0]
       ⎱ x,  x ≥ 0

再介紹三個分段函數。

ramp function
f(x) = ⎧ 0,  x < 0
       ⎨ x,  x ≥ 0 and x < 1
       ⎩ 1,  x ≥ 1

rectangular function
f(x) = ⎧ 0,  x < 0
       ⎨ 1,  x ≥ 0 and x < 1
       ⎩ 0,  x ≥ 1

triangular function
f(x) = ⎧ 0,      x < -1
       ⎨ 1 + x,  x ≥ -1 and x < 0
       ⎪ 1 - x,  x ≥ 0 and x < 1
       ⎩ 0,      x ≥ 1

smooth approximation

「平滑近似」。分段函數，刻意改成平滑函數。

脈衝、步階、啟動的平滑近似。種類豐富，任君挑選。

自行調整x值範圍、y值範圍，以便符合分段函數曲線形狀。

[smoothed Dirac delta function]

Gaussian function
f(x) = exp(-x²)
  ↓
f(x) = exp(-(kx)²)

bump function
f(x) = ⎰ exp(-1/(1-x²)),  -1 < x < 1
       ⎱ 0,               otherwise
  ↓
f(x) = ⎰ exp(-1/(1-(kx)²)) / exp(-1),  -1 < kx < 1
       ⎱ 0,                            otherwise

[smoothed Heaviside step function] [sigmoid]

logistic function
f(x) = 1 / (1 + exp(-x))
  ↓
f(x) = 1 / (1 + exp(-kx))

hyperbolic tangent function (tanh)
f(x) = tanh(x)
  ↓
f(x) = (tanh(kx) + 1) / 2

[smoothed rectifier activation function]

softplus
f(x) = log(1 + exp(x))
  ↓ 
f(x) = log(1 + exp(kx)) / k

最大值函數、箝函數的平滑近似。種類豐富，任君挑選。

[smoothed maximum function]

https://en.wikipedia.org/wiki/Smooth_maximum

smooth maximum
f(x, y) = x + y - sqrt((x - y)² + ε)

LogSumExp
f(x, y) = log(exp(x) + exp(y))

[smoothed clamp function]

smoothstep
f(x) = ⎧ 0,          x < 0
       ⎨ 3x² - 2x³,  x ≥ 0 and x < 1
       ⎩ 1,          x ≥ 1

cosine function
f(x) = ⎧ 0,                  x < 0
       ⎨ 0.5 - 0.5 cos(πx),  x ≥ 0 and x < 1
       ⎩ 1,                  x ≥ 1

spline

「樣條」。許多段內插函數，拼成一個函數。

兩個相鄰函數點，取左右鄰近函數點們做內插，只取兩個相鄰函數點之間那一段函數曲線。所有相鄰函數點，如法炮製。每一段函數曲線，一段一段接起來，形成樣條。

內插函數只能是多項式函數。大家都中邪了。

取k個函數點做多項式內插，得到k-1次多項式函數，銜接處的平滑性是Cᵏ⁻² continuity。也就是說，第k-1次微分的時候，左鄰居導數值、右鄰居導數值可能不相等。從第0次微分到第k-2次微分，左右鄰居導數值皆保證相等。

總而言之，函數點越多，銜接處越平滑。

periodic function

periodic function（wave）

「週期函數」。輸入每隔固定距離，輸出就會重複。

工程領域習慣簡稱為「波」。然而，數學的週期函數、物理學的波，兩者毫無關聯，只是外觀有點像。

mathematics                  | engineering
-----------------------------| --------------------------
periodic rectanglar function | square wave
periodic triangular function | triangle wave
periodic linear function     | sawtooth wave
sinusoidal function          | sinusoidal wave / sinusoid
sine function                | sine wave
cosine function              | cosine wave

數學　　　　　丨工程
一一一一一一一十一一一
週期長方形函數丨方波
週期三角形函數丨三角波
週期一次函數　丨鋸齒波
弦型函數　　　丨弦波
正弦函數　　　丨正弦波
餘弦函數　　　丨餘弦波

輸入事先實施mod運算，即得週期函數。mod的數字大小，就是週期。

rectangular function
f(x) = ⎧ 0,  x < 0
       ⎨ 1,  x ≥ 0 and x < 1
       ⎩ 0,  x ≥ 1

periodic rectanglar function
p(x) = f(x mod 2)
f(x) = ⎰ 1,  x ≥ 0 and x < 1
       ⎱ 0,  x ≥ 1 and x < 2

periodic rectanglar function (x-axis symmetry)
p(x) = f(x mod 2)
f(x) = ⎰  1,  x ≥ 0 and x < 1
       ⎱ -1,  x ≥ 1 and x < 2

noise function

fractal noise function

Weierstrass function：疊加各種餘弦波，頻率呈倍數，振幅呈指數。

Fourier–Wiener series：疊加各種弦波，頻率呈倍數，振幅為隨機數。

smooth noise function

計算學家運用「內插」，製造平滑雜訊。網路上已有詳細教學文章，請讀者自行參考。

value noise：等距設置隨機數值，內插得到其餘數值。內插是為了製造綿延感。

Perlin noise：等距設置遞迴碎形，內插得到其餘數值。有些規律、又不失隨機；好像有道理、又好像在鬼扯。非常奇葩。

fBm noise：疊加各種解析度（頻率）的雜訊。解析度是2的各種次方。雜訊可以是上述任意一種。隱含混沌與碎形的概念，更細膩、更自然。

wavelet noise：疊加各種頻率暨振幅的波。類似fBm noise。