數位人文學課程成果發表會

Anne Chiang

2018年12月19日

Legal Analytics: The Optimization and Application of Decision Tree Predictor on Child Custody

國籍與意願交織下的「幼兒從母」原則:法律資料分析之實踐

作者  :姜晴文  臺灣大學法律學院 民法組一年級

指導教授:黃詩淳  臺灣大學法律學院 副教授  邵軒磊  臺灣師範大學東亞學系 副教授

摘要

台灣第一篇有關親權酌定的預測模型是黃詩淳等在2018年《國立臺灣大學法學論叢》所發表有關決策樹分析的論文〈酌定子女親權之重要因素:以決策樹方法分析相關裁判〉(以下簡稱黃文),其準確率超過94%。但黃文同時也引發了若干疑問:當研究的族群從有書狀意願相當的台籍父母擴大到全體案件時,準確率是否還能維持?黃文的研究對象為101-103年的案件,4年後的今天,這個預測模型是否還能適用?如果我們拿全新未知的資料檢測,還能這麼準確嗎?有沒有過度擬合的問題?為了回答這些問題,本文蒐集民國98年1月1日起至106年12月31日止全台地方法院有關親權酌定的第一審案件,以黃文的決策樹預測模型為原型而稍加調整,發現準確率可達97%以上。如果以98-105年的資料所種出來的決策樹應用在106年的全新未知案件仍舊一般準確,沒有過度擬合的問題。我們針對細部資料進一步分析發現,子女年齡與親權歸屬是有關聯性的,分別在0-2歲、及14-19歲的兩極出現親權歸母的高峰。推測這是因為「幼兒從母」、「中兒唯父有意」及「大兒擇母」三個不同的因素共同作用下的結果,而後兩者分別來自親子兩造的意願,都與外籍母親有關。

關鍵字:親權酌定、法律資料分析、過度擬合、分年滾動式分析、決策樹、幼兒從母、外籍母親

1. 決策樹預測模型的優化

抽樣比率的優化:

`

`

秀樹現身

成果1:以106年為例

`

`

成果2:102-106年逐年滾動準確率

`

`

比較:(vs隨機森林)

年度 平均準確率 範圍 隨機森林準確率
客製樹
106 97.49% 95.18%-99.29% 97.28%
105 97.48% 96.45%-99.39% 97.07%
104 98.88% 96.65%-100.00% 97.45%
103 98.16% 94.37%-99.58% 98.16%
102 97.57% 95.14%-99.79% 97.72%
逐年滾動
106 97.49% 95.33%-99.15% 97.28%
105 97.70% 96.45%-99.39% 96.87%
104 98.88% 96.65%-100.00% 97.95%
103 98.16% 94.37%-99.58% 97.92%
102 97.31% 95.14%-99.79% 97.01%

2. 不再「幼兒從母」了嗎?法律資料分析的實踐

從親權歸屬看年齡分布,雙樣本中位數差異檢定(Wilcoxon rank sum test with continuity correction),組間比較未達顯著差異。

`

`

但我們若從年齡看親權歸屬,2 X 20表格的模擬卡方檢定,已達顯著差異:

`

`

改從親子兩造的意願來探求原因:

數據顯示:3,392個未成年子女中共2,067人表達了他們的意願、2,253人的父母意願為唯父/唯母有意,其中裁判結果不依小孩意願、或不依父母意願的,分別只有42人(2.03%)、34人(1.51%)而已。我們根據Ashley以爭點為本的預測模型(Issue-Based Predictor, IBP),演算出親權酌定裁判結果的類型化解釋模型,也將所有案件以父母意願及子女意願的交互篩選架構解釋覆蓋率最為理想,所以此後我們將從親子的意願的互動來探究年齡與親權歸屬的相關性。

`

`

`

`

到底是誰影響了誰?

`

`

在父母意願相當(第456段)的族群,隨著子女年齡的增加,子女擇母率遞增而擇父率並未見此趨勢,姑稱此為「大兒擇母」。在子女無意願或中立時,隨著年齡增加,父母的三種意願則一齊減少,推測是子女表態率上昇的關係,而讓出的空間大多為「大兒擇母」所接收,造成大兒族群不管是「唯父有意」或「擇父」的比率都要比中兒低;姑稱之為「中兒均分」。

造成「中兒均分」的藏鏡人現身:

`

`

`

`

唯父有意的案件在外籍母親、台籍母親的比率反轉,是造成中兒「唯父有意」比率上昇、「中兒均分」的主要原因。

`

`

從離婚的原因看子女的意願分布:

`

`

造成「大兒擇母」的藏鏡人現身:

`

`

60.66%的母不適任,為外籍母親(民法第1052條第1 項第5 款惡意遺棄),母不適任比率依子女年齡的昇降和前圖外籍母親比率的變化是同步的。

此外,利用我們的樣式化分析模板也可以檢視分析樣本流的分布,若將其按0-2歲/3-13歲/14-19歲分為幼兒、中兒、及大兒組,則下表的數字流可以印證我們前面在親子意願的觀察和推理,並進行統計檢定。

樣式化解釋模型的樣本流分析

組別 總人數 唯父有意 意願相當 唯母有意
幼兒 322 44(13.67%) 180(55.90%) 98(30.43%)
         
中兒 2,116 788(37.24%) 721(34.07%) 607(28.69%)
中兒台籍母親組 1,359(64.23%) 277(20.38%) 590(43.42%) 492(36.20%)
中兒外籍母親組 710(33.55%) 511(71.97%) 127(17.89%) 72(10.14%)
         
大兒 954 275(28.83%) 237(24.84%) 442(46.33%)
大兒台籍母親組 776(81.34%) 162(20.88%) 208(26.80%) 406(56.32%)
大兒外籍母親組 163(17.09%) 113(69.33%) 28(17.18%) 22(13.49%)
         

我們的模板是以父母意願為第一階的三叉節點因素,故可以從父母意願的分布,推論親權歸屬的大致情形。

大兒組的「唯父有意」支的比率明顯低於中兒組、中兒組的外籍母親比率明顯高於大兒組(均達顯著差異),印證了我們前面幾張圖的觀察。因為我們的模板在「唯父/母有意」這兩支的架構是對稱性的偏父/偏母,因此從樣本流的走向可以解釋為什麼中兒組的親權歸父率會較高[3]。

幼兒組有比較高的樣本流走向父母「意願相當」支,這一支在第三階的親職能力、及第四階的主要照顧者的因素分類中,都是偏向母方的架構。所謂的「幼兒從母」並不是法官無視其他因素的獨斷,而是當父母意願相當、子女無從表達意願、其他因素又未特別偏向父親時的一個處理原則。我們從模板中幼兒組流向父母「意願相當」支,親職能力、主要照顧者無一為有利父方的比率(146/322,45.34%),的確可以假設「幼兒從母」仍然存在。

3.結論

本研究的預測模型一以黃文的決策樹為原型,只是略微調整操作的程序、優化程式的參數。分析的結果發現,即便把那些「勢不均力不敵」的案件一齊納入分析,準確率依舊可以高達97%以上,而且重覆操作1,000次的報表發現,表現最差的樹準確率也還有將近94%。不但證明了這個決策樹模型在親權酌定方面的高預測能力,並非一時的巧合倖致;也告訴我們:不只是「101-103年」、「少數特殊案件」,即便把時間拉長到「98-106年」、樣本擴大到「所有案件」,這個模型在信度和效度的表現也始終可靠。

或有人質疑:黃文的驗證組也是從樣本中隨機選出,因此模型的高準確率只是反應了驗證組與訓練組的高度同質性,未必有實用性。這個質疑也正反應了預測工具的研究者隨時面對的挑戰:「過度擬合」。為了釐清這個問題,我們先將106年資料放一邊,完全獨立於決策樹的發展與調整過程。待樹完成之後,再將106年資料拔靴演化成1,000個樣本,以「全新、未知」的姿態反覆檢測我們的模型。結果106年資料母群體準確率的無偏估計仍可達97.49%。為了確認這不是106年的特例,我們還自102年起,逐年移開該年及其後的樣本,進行所謂逐年滾動式分析,其結果也約略相當。

上述研究證明我們的預測模型有足夠的能力應付全新、未知的資料而維持穩定的信度和效度,但我們同時也發現近六年來,整體法院有關親權酌定的裁判資料仍會偶有偏移。因此,針對親權酌定的案件進行逐年的、滾動式的資料蒐集與監測是必要的。

有關子女年齡與親權歸屬的關聯性,歷來實證研究的結果不一。有本於「幼兒從母」原則而主張有關的、有本於裁判書統計而認為無關的、有依統計樣本年代的不同而認為效應隨時代變遷而逐年減弱的。本文利用法律資料分析來研究,發現若依子女的年紀分齡來看,有一個親權歸母中間低、兩邊高的兩極現象。「幼兒從母」還是存在的,它的效應自3歲開始遞減。若分別從父母及子女的意願來探索,發現是由「大兒擇母」及「中兒唯父有意」共同主導。外籍母親在爭取親權的弱勢,以及外籍母親的子女在8-12歲的人數高峰,解釋了為何「中兒唯父有意」;外籍母親再加上「非不適任」比率的逐年下降與「父不適任」在12歲以後的逐漸增加,則共同造就了「大兒擇母」的現象。

總之,外籍母親這個特殊的族群,透過親子的意願,深深地影響了親權歸屬和子女年齡的關係。她們的選擇離開婚姻與家庭,造成父母意願上「中兒唯父有意」的比率上昇,並進而互動地影響了子女的意願,而有「中兒均分」的現象。她們的逐步退出離婚戰場,又與台籍婚姻中的「父不適任」聯手,促成了子女意願上「大兒擇母」的比率上昇。