學術探奇

跳進微機率的大世界──中大統計學家研得更佳方法評估極端風險

統計學系系主任邵啟滿教授

統計學系
邵啟滿教授


邵啟滿教授的機率和統計研究工作,為估算異常不可能發生的事件提供實質的理論依據,可廣泛應用於如保險、遺傳學、生物學和政治民調等範疇。

他的研究工作有助評估極端風險的機率,例如用以評估保險公司或對沖基金的潛在損失,特別是風險非常大但又不太可能發生的情況。他的研究曾被用以識別利息的結構性影響,以至以假定腫瘤細胞擴大指數評估腫瘤形成的可能性。

邵教授說:「我喜歡研究理論上重要,兼可應用在其他範疇的問題,以簡潔的假設來推斷出重大結果。」

邵教授用了兩年時間,發展出他論文背後影響深遠的自正則化大偏差理論。他的首份論文建立了以自正則化大偏差理論的方法來分析大量數據,改善了評估極端風險時的統計推斷風險。

邵教授是中文大學統計學系系主任,把瑞典數學家Harald Cramér的理論發揚光大。大偏差定理是由Cramér建立並應用在保險業,讓保險公司可以準確預測保單帶來的總收益高於支付索償額的機會。保險公司可運用有關策略為保單定價至最大可能確保公司獲得利潤的水平。

Cramér的大偏差定理改進了於十八世紀出現的中央極限定理。中央極限定理的假設,就如擲骰子或抽彩票號碼,若干結果的機率會偏向得出傳統鐘形曲線或一般曲線,並以此估計機率。

中央極限定理假設常態尾端分布與真正機率相距十分小。然而,當機率極小時,常態尾端與實際分布的分別可以非常巨大:舉例說,0.01與0.0001之間的差異十分小,但0.01與0.0001是毫不接近的。

Self-Normalized Cramér-type Moderate Deviations

邵教授研究漸近理論,該理論估算標準差屬非線性及隨機,並很大可能不會與真正機率相同。他於九十年代原本專注研究傳統的漸近理論——隨機應變數的漸近理論,但他逐漸發現他可將漸近理論應用於任意及隨機的自正則化變數。

儘管研究得出一條理論問題的精確及理想答案,邵教授亦希望其研究結果可應用於現實情況。舉例說,在測試他莫昔芬(tamoxifen)治療是否能有效識別某些致病基因時,他的理論被應用來控制偽發現率。

生物學家亦應用邵教授的研究探討腫瘤的演變,以更好選用適合的治療藥物。有關研究員從他的理論出發,做出「以數學方法理解腫瘤內異質性,並適用於如細菌、農業害蟲等有機體及其他微生物」的工作。

邵教授為兩本有關大數據的書籍的作者,分別是《Self-Normalized Processes》,是一部與Cramér的研究相似的自正則化大偏差理論的專書,與哥倫比亞大學的 Victor de la Peña教授及士丹福大學的黎子良敎授合著;以及《Normal Approximation by Stein’s Method》,是與新加坡國立大學的陳曉雲教授及美國南加州大學的Larry Goldstein教授合著有關處理大數據的巨著。

隨著大數據的領域發展起來,邵教授的研究成果將可應用於多方面需要評估極端風險或計算細微機率的範疇,就如因極不可能發生的事件造成極大影響的金融危機。邵教授表示:「估算極度罕見機率是十分重要的。」

倘中英文版本出現歧義,概以英文版本為準。


本文出自中大網頁(2015年5月)

標籤
邵啟滿 統計學系 理學院 大數據 統計學 風險評估 教授