電郵給朋友列印

社會行為與計算系統的交匯

今年1月,全球最大的網絡公司谷歌發出預警,流感即將在美國爆發,全國瀰漫一片緊張氣氛。谷歌的「流感趨勢」在2008年推出,基本原理是分析累積的搜索數據來預測流感潮的起落。據「流感趨勢」的網頁所述,每星期有數以百萬計的人在網絡世界裏搜尋有關健康的資訊,搜索主題亦隨季節而異,例如夏天特別多人搜索日曬炙傷的資訊。研究人員發現,搜索流感主題的次數與實際有流感症狀的人數有密切的關係,利用這些數據的分析便可預測流感在某地區的爆發情況。「流感趨勢」當然未能取代現行的疾病監測系統,但推出以來表現理想,甚至比美國疾病控制與預防中心更快預測到流感的爆發。

計算機科學與工程學系的金國慶教授解釋,谷歌的「流感趨勢」是社會計算的一個應用實例。社會計算簡單來說,是利用機器學習、數據挖掘和網路智能的技術來分析網誌、臉書、YouTube等社會媒體所產生的大量數據,從中了解人們的社會關係。「這對近年愈來愈重要的『大數據』意義非比尋常,」金教授說。「過去的十年八年間,湧現了很多新的社會現象,產生了數量驚人的數據,社會計算就是如何去分析和理解這些數據,現時已成為計算機科學的一個重要範疇。或者可以說,社會計算是社會行為和計算系統的交匯。」

「大數據」現時是所有公私企業和機構都不容忽視的課題。金教授在中大研究和教授的其中一科就是社會計算,他指出,我們在互聯網上和使用流動通訊器材的所有活動都成為數據,企業和機構掌握了這些數據,可從中梳理出顧客或服務對象的喜好和特徵,從而設計更符合市場的產品或服務。所以企業和機構毫不怠慢,大家的態度都是先把數據儲存起來再說,如何分析和利用是下一步的事。

有幾個修讀金教授的社會計算課的內地生利用所學,完成了一項有趣的研究作業。他們分析了南京計程車的全球定位系統數據,按市內不同地區不同時段的交通情況,找出最快捷的行車路線,還計算到司機的收入情況,平均是多少,最高和最低是多少,一目了然。

金教授去年才回到中大。之前的兩年,他於加州大學柏克萊分校擔任客座教授,講授兩門與社會計算及大數據相關的課程。同時,他在三藩市的美國電話及電報公司做研究,從人們的打電話和通訊模式中,推斷一個人的身分,然後概括出這個人的行為和習慣。這類研究不但有巨大的商業潛力,在了解人的行為上亦有很大的啟發。金教授亦不諱言,類似的研究全球不少政府都在進行,致力應付恐怖活動的國家尤其不敢掉以輕心。

金教授指出,計算機科學裏的數據分析絕非新鮮事物,但隨着互聯網和流動通訊技術的發達,數據分析的發展一日千里,社會計算的興起可以說是一個高峰。他說:「現今的數碼社會是一個開放的群體。參與其中便要有心理預備,一舉一動都會留下蹤跡供人追尋,所以適當的安全措施一定不可少。不過最重要的還是要自己小心言行。保障私隱畢竟要由自己做起。」

快速連結