(度勢經文)不太坦白的數據  方道源

最近的一段新聞,是令普遍人不高興的「喜訊」。2023年澳門人人均總收入53萬元,當年升50%。首先有相當部分人覺得自己拉低了平均值,即使收入在平均以上的,相信也沒有幾個人感受有這樣的增幅。事實上數據是真實的,但感受也是真實的,不過兩種真實並不絕對相關,乃至在真實的世界,還是有如虛幻的感受。

記得在不久之前,有朋友問我信不信澳門人人均存款達100萬,我的回答是在數理上絕對可能,因為低於100萬的存款最低只有零,沒有負數,但100萬向上可以無限,10個億存款的大戶就可以幫1000個零餘額的人拉到平均值,何況市場向下的情況之下,富人投資減少,存款必然增多。

任何數據都有局限性,它能表達的訊息也是有限,比如消費物價指數下降,絕不代表你能夠用更少的金錢去維持過去的生活品質;社會博士碩士研究生的人數增加,僅代表平均水平上升,不代表今天的人才比過去有絕對的優勢。每個獨立的數據固然是真實,但統計方法和運用,就取決於使用者,玩弄數據的人,總會將資訊變為自己的刀刃。

市場佔有率、benchmark、歷史高低位、行業平均值,等等等等,全部都是公開透明,喜歡研究的,隨時可以取看,然而卻不能夠令大多數人賺錢,原因是當中的結果,包含太多標準差。耳聽七分假,眼看亦未為真,就算對方無意欺騙,有時亦無意跌入辛普森悖論之中,以為每件趨勢都一致,但合併後卻趨勢會消失,甚至變成另外一種反轉。越知道得更多,就會更加了解自己的無知。

面對數據,我只會選擇喜歡閱讀的,其他的聽來無妨,但迷信結果則太過無謂,寧願相信在統計學中,我是無知的。無知不可怕,無知而自以為無所不知才恐怖,但這個小城裏,恐怖的人比不可怕的人多的是。

在統計學的大數效應中,樹大有枯枝,人多必有……◇