跳到主要內容

統計學第二版序


日常生活裡確實隨時都會看到、聽到或用到一籮筐的數據:例如:物價上漲率、電腦普及率、手機普及率、死亡率、失業率、升學率、最低工資、墮胎人數、臉書使用人數……,這些數據幾乎全都是「統計結果」的化身!雖然多數人對數字可能無感,但冰冷的數字還是要比感性的言語具體、精確和可靠。透過統計調查,我們才會逐漸形成對於新現實社會潮流的理解。例如受過教育的人都知道陽光、空氣跟水是維持生命形態的三大基本要素,但根據網路上的調查,時下七、八年級生的日常休閒活動的前三名居然是手機、電視跟網路,這些已成為所謂F世代的年輕人在心理層面上賴以維生的生活三要素。F世代的年輕人們最常的活動上網、看電視,甚至還有睡覺這一項。這些休閒「活動」可以在家獨立完成,不需與他人互動的所謂,就連惟一在形式上勉強稱得上有互動關係的;也只是跟僅知暱稱的網友在虛擬的世界裏互打線上遊戲。

統計學最為常見的方法是透過取得樣本的方式推論出結論,如果樣本不具代表性,也就是通常所說的「爛樣本」,則可想而知,結論自然不可靠。例如,電影的預告片往往是該片的最精彩的片段,也就是「爛樣本」,誤導觀眾以為全片都是一樣驚險、刺激,導致很多觀眾購票觀賞全片之後,往往大失所望而歸。

常聽人說:「數字會說話。」然而面對各式各樣的統計數字時,我們必須認知到:讓數字「說話」的是人,而人可以進行操控。另一方面,由於許多媒體不夠用心,以致於報導當中常出現和數字有關的烏龍。可是千萬別以為所有的統計數字說的都是真話!十九世紀的英國政治家狄斯雷利(Benjamin Disraeli, 1804- 1881)就曾經說過:「世上有三種謊言,就是:謊言,鬼話,與統計數字(Lies, damned lies, and statistics)。」

有鑑於電腦科技日益進步,數字與圖表往往可以在瞬間完成,於是決策者在看過這些經過簡化的圖表,很容易便可以做出決定,但相反的,卻也少了思慮的時間。閱讀報章雜誌時,應該靜下心來看看統計數字,才不至於以偏概全;我們除了天真地全盤接受統計數字或偏激的認為它們毫無意義外,其實還有另一種選擇:面對著在社會科學以及我們飽受生活裡氾濫的統計數字,每個人都可以當個聰明、批判的閱聽者。

既然統計與現代人的生活息息相關,當我們面對各式各樣統計數字時,應該如何判斷真偽?統計數字可信程度有多少?要如何辨別數據與相關資料衍生結論的正確性,能夠在獲得資訊、正確判讀資訊的部分給予更多可供參考的思考邏輯。身為現代知識分子,應透過學習統計學課程累積一些統計常識,學習如何從各種訊息洪流中讀到「真正」的資訊,如果是因為自己不懂統計,或吃過統計的虧就把統計與謊言並列,可說是因噎廢食,也算另一種偏見吧。我們或許不需要自己整理數據,但也要有統計基本觀念,才能得知資料可不可靠。當別人告訴我們數字說了什麼話時,我們怎麼判斷正確性有多高呢?統計學帶給我們基本的判斷智慧,讓我們可以去評估數字是不是真的說了那些話,而不必照單全收。如果下次再看到如下的「報導」:「經過調查,某某基金的增值率最高」或「根據測試,某某品牌的手機通話品質最佳」,建議你不妨打個電話去問一下,測試或調查是怎麼做的?樣本如何取?樣本量(sample size)如何?看看他們如何回答,你再判斷要不要相信那則廣告吧!   

    本書出版至今,承蒙多所學校教師選用,也很熱心地提出種種建設性指教,編者對於這些建議十分感謝與感動。古人說:「來而不往,非禮也。」因此而有本次的改版。本次改版幅度不小,首先是全書改為如下的三大單元:

  1.敘述統計--表達數據的產生、整理與呈現:本單元將探討數愈的取得,介紹能夠生產出好的數據的統計設計。並且將談到如何進數據中探索資訊,包括圖形的利用及數值計算。換句話說,就是試圖瞭解資料中所含的訊息,並傳達給別人。

  2. 機率--衡量不確定的工具:面對變異無所不在(variation is universal.)與不確定性(uncertainty)隨處可見的事實,統計學家利用機率理論衡量不確定的大小與變異的程度。

  3.推論統計--從數據中得出結論:推論就是在利用機率,從數據中找出結論,並表達出我們對所得結論的正確性有多大的信心。

    其次,將若干章的順序加以調整,並且增加簡單線性迴歸的推論一章,讓授課教師針對該校不同系級與學生程度視其需要而將授課內容有較大的選擇彈性。

    第三是將各章內文重新大幅修訂,除了訂正若干錯誤,同時也增加若干例題與習題。

    本書此次改版,仍然維持初版的特色,至少有如下數項:

*本書兼顧統計概念、理論與方法,內文解說並與初學者生活經驗相結合。

*本書於各章之始附上「本章綱要」,清楚呈現該章重點,以利學生掌握要點。

*本書於各章中均附有「強化學習」之重點提醒,加強讀者對於要點內容的記憶。

*本書注重統計概念的解說和實用性,適合技職體系院校的採用。

*本書於內文穿插諸多補充資料和輕鬆小故事,以軟化統計教科書內容的嚴肅性。

    學生們請牢記,缺乏思考訓練的人容易失去質疑的能力。修過統計學這門課後一定要和沒學過統計學的人有所區隔,學會如何看穿在數據背後的真相,讓自己不會輕易被媒體報導、專家說法給唬得暈頭轉向!否則縱使自己僥倖獲得學分,其實也沒什麼值得高興的,因為日後仍舊很容易受騙上當;不太用腦袋的結果,就是長大之後仍然會輕易相信新聞報導、電視廣告、報章雜誌幾乎天天都會上演統計數字的戲碼,被人當成冤大頭。常言道 : 「害人之心不可有,防人之心不可無。」當我們學過了統計學後,除了可以藉由專業知識來判斷統計數字的真偽,繼而做正確的決策,千萬不要利用統計數字去騙人。建立批判思考的能力或許是英國小說家威爾斯(H.G.Wells,1866-1946)的預言:「統計思維有一天終將如同閱讀與寫字一樣,成為優秀公民的必備條件。」的積極意義。

 

                                       戴久永序於新竹隨緣齋

 

 
張貼留言

這個網誌中的熱門文章

轉載《再別康橋》 賞析

《再別康橋》賞析
作者: 徐志摩


輕輕的我走了,
正如我輕輕的來;
我輕輕的招手,
作別西天的雲彩。

那河畔的金柳,
是夕陽中的新娘;
波光裡的豔影,
在我的心頭蕩漾。

軟泥上的青荇,
油油的在水底招搖;
在康河的柔波裡,
我甘心做一條水草!

那榆蔭下的一潭,
不是清泉,
是天上虹;

陳琳 古詩《飲馬長城窟行》漫談

飲馬長城窟,水寒傷馬骨。
往謂長城吏,慎莫稽留太原卒﹗
官作自有程,舉筑諧汝聲﹗
男兒寧當格鬥死,何能怫郁(ㄈㄨˊ ㄩˋ)筑長城。

長城何連連,連連三千里。
邊城多健少,內舍多寡婦。

作書與內舍,便嫁莫留住。
善待新姑嫜,時時念我故夫子﹗

報書往邊地,君今出語一何鄙﹖
身在禍難中,何為稽留他家子﹖
生男慎莫舉,生女哺用脯。
君獨不見長城下,死人骸骨相撐拄。
結髮行事君,慊慊心意關。
明知邊地苦,賤妾何能久自全﹖

語譯
  第一層(1—8句),寫築城役卒與長城吏的對話:
  讓馬飲水,只得到那長城下山石間的泉眼,那裡的水是那麼的冰冷,都冷傷透及馬骨頭裡。
  一位築城役卒跑去對監修長城的官吏懇求說:你們千萬不要長時間的滯留我們這些來自太原的役卒啊!

白居易的《花非花》究竟是什麽意思

花非花,霧非霧。夜半來,天明去。來如春夢不多時,去似朝雲無覓處。這首唐代著名詩人白居易的《花非花》在五十多年前我讀書的時候就已經於音樂課中學過,至今還沒忘記它的旋律。不過對於詞句的意思卻是不甚了了。最近我著迷台詩宋詞的學習,上網查這首詩的翻譯,發現有多家不同的解讀,詩人的《花非花》到底想說什麼呢?感到十分有趣,特將結果整理與同好分享。
白居易詩不僅以語言淺近著稱,其意境亦多顯露,但這首《花非花》卻句式奇特,且通篇取譬,十分含蓄,甚至迷離,堪稱是中國文學史上最早的朦朧詩的代表,在白詩中確乎是一個特例。因此對於這首詩到底想表達甚麼,充滿好奇。詩取前三字爲題,近乎“無題”。首二句應讀作“花——非花,霧——非霧”,先就給人一種捉摸不定的感覺。“非花”、“非霧”均系否定,卻包含一個不言而喻的前提:似花、似霧。因此可以說,這是兩個靈巧的比喻。語意雙關,富有朦朧美是這首小詞的最大特點。霧、春夢、朝雲,這幾個意象都是朦朧、飄渺的,意象之間又故意省略了銜接,顯出較大的跳躍性,文字空靈,精煉,使人咀嚼不盡,顯示了詩人不凡的藝術功力。但是,從“夜半來,天明去”的敘寫,可知這裏取喻於花與霧,在於比方所詠之物的短暫易逝,難持長久。如果單看“夜半來,天明去”,頗使讀者疑心是在說夢。但從下句“來如春夢”四字,可見又不然了。“夢”原來也是一比。這裏“來”、“去”二字,在音情上有承上啓下作用,由此生發出兩個新鮮比喻。“夜半來”者春夢也,春夢雖美卻短暫,於是引出一問:“來如春夢幾多時?”“天明”見者朝霞也,雲霞雖美卻易幻滅,於是引出一歎:“去似朝雲無覓處”。
  有人主張這首詞通篇都是隱語,主題當是詠官妓。當時各級官府都有一定數目的官妓,供那些官僚們驅使。首句“花非花”是說官妓的容顏如花,但又並非真花。次句“霧非霧”中“霧”字是雙關。借“霧”為“婺”。“婺女”即女宿星。因官妓女性,上應女宿,但又並非雲霧之霧。
“夜半來,天明去”既是詠星,也是說人。語意雙關,而主要是說人。唐宋時代旅客招妓女伴宿,都是夜半才來,黎明即去。因此,她來的時間不多,旅客宛如做了一個春夢。她去了之後,就像清晨的雲,消散得無影無蹤。官妓不同于一般的妓女,更不同于正式的妻子,她們與官僚之間互為依存,但關係又不便十分密切,只能以夜來明去為限,可謂會短別長。元稹有一首詩《夢昔時》,記他在夢中重會一個女子,有句云:“夜半初得處,天明臨去時。”…