跳到主要內容

統計學第二版序


日常生活裡確實隨時都會看到、聽到或用到一籮筐的數據:例如:物價上漲率、電腦普及率、手機普及率、死亡率、失業率、升學率、最低工資、墮胎人數、臉書使用人數……,這些數據幾乎全都是「統計結果」的化身!雖然多數人對數字可能無感,但冰冷的數字還是要比感性的言語具體、精確和可靠。透過統計調查,我們才會逐漸形成對於新現實社會潮流的理解。例如受過教育的人都知道陽光、空氣跟水是維持生命形態的三大基本要素,但根據網路上的調查,時下七、八年級生的日常休閒活動的前三名居然是手機、電視跟網路,這些已成為所謂F世代的年輕人在心理層面上賴以維生的生活三要素。F世代的年輕人們最常的活動上網、看電視,甚至還有睡覺這一項。這些休閒「活動」可以在家獨立完成,不需與他人互動的所謂,就連惟一在形式上勉強稱得上有互動關係的;也只是跟僅知暱稱的網友在虛擬的世界裏互打線上遊戲。

統計學最為常見的方法是透過取得樣本的方式推論出結論,如果樣本不具代表性,也就是通常所說的「爛樣本」,則可想而知,結論自然不可靠。例如,電影的預告片往往是該片的最精彩的片段,也就是「爛樣本」,誤導觀眾以為全片都是一樣驚險、刺激,導致很多觀眾購票觀賞全片之後,往往大失所望而歸。

常聽人說:「數字會說話。」然而面對各式各樣的統計數字時,我們必須認知到:讓數字「說話」的是人,而人可以進行操控。另一方面,由於許多媒體不夠用心,以致於報導當中常出現和數字有關的烏龍。可是千萬別以為所有的統計數字說的都是真話!十九世紀的英國政治家狄斯雷利(Benjamin Disraeli, 1804- 1881)就曾經說過:「世上有三種謊言,就是:謊言,鬼話,與統計數字(Lies, damned lies, and statistics)。」

有鑑於電腦科技日益進步,數字與圖表往往可以在瞬間完成,於是決策者在看過這些經過簡化的圖表,很容易便可以做出決定,但相反的,卻也少了思慮的時間。閱讀報章雜誌時,應該靜下心來看看統計數字,才不至於以偏概全;我們除了天真地全盤接受統計數字或偏激的認為它們毫無意義外,其實還有另一種選擇:面對著在社會科學以及我們飽受生活裡氾濫的統計數字,每個人都可以當個聰明、批判的閱聽者。

既然統計與現代人的生活息息相關,當我們面對各式各樣統計數字時,應該如何判斷真偽?統計數字可信程度有多少?要如何辨別數據與相關資料衍生結論的正確性,能夠在獲得資訊、正確判讀資訊的部分給予更多可供參考的思考邏輯。身為現代知識分子,應透過學習統計學課程累積一些統計常識,學習如何從各種訊息洪流中讀到「真正」的資訊,如果是因為自己不懂統計,或吃過統計的虧就把統計與謊言並列,可說是因噎廢食,也算另一種偏見吧。我們或許不需要自己整理數據,但也要有統計基本觀念,才能得知資料可不可靠。當別人告訴我們數字說了什麼話時,我們怎麼判斷正確性有多高呢?統計學帶給我們基本的判斷智慧,讓我們可以去評估數字是不是真的說了那些話,而不必照單全收。如果下次再看到如下的「報導」:「經過調查,某某基金的增值率最高」或「根據測試,某某品牌的手機通話品質最佳」,建議你不妨打個電話去問一下,測試或調查是怎麼做的?樣本如何取?樣本量(sample size)如何?看看他們如何回答,你再判斷要不要相信那則廣告吧!   

    本書出版至今,承蒙多所學校教師選用,也很熱心地提出種種建設性指教,編者對於這些建議十分感謝與感動。古人說:「來而不往,非禮也。」因此而有本次的改版。本次改版幅度不小,首先是全書改為如下的三大單元:

  1.敘述統計--表達數據的產生、整理與呈現:本單元將探討數愈的取得,介紹能夠生產出好的數據的統計設計。並且將談到如何進數據中探索資訊,包括圖形的利用及數值計算。換句話說,就是試圖瞭解資料中所含的訊息,並傳達給別人。

  2. 機率--衡量不確定的工具:面對變異無所不在(variation is universal.)與不確定性(uncertainty)隨處可見的事實,統計學家利用機率理論衡量不確定的大小與變異的程度。

  3.推論統計--從數據中得出結論:推論就是在利用機率,從數據中找出結論,並表達出我們對所得結論的正確性有多大的信心。

    其次,將若干章的順序加以調整,並且增加簡單線性迴歸的推論一章,讓授課教師針對該校不同系級與學生程度視其需要而將授課內容有較大的選擇彈性。

    第三是將各章內文重新大幅修訂,除了訂正若干錯誤,同時也增加若干例題與習題。

    本書此次改版,仍然維持初版的特色,至少有如下數項:

*本書兼顧統計概念、理論與方法,內文解說並與初學者生活經驗相結合。

*本書於各章之始附上「本章綱要」,清楚呈現該章重點,以利學生掌握要點。

*本書於各章中均附有「強化學習」之重點提醒,加強讀者對於要點內容的記憶。

*本書注重統計概念的解說和實用性,適合技職體系院校的採用。

*本書於內文穿插諸多補充資料和輕鬆小故事,以軟化統計教科書內容的嚴肅性。

    學生們請牢記,缺乏思考訓練的人容易失去質疑的能力。修過統計學這門課後一定要和沒學過統計學的人有所區隔,學會如何看穿在數據背後的真相,讓自己不會輕易被媒體報導、專家說法給唬得暈頭轉向!否則縱使自己僥倖獲得學分,其實也沒什麼值得高興的,因為日後仍舊很容易受騙上當;不太用腦袋的結果,就是長大之後仍然會輕易相信新聞報導、電視廣告、報章雜誌幾乎天天都會上演統計數字的戲碼,被人當成冤大頭。常言道 : 「害人之心不可有,防人之心不可無。」當我們學過了統計學後,除了可以藉由專業知識來判斷統計數字的真偽,繼而做正確的決策,千萬不要利用統計數字去騙人。建立批判思考的能力或許是英國小說家威爾斯(H.G.Wells,1866-1946)的預言:「統計思維有一天終將如同閱讀與寫字一樣,成為優秀公民的必備條件。」的積極意義。

 

                                       戴久永序於新竹隨緣齋

 

 
張貼留言

這個網誌中的熱門文章

轉載《再別康橋》 賞析

《再別康橋》賞析
作者: 徐志摩


輕輕的我走了,
正如我輕輕的來;
我輕輕的招手,
作別西天的雲彩。

那河畔的金柳,
是夕陽中的新娘;
波光裡的豔影,
在我的心頭蕩漾。

軟泥上的青荇,
油油的在水底招搖;
在康河的柔波裡,
我甘心做一條水草!

那榆蔭下的一潭,
不是清泉,
是天上虹;

陳琳 古詩《飲馬長城窟行》漫談

飲馬長城窟,水寒傷馬骨。
往謂長城吏,慎莫稽留太原卒﹗
官作自有程,舉筑諧汝聲﹗
男兒寧當格鬥死,何能怫郁(ㄈㄨˊ ㄩˋ)筑長城。

長城何連連,連連三千里。
邊城多健少,內舍多寡婦。

作書與內舍,便嫁莫留住。
善待新姑嫜,時時念我故夫子﹗

報書往邊地,君今出語一何鄙﹖
身在禍難中,何為稽留他家子﹖
生男慎莫舉,生女哺用脯。
君獨不見長城下,死人骸骨相撐拄。
結髮行事君,慊慊心意關。
明知邊地苦,賤妾何能久自全﹖

語譯
  第一層(1—8句),寫築城役卒與長城吏的對話:
  讓馬飲水,只得到那長城下山石間的泉眼,那裡的水是那麼的冰冷,都冷傷透及馬骨頭裡。
  一位築城役卒跑去對監修長城的官吏懇求說:你們千萬不要長時間的滯留我們這些來自太原的役卒啊!

從胡適的新詩《希望》到《蘭花草》

如果唱起“我從山中來,帶得蘭花草”,相信很多人都能夠接著唱幾句,這首民歌《蘭花草》在若干年前曾經瘋迷一時,為許多年輕人所喜愛。因為它旋律流暢,同時歌詞淺顯易懂。但是很多人都不知道其實這首歌的原始作者竟然是國寶級的大師胡適博士。原詩的名字是《希望》。1921年夏天,胡適的朋友熊秉三夫婦送給胡適一盆蘭花草,胡適歡歡喜喜帶了回來。胡適每天在讀書寫作之餘精心照顧,但直到秋天,也沒有開出花來,於是他有感而發寫了這首小詩。這首詩清新、質樸、深情,對生命的期待與珍惜躍然紙上。胡適給它取名為《希望》。這首小詩《希望》共3闋60字,詩云:
  我從山中來,帶得蘭花草。種在小園中,希望開花好。
        一日望三回,望到花時過;急壞看花人,花苞無一個。
  眼見秋天到,移花供在家,明年春風回,祝汝滿盆花。


後來20世紀八十年代初期被陳賢德和張弼二人修改並配上曲子,同時改名為《蘭花草》,由名歌手劉文正演唱,從而廣為流傳。

《蘭花草》的歌詞如下   我從山中來,帶來蘭花草,種在小園中,希望花開早。
  一日看三回,看得花時過;蘭花卻依然,苞也無一個。
  轉眼秋天到,移蘭入暖房;朝朝頻不息,夜夜不能忘。
 但願花開早,能將宿願償;滿庭花簇簇,開得有多香。 從以上比較可以清楚看出,《蘭花草》歌詞是《希望》一詩稍加增改而成。從立意、內容、文辭到形式,都沒有大的變化。只是為了傳唱的方便,將三段敷衍為四節。作為歌曲,這是可以理解的。由歌詞我們彷彿看到一個朝氣蓬勃的少年從山中帶回一株蘭花草時的滿心歡喜,看到他在精緻的小園中細心呵護的身影,看到他遮掩不住的焦急。清澈達意的文字中能看到那個少年清澈眼眸裡的天真和悵然。

由前述的解說,1921年胡適寫這首小詩的時候,似乎只是一時興起,將當時的感受以詩的形式表達出來,然而為什麼會取名《希望》,則是眾說紛紜,莫衷一是。一說是1919年2月,胡適曾翻譯過另外一首《希望》小詩。而且,妻子江冬秀懷孕在身,兩個月後就要臨產,“希望”預示著新生命的前程。有人認為詩中的“蘭花草”其實是隱喻“德先生與賽先生”,胡適於1917年回北京大學任教時將民主和科學引進中國,然而到了1921年,民主和科學並沒有如他所預期的在中國落地生根,甚至“苞也無一個”。也有人認為“蘭花草”其實是隱喻白話詩,胡適的文學革命是主張以白話取代文言寫詩,它早在1916年開始就不斷實驗以白話寫詩,可惜贊成他的主張的人似…