跳到主要內容

自序

統計方法與實務 自序

在資訊爆炸氾濫的21 世紀,每天翻開各種報章雜誌,各式各樣的統計資料隨處呈現眼前。這是因為籠統地說,統計學的理論和方法與人類活動的各種領域多少都有不同程度上的關聯。由於任何領域內的活動都離不開資料,都有如何收集和分析資料的考量,因此也就讓統計方法有了用武之地。以下隨意舉一些例子就足以說明上述事實。 工業方面:當公司想要生產一種新產品,在研發過程中,首先有設計的構思,包括原料和生產製造條件的選訂,都要通過從大量可能的條件組合中,通過分析實驗結果來選擇,可能的條件組合很多,選擇哪一部分去做實驗是一個很有講究的問題,統計學中的實驗設計(experimental design)就是研究如何在盡可能少的試驗次數之下,達到盡可能高效率的分析結果的方法。農業方面:解決有關選種、栽種條件、肥料選擇等一系列的問題,也都與統計方法的應用有關。醫學方面:人體變異是一個重要的因素,每個人的狀況各有不同,例如人人對各種藥物和治療方法的反應就各不相同。所以,對一種藥物和治療方法的評價,是一種統計性規律的問題。因此先進國家核准一種新藥的上市和一種治療方法之前,都設定了很嚴格的實驗和統計檢驗的要求。其他諸如關於吸煙、飲酒之類許多生活習慣,或是環境污染對健康的影響的探究,都要通過收集大量資料進行統計分析來研究。其他關於社會現象的研究大量地使用統計方法,因為組成社會的單元人、家庭、單位、地區等,都有很大的變異性,因此只能從統計的角度去考察。事實上,社會科學方面的研究往往必須借助抽樣調查,並通過複雜的統計分析得出的結果。如今,抽樣調查已經成為研究社會現象的一種最有力的工具,因為全面調查往往不可行,而抽樣調查,從其方案的制定到資料的分析,都是以統計學的理論和方法為基礎。
換句話說,統計學是在有變異的資料中研究和發現統計規律的科學。因此無論是統計學的初等應用:如何收集資料、作圖列表,交叉分析之類;或者高級應用:建構模型,解釋現象,從而得到實務上或科學上的意義;透過資料的整理,從中解讀資料背後所代表的趨勢、基型或分配以及相關性等「有意義的訊息」,以瞭解資訊涵意,或轉換資訊為知識,甚至如何更進一步化知識為智慧已成為如今知識時代的國民不可或缺的能力。
根據編者手頭上的資顯示,早在 1980年代,無論是美國的教育機構如The Association to Advance Collegiate Schools of Business(AACSB)或是美國教育界的專家學者的研究報告,例如,由 L.W. Porter及 L.E. McKibbon合著的《Management Education and Development》(New York, McGraw-Hill, 1988),無不都強調數量方法對於管理教育的重要性,同時建議管理學院(商學院)相關科系必須將統計學列為必修課程。然而臺灣的大學生對於這種課程設計卻不領情,他們之中有許多自小學開始,就一直對於數量相關的課程深感頭痛。這三門都是學生認為很難過關的課程。因此不知何時開始,管理學院的學生之間以流傳著令人頭痛的三「記」的「冷笑話」來自我調侃:「經濟學是『經常忘記』、統計學是『通通忘記』、會計學是『快快忘記』」。其實不是學生不想記,而是教科書沒能提供學生適當的方式或學生不知如何記。很多以研究為傲的學者認為教科書的編著,只不過是把前人累積的知識設法作一個表達的雕蟲小技而已,但是如何將既有知識的素材去蕪存菁,重新組織,讓學生容易掌握內容核心,仍有賴編者的匠心獨運。正如大廚之於烹飪,如何化素材為美味佳餚供顧客品嚐,並非人人都會是一樣的道理。其實研究是發掘未知,而編書則是向下扎根,將既有知識傳承下來,兩者意義不同,不可偏廢。
美國統計學家杭特(J. S. Hunter)曾說:「現代統計不僅是一套工具和計算規則,統計是一種語言,用以創造和溝通數量概念和想法的媒介。」相對於其他數量方法的內容,在統計學中,讀者將會發現統計學會用到諸如「堅強的證據顯示……」或「根據所蒐集的數據,我們有95%的信心,結論是……」等等的措詞,而非諸如代數中「答案是……」或幾何中「……因此得證」之類的話語。事實上,各種數學都是利用特有的符號表達問題中的意義,以建立模式(modelling)的方式,能夠將問題精要的表達出來,然後透過特有的推論邏輯溝通,解決問題,統計也不例外。Jonathan D. Cryer 與Robert B.Miller 在兩人合著的《Statistics for Business: Data Analysis and Modelling》(Boston, PWS-KENT,1995)一書的序言中提到「在1986-1990 期間的一系列年度大會中,企業與學術界的成員們聚在一起交換關於提升商學院(schools of business)中統計課程的效果的看法,得到如下幾點的共識:
* 統計技術的訓練雖屬必要,但是對於必須利用統計思維以制訂決策的人士而言,僅有技術並不足夠;利用統計技術之前,仍需具備問題辨識與問題建構的能力。
* 統計使用者必須在解決問題的科學方法上加強訓練,而非在統計數學的情境上訓練。
* 訓練必須強調複雜問題解決的跨學域本質,以及在溝通上使用共同瞭解的詞彙的重要性。
本書的編著試圖符合前述企業與學術界對於商學院統計學內容的共識之要求,主旨在於嘗試達成如下三大目標:
讓學生能應用和解讀各式各樣統計方法的結果所隱涵的意義。
讓學生能瞭解諸如抽樣、實驗、變異性、機率分配、相關性、因果關係、信賴度以及顯著性等等基本統計概念。
讓學生對於報章、雜誌、電視等媒體,以及學術研究報告上許多有關統計資料分析與評估的報導,能有自我評斷和理解的能力。
雖然從常識的觀點來說,利用統計來解決問題應該遵循--問題設定;模式建立;資料蒐集;資料整理與分析以及表達等順序,然而本書的內容卻是以資料整理的方法作為起始點。理由是前兩個步驟牽涉許多統計技術的考量,對於一個未曾接觸過統計學的新手而言,不易理解和上手。本書共分為3個單元: 統計資料分析; 基本機率分配;以及統計推論等部分。
本書的特色至少包括如下數項:
* 在各章適當的地方融入與日常生活經驗的概念。例如第七章機率的緒言。
* 每章開始都圖示內容摘要,以利初學者掌握該章的重點。
* 在各章適當地方,穿插相關「知識加油站」或「輕鬆休息站」的內容,提升教科書的趣味性。
* 每頁重點的地方有「強化學習」,提升學生的注意力,或是教師考試的題目參考。
* 示範如何利用EXCEL 計算題目,減輕學生計算的負擔,讓學生能轉而注重結果的解讀。
編者期望學生於修完本課程後,能夠具備如下的能力:
* 體認統計推理在工作和日常生活上的重要性。
* 面對問題時,辨認在某種狀況下的基本統計假設。
* 知道應挑選何種適當統計工具以解決手頭上的統計問題。
* 看到統計調查結果能夠解讀其中意義。
總而言之,本教材的內容來自編者多年多方面的蒐集與累積,編著時的重心在於統計基本觀念的詮釋解說,並未刻意侷限例題為理工、管理或農業。期望任何科系的學生都能適用。但願這種作法不至於落入伊索寓言中「父子騎驢」故事的窘境。
最後,編者衷心期盼初學者在上統計學的當天,夜晚臨睡前,躺在床上,能夠靜心思索,務使當天所學的統計理論中種種內容,與先前所學相連結,有如一道清澈的溪水,緩緩的在心中流過,清可見底,更無半分渣滓。同時在學習統計的過程中,能夠不時回顧第一章的內容,牢記學習統計學的意義,體會統計學的思考邏輯。子曰:「學而不思則罔,思而不學則殆」,切記,切記。
張貼留言

這個網誌中的熱門文章

轉載《再別康橋》 賞析

《再別康橋》賞析
作者: 徐志摩


輕輕的我走了,
正如我輕輕的來;
我輕輕的招手,
作別西天的雲彩。

那河畔的金柳,
是夕陽中的新娘;
波光裡的豔影,
在我的心頭蕩漾。

軟泥上的青荇,
油油的在水底招搖;
在康河的柔波裡,
我甘心做一條水草!

那榆蔭下的一潭,
不是清泉,
是天上虹;

陳琳 古詩《飲馬長城窟行》漫談

飲馬長城窟,水寒傷馬骨。
往謂長城吏,慎莫稽留太原卒﹗
官作自有程,舉筑諧汝聲﹗
男兒寧當格鬥死,何能怫郁(ㄈㄨˊ ㄩˋ)筑長城。

長城何連連,連連三千里。
邊城多健少,內舍多寡婦。

作書與內舍,便嫁莫留住。
善待新姑嫜,時時念我故夫子﹗

報書往邊地,君今出語一何鄙﹖
身在禍難中,何為稽留他家子﹖
生男慎莫舉,生女哺用脯。
君獨不見長城下,死人骸骨相撐拄。
結髮行事君,慊慊心意關。
明知邊地苦,賤妾何能久自全﹖

語譯
  第一層(1—8句),寫築城役卒與長城吏的對話:
  讓馬飲水,只得到那長城下山石間的泉眼,那裡的水是那麼的冰冷,都冷傷透及馬骨頭裡。
  一位築城役卒跑去對監修長城的官吏懇求說:你們千萬不要長時間的滯留我們這些來自太原的役卒啊!

白居易的《花非花》究竟是什麽意思

花非花,霧非霧。夜半來,天明去。來如春夢不多時,去似朝雲無覓處。這首唐代著名詩人白居易的《花非花》在五十多年前我讀書的時候就已經於音樂課中學過,至今還沒忘記它的旋律。不過對於詞句的意思卻是不甚了了。最近我著迷台詩宋詞的學習,上網查這首詩的翻譯,發現有多家不同的解讀,詩人的《花非花》到底想說什麼呢?感到十分有趣,特將結果整理與同好分享。
白居易詩不僅以語言淺近著稱,其意境亦多顯露,但這首《花非花》卻句式奇特,且通篇取譬,十分含蓄,甚至迷離,堪稱是中國文學史上最早的朦朧詩的代表,在白詩中確乎是一個特例。因此對於這首詩到底想表達甚麼,充滿好奇。詩取前三字爲題,近乎“無題”。首二句應讀作“花——非花,霧——非霧”,先就給人一種捉摸不定的感覺。“非花”、“非霧”均系否定,卻包含一個不言而喻的前提:似花、似霧。因此可以說,這是兩個靈巧的比喻。語意雙關,富有朦朧美是這首小詞的最大特點。霧、春夢、朝雲,這幾個意象都是朦朧、飄渺的,意象之間又故意省略了銜接,顯出較大的跳躍性,文字空靈,精煉,使人咀嚼不盡,顯示了詩人不凡的藝術功力。但是,從“夜半來,天明去”的敘寫,可知這裏取喻於花與霧,在於比方所詠之物的短暫易逝,難持長久。如果單看“夜半來,天明去”,頗使讀者疑心是在說夢。但從下句“來如春夢”四字,可見又不然了。“夢”原來也是一比。這裏“來”、“去”二字,在音情上有承上啓下作用,由此生發出兩個新鮮比喻。“夜半來”者春夢也,春夢雖美卻短暫,於是引出一問:“來如春夢幾多時?”“天明”見者朝霞也,雲霞雖美卻易幻滅,於是引出一歎:“去似朝雲無覓處”。
  有人主張這首詞通篇都是隱語,主題當是詠官妓。當時各級官府都有一定數目的官妓,供那些官僚們驅使。首句“花非花”是說官妓的容顏如花,但又並非真花。次句“霧非霧”中“霧”字是雙關。借“霧”為“婺”。“婺女”即女宿星。因官妓女性,上應女宿,但又並非雲霧之霧。
“夜半來,天明去”既是詠星,也是說人。語意雙關,而主要是說人。唐宋時代旅客招妓女伴宿,都是夜半才來,黎明即去。因此,她來的時間不多,旅客宛如做了一個春夢。她去了之後,就像清晨的雲,消散得無影無蹤。官妓不同于一般的妓女,更不同于正式的妻子,她們與官僚之間互為依存,但關係又不便十分密切,只能以夜來明去為限,可謂會短別長。元稹有一首詩《夢昔時》,記他在夢中重會一個女子,有句云:“夜半初得處,天明臨去時。”…