統計方法與實務 自序
在資訊爆炸氾濫的21 世紀,每天翻開各種報章雜誌,各式各樣的統計資料隨處呈現眼前。這是因為籠統地說,統計學的理論和方法與人類活動的各種領域多少都有不同程度上的關聯。由於任何領域內的活動都離不開資料,都有如何收集和分析資料的考量,因此也就讓統計方法有了用武之地。以下隨意舉一些例子就足以說明上述事實。 工業方面:當公司想要生產一種新產品,在研發過程中,首先有設計的構思,包括原料和生產製造條件的選訂,都要通過從大量可能的條件組合中,通過分析實驗結果來選擇,可能的條件組合很多,選擇哪一部分去做實驗是一個很有講究的問題,統計學中的實驗設計(experimental design)就是研究如何在盡可能少的試驗次數之下,達到盡可能高效率的分析結果的方法。農業方面:解決有關選種、栽種條件、肥料選擇等一系列的問題,也都與統計方法的應用有關。醫學方面:人體變異是一個重要的因素,每個人的狀況各有不同,例如人人對各種藥物和治療方法的反應就各不相同。所以,對一種藥物和治療方法的評價,是一種統計性規律的問題。因此先進國家核准一種新藥的上市和一種治療方法之前,都設定了很嚴格的實驗和統計檢驗的要求。其他諸如關於吸煙、飲酒之類許多生活習慣,或是環境污染對健康的影響的探究,都要通過收集大量資料進行統計分析來研究。其他關於社會現象的研究大量地使用統計方法,因為組成社會的單元人、家庭、單位、地區等,都有很大的變異性,因此只能從統計的角度去考察。事實上,社會科學方面的研究往往必須借助抽樣調查,並通過複雜的統計分析得出的結果。如今,抽樣調查已經成為研究社會現象的一種最有力的工具,因為全面調查往往不可行,而抽樣調查,從其方案的制定到資料的分析,都是以統計學的理論和方法為基礎。
換句話說,統計學是在有變異的資料中研究和發現統計規律的科學。因此無論是統計學的初等應用:如何收集資料、作圖列表,交叉分析之類;或者高級應用:建構模型,解釋現象,從而得到實務上或科學上的意義;透過資料的整理,從中解讀資料背後所代表的趨勢、基型或分配以及相關性等「有意義的訊息」,以瞭解資訊涵意,或轉換資訊為知識,甚至如何更進一步化知識為智慧已成為如今知識時代的國民不可或缺的能力。
根據編者手頭上的資顯示,早在 1980年代,無論是美國的教育機構如The Association to Advance Collegiate Schools of Business(AACSB)或是美國教育界的專家學者的研究報告,例如,由 L.W. Porter及 L.E. McKibbon合著的《Management Education and Development》(New York, McGraw-Hill, 1988),無不都強調數量方法對於管理教育的重要性,同時建議管理學院(商學院)相關科系必須將統計學列為必修課程。然而臺灣的大學生對於這種課程設計卻不領情,他們之中有許多自小學開始,就一直對於數量相關的課程深感頭痛。這三門都是學生認為很難過關的課程。因此不知何時開始,管理學院的學生之間以流傳著令人頭痛的三「記」的「冷笑話」來自我調侃:「經濟學是『經常忘記』、統計學是『通通忘記』、會計學是『快快忘記』」。其實不是學生不想記,而是教科書沒能提供學生適當的方式或學生不知如何記。很多以研究為傲的學者認為教科書的編著,只不過是把前人累積的知識設法作一個表達的雕蟲小技而已,但是如何將既有知識的素材去蕪存菁,重新組織,讓學生容易掌握內容核心,仍有賴編者的匠心獨運。正如大廚之於烹飪,如何化素材為美味佳餚供顧客品嚐,並非人人都會是一樣的道理。其實研究是發掘未知,而編書則是向下扎根,將既有知識傳承下來,兩者意義不同,不可偏廢。
美國統計學家杭特(J. S. Hunter)曾說:「現代統計不僅是一套工具和計算規則,統計是一種語言,用以創造和溝通數量概念和想法的媒介。」相對於其他數量方法的內容,在統計學中,讀者將會發現統計學會用到諸如「堅強的證據顯示……」或「根據所蒐集的數據,我們有95%的信心,結論是……」等等的措詞,而非諸如代數中「答案是……」或幾何中「……因此得證」之類的話語。事實上,各種數學都是利用特有的符號表達問題中的意義,以建立模式(modelling)的方式,能夠將問題精要的表達出來,然後透過特有的推論邏輯溝通,解決問題,統計也不例外。Jonathan D. Cryer 與Robert B.Miller 在兩人合著的《Statistics for Business: Data Analysis and Modelling》(Boston, PWS-KENT,1995)一書的序言中提到「在1986-1990 期間的一系列年度大會中,企業與學術界的成員們聚在一起交換關於提升商學院(schools of business)中統計課程的效果的看法,得到如下幾點的共識:
* 統計技術的訓練雖屬必要,但是對於必須利用統計思維以制訂決策的人士而言,僅有技術並不足夠;利用統計技術之前,仍需具備問題辨識與問題建構的能力。
* 統計使用者必須在解決問題的科學方法上加強訓練,而非在統計數學的情境上訓練。
* 訓練必須強調複雜問題解決的跨學域本質,以及在溝通上使用共同瞭解的詞彙的重要性。
本書的編著試圖符合前述企業與學術界對於商學院統計學內容的共識之要求,主旨在於嘗試達成如下三大目標:
讓學生能應用和解讀各式各樣統計方法的結果所隱涵的意義。
讓學生能瞭解諸如抽樣、實驗、變異性、機率分配、相關性、因果關係、信賴度以及顯著性等等基本統計概念。
讓學生對於報章、雜誌、電視等媒體,以及學術研究報告上許多有關統計資料分析與評估的報導,能有自我評斷和理解的能力。
雖然從常識的觀點來說,利用統計來解決問題應該遵循--問題設定;模式建立;資料蒐集;資料整理與分析以及表達等順序,然而本書的內容卻是以資料整理的方法作為起始點。理由是前兩個步驟牽涉許多統計技術的考量,對於一個未曾接觸過統計學的新手而言,不易理解和上手。本書共分為3個單元: 統計資料分析; 基本機率分配;以及統計推論等部分。
本書的特色至少包括如下數項:
* 在各章適當的地方融入與日常生活經驗的概念。例如第七章機率的緒言。
* 每章開始都圖示內容摘要,以利初學者掌握該章的重點。
* 在各章適當地方,穿插相關「知識加油站」或「輕鬆休息站」的內容,提升教科書的趣味性。
* 每頁重點的地方有「強化學習」,提升學生的注意力,或是教師考試的題目參考。
* 示範如何利用EXCEL 計算題目,減輕學生計算的負擔,讓學生能轉而注重結果的解讀。
編者期望學生於修完本課程後,能夠具備如下的能力:
* 體認統計推理在工作和日常生活上的重要性。
* 面對問題時,辨認在某種狀況下的基本統計假設。
* 知道應挑選何種適當統計工具以解決手頭上的統計問題。
* 看到統計調查結果能夠解讀其中意義。
總而言之,本教材的內容來自編者多年多方面的蒐集與累積,編著時的重心在於統計基本觀念的詮釋解說,並未刻意侷限例題為理工、管理或農業。期望任何科系的學生都能適用。但願這種作法不至於落入伊索寓言中「父子騎驢」故事的窘境。
最後,編者衷心期盼初學者在上統計學的當天,夜晚臨睡前,躺在床上,能夠靜心思索,務使當天所學的統計理論中種種內容,與先前所學相連結,有如一道清澈的溪水,緩緩的在心中流過,清可見底,更無半分渣滓。同時在學習統計的過程中,能夠不時回顧第一章的內容,牢記學習統計學的意義,體會統計學的思考邏輯。子曰:「學而不思則罔,思而不學則殆」,切記,切記。
在資訊爆炸氾濫的21 世紀,每天翻開各種報章雜誌,各式各樣的統計資料隨處呈現眼前。這是因為籠統地說,統計學的理論和方法與人類活動的各種領域多少都有不同程度上的關聯。由於任何領域內的活動都離不開資料,都有如何收集和分析資料的考量,因此也就讓統計方法有了用武之地。以下隨意舉一些例子就足以說明上述事實。 工業方面:當公司想要生產一種新產品,在研發過程中,首先有設計的構思,包括原料和生產製造條件的選訂,都要通過從大量可能的條件組合中,通過分析實驗結果來選擇,可能的條件組合很多,選擇哪一部分去做實驗是一個很有講究的問題,統計學中的實驗設計(experimental design)就是研究如何在盡可能少的試驗次數之下,達到盡可能高效率的分析結果的方法。農業方面:解決有關選種、栽種條件、肥料選擇等一系列的問題,也都與統計方法的應用有關。醫學方面:人體變異是一個重要的因素,每個人的狀況各有不同,例如人人對各種藥物和治療方法的反應就各不相同。所以,對一種藥物和治療方法的評價,是一種統計性規律的問題。因此先進國家核准一種新藥的上市和一種治療方法之前,都設定了很嚴格的實驗和統計檢驗的要求。其他諸如關於吸煙、飲酒之類許多生活習慣,或是環境污染對健康的影響的探究,都要通過收集大量資料進行統計分析來研究。其他關於社會現象的研究大量地使用統計方法,因為組成社會的單元人、家庭、單位、地區等,都有很大的變異性,因此只能從統計的角度去考察。事實上,社會科學方面的研究往往必須借助抽樣調查,並通過複雜的統計分析得出的結果。如今,抽樣調查已經成為研究社會現象的一種最有力的工具,因為全面調查往往不可行,而抽樣調查,從其方案的制定到資料的分析,都是以統計學的理論和方法為基礎。
換句話說,統計學是在有變異的資料中研究和發現統計規律的科學。因此無論是統計學的初等應用:如何收集資料、作圖列表,交叉分析之類;或者高級應用:建構模型,解釋現象,從而得到實務上或科學上的意義;透過資料的整理,從中解讀資料背後所代表的趨勢、基型或分配以及相關性等「有意義的訊息」,以瞭解資訊涵意,或轉換資訊為知識,甚至如何更進一步化知識為智慧已成為如今知識時代的國民不可或缺的能力。
根據編者手頭上的資顯示,早在 1980年代,無論是美國的教育機構如The Association to Advance Collegiate Schools of Business(AACSB)或是美國教育界的專家學者的研究報告,例如,由 L.W. Porter及 L.E. McKibbon合著的《Management Education and Development》(New York, McGraw-Hill, 1988),無不都強調數量方法對於管理教育的重要性,同時建議管理學院(商學院)相關科系必須將統計學列為必修課程。然而臺灣的大學生對於這種課程設計卻不領情,他們之中有許多自小學開始,就一直對於數量相關的課程深感頭痛。這三門都是學生認為很難過關的課程。因此不知何時開始,管理學院的學生之間以流傳著令人頭痛的三「記」的「冷笑話」來自我調侃:「經濟學是『經常忘記』、統計學是『通通忘記』、會計學是『快快忘記』」。其實不是學生不想記,而是教科書沒能提供學生適當的方式或學生不知如何記。很多以研究為傲的學者認為教科書的編著,只不過是把前人累積的知識設法作一個表達的雕蟲小技而已,但是如何將既有知識的素材去蕪存菁,重新組織,讓學生容易掌握內容核心,仍有賴編者的匠心獨運。正如大廚之於烹飪,如何化素材為美味佳餚供顧客品嚐,並非人人都會是一樣的道理。其實研究是發掘未知,而編書則是向下扎根,將既有知識傳承下來,兩者意義不同,不可偏廢。
美國統計學家杭特(J. S. Hunter)曾說:「現代統計不僅是一套工具和計算規則,統計是一種語言,用以創造和溝通數量概念和想法的媒介。」相對於其他數量方法的內容,在統計學中,讀者將會發現統計學會用到諸如「堅強的證據顯示……」或「根據所蒐集的數據,我們有95%的信心,結論是……」等等的措詞,而非諸如代數中「答案是……」或幾何中「……因此得證」之類的話語。事實上,各種數學都是利用特有的符號表達問題中的意義,以建立模式(modelling)的方式,能夠將問題精要的表達出來,然後透過特有的推論邏輯溝通,解決問題,統計也不例外。Jonathan D. Cryer 與Robert B.Miller 在兩人合著的《Statistics for Business: Data Analysis and Modelling》(Boston, PWS-KENT,1995)一書的序言中提到「在1986-1990 期間的一系列年度大會中,企業與學術界的成員們聚在一起交換關於提升商學院(schools of business)中統計課程的效果的看法,得到如下幾點的共識:
* 統計技術的訓練雖屬必要,但是對於必須利用統計思維以制訂決策的人士而言,僅有技術並不足夠;利用統計技術之前,仍需具備問題辨識與問題建構的能力。
* 統計使用者必須在解決問題的科學方法上加強訓練,而非在統計數學的情境上訓練。
* 訓練必須強調複雜問題解決的跨學域本質,以及在溝通上使用共同瞭解的詞彙的重要性。
本書的編著試圖符合前述企業與學術界對於商學院統計學內容的共識之要求,主旨在於嘗試達成如下三大目標:
讓學生能應用和解讀各式各樣統計方法的結果所隱涵的意義。
讓學生能瞭解諸如抽樣、實驗、變異性、機率分配、相關性、因果關係、信賴度以及顯著性等等基本統計概念。
讓學生對於報章、雜誌、電視等媒體,以及學術研究報告上許多有關統計資料分析與評估的報導,能有自我評斷和理解的能力。
雖然從常識的觀點來說,利用統計來解決問題應該遵循--問題設定;模式建立;資料蒐集;資料整理與分析以及表達等順序,然而本書的內容卻是以資料整理的方法作為起始點。理由是前兩個步驟牽涉許多統計技術的考量,對於一個未曾接觸過統計學的新手而言,不易理解和上手。本書共分為3個單元: 統計資料分析; 基本機率分配;以及統計推論等部分。
本書的特色至少包括如下數項:
* 在各章適當的地方融入與日常生活經驗的概念。例如第七章機率的緒言。
* 每章開始都圖示內容摘要,以利初學者掌握該章的重點。
* 在各章適當地方,穿插相關「知識加油站」或「輕鬆休息站」的內容,提升教科書的趣味性。
* 每頁重點的地方有「強化學習」,提升學生的注意力,或是教師考試的題目參考。
* 示範如何利用EXCEL 計算題目,減輕學生計算的負擔,讓學生能轉而注重結果的解讀。
編者期望學生於修完本課程後,能夠具備如下的能力:
* 體認統計推理在工作和日常生活上的重要性。
* 面對問題時,辨認在某種狀況下的基本統計假設。
* 知道應挑選何種適當統計工具以解決手頭上的統計問題。
* 看到統計調查結果能夠解讀其中意義。
總而言之,本教材的內容來自編者多年多方面的蒐集與累積,編著時的重心在於統計基本觀念的詮釋解說,並未刻意侷限例題為理工、管理或農業。期望任何科系的學生都能適用。但願這種作法不至於落入伊索寓言中「父子騎驢」故事的窘境。
最後,編者衷心期盼初學者在上統計學的當天,夜晚臨睡前,躺在床上,能夠靜心思索,務使當天所學的統計理論中種種內容,與先前所學相連結,有如一道清澈的溪水,緩緩的在心中流過,清可見底,更無半分渣滓。同時在學習統計的過程中,能夠不時回顧第一章的內容,牢記學習統計學的意義,體會統計學的思考邏輯。子曰:「學而不思則罔,思而不學則殆」,切記,切記。
留言