跳到主要內容

統計學界的畢卡索-杜奇

把統計學家和藝術家相提並論似乎有點不搭調,尤其與藝術怪傑畢卡索一同評論更不免要令人對於杜奇感到好奇,到底他是何方神聖,有多少能耐,足以與畢卡索並駕齊驅?
杜奇(John Tukey)在1915年誕生於麻薩諸塞州的紐貝德福(New Bedford),父母親很早就發覺他資賦優異,因此把他留在家裡自己教導,直到他進入布朗大學(Brown University)為止。他在布朗大學拿到化學學士與碩士學位,但是後來被抽象數學吸引,因此,進入普林斯頓大學進修數學,並於1939年榮獲數學博士學位。一開始,他的研究領域是拓樸學(topology)。杜奇深入研究之後,提出杜奇引理(Tukey's lemma),成為他對這個領域的主要貢獻。
然而杜奇注定了無法一直留在抽象數學領域。普林斯敦大學數學系的威爾克斯(Samuel S. Wilks)教授一直勸誘學生和年輕的教授踏入數理統計界,杜奇也受到感召。得到博士學位後,杜奇留在數學系當講師,而在獲得博士學位之前的1938年,他就發表了數理統計方面的第一篇論文。後來到了1944年,他發表的論文幾乎全屬數理統計領域的研究。
在二次大戰期間,杜奇加入火砲控制研究辦公室,研究槍砲瞄準、測距儀等與大砲有關的問題。於此時所接觸到統計上的實際問題,亦作為其往後的研究題目,
同時也讓他對實際問題的特質有了充分的體認。他常用精闢的格言來總結重要的經驗,其中以「對正確的問題有個近似的答案,勝過對錯的問題有精確的答案。」最為人們所熟知。
話說20世紀初,畫壇出現了一位多才多藝的大師畢卡索,其作品風格千變萬化,總是引起大家的驚嘆。包括單彩作畫(如藍色時期、粉紅色時期)、立體主義、古典主義形式,以及雕塑。畢卡索每次的風格蛻變,都對藝術界造成革命性的影響,其他人只能緊追在後打轉,探索他的作品。
杜奇的研究成就亦如同畢卡索一般的多釆多姿。例如,在1960年代,杜奇發現,就算不使用任何機率模型,還是可以將觀測數據的分配當作一個機率分配來檢驗。結果,他發表了一連串的論文,也參加很多場討論會,最後還寫了幾本專書,談的就是他稱之為「探索性資料分析」的方法。在研究這個問題的時候,他採用了一種十分原創的形式來發表;就是直接檢驗數據本身所展現的模式或型態。他還研究了極值對人們能否觀測到模式的影響力,而且為了調整這個假象,他更發展出一套繪圖工具來表示數據。杜奇提議將分配的中央區域繪成一個長方形的盒子,再將極值畫成由盒子延伸出去的線段,他稱這些線段為「鬚」(whisker),這種圖稱為盒鬚圖(box-whisker plot),或盒形圖。
上述這些例子都只是杜奇的一部分成就。就像畢卡索,從立體主義到古典主義再到雕塑,杜奇在20世紀後半,悠遊於統計學的各個領域。從時間序列(time series)、線性模型,到費雪一些已被人遺忘的研究推廣,再進一步到穩健估計(robust estimation),及探索性資料分析。他出身於數學的深奧理論,而後開始思考一些實際問題,最後則研究一些沒有特定結構的資料分析。在他的研究所到之處,統計學的面貌會變得和以前完全不一樣。杜奇逝世於2000年夏天,享年86歲。
張貼留言

這個網誌中的熱門文章

轉載《再別康橋》 賞析

《再別康橋》賞析
作者: 徐志摩


輕輕的我走了,
正如我輕輕的來;
我輕輕的招手,
作別西天的雲彩。

那河畔的金柳,
是夕陽中的新娘;
波光裡的豔影,
在我的心頭蕩漾。

軟泥上的青荇,
油油的在水底招搖;
在康河的柔波裡,
我甘心做一條水草!

那榆蔭下的一潭,
不是清泉,
是天上虹;

陳琳 古詩《飲馬長城窟行》漫談

飲馬長城窟,水寒傷馬骨。
往謂長城吏,慎莫稽留太原卒﹗
官作自有程,舉筑諧汝聲﹗
男兒寧當格鬥死,何能怫郁(ㄈㄨˊ ㄩˋ)筑長城。

長城何連連,連連三千里。
邊城多健少,內舍多寡婦。

作書與內舍,便嫁莫留住。
善待新姑嫜,時時念我故夫子﹗

報書往邊地,君今出語一何鄙﹖
身在禍難中,何為稽留他家子﹖
生男慎莫舉,生女哺用脯。
君獨不見長城下,死人骸骨相撐拄。
結髮行事君,慊慊心意關。
明知邊地苦,賤妾何能久自全﹖

語譯
  第一層(1—8句),寫築城役卒與長城吏的對話:
  讓馬飲水,只得到那長城下山石間的泉眼,那裡的水是那麼的冰冷,都冷傷透及馬骨頭裡。
  一位築城役卒跑去對監修長城的官吏懇求說:你們千萬不要長時間的滯留我們這些來自太原的役卒啊!

白居易的《花非花》究竟是什麽意思

花非花,霧非霧。夜半來,天明去。來如春夢不多時,去似朝雲無覓處。這首唐代著名詩人白居易的《花非花》在五十多年前我讀書的時候就已經於音樂課中學過,至今還沒忘記它的旋律。不過對於詞句的意思卻是不甚了了。最近我著迷台詩宋詞的學習,上網查這首詩的翻譯,發現有多家不同的解讀,詩人的《花非花》到底想說什麼呢?感到十分有趣,特將結果整理與同好分享。
白居易詩不僅以語言淺近著稱,其意境亦多顯露,但這首《花非花》卻句式奇特,且通篇取譬,十分含蓄,甚至迷離,堪稱是中國文學史上最早的朦朧詩的代表,在白詩中確乎是一個特例。因此對於這首詩到底想表達甚麼,充滿好奇。詩取前三字爲題,近乎“無題”。首二句應讀作“花——非花,霧——非霧”,先就給人一種捉摸不定的感覺。“非花”、“非霧”均系否定,卻包含一個不言而喻的前提:似花、似霧。因此可以說,這是兩個靈巧的比喻。語意雙關,富有朦朧美是這首小詞的最大特點。霧、春夢、朝雲,這幾個意象都是朦朧、飄渺的,意象之間又故意省略了銜接,顯出較大的跳躍性,文字空靈,精煉,使人咀嚼不盡,顯示了詩人不凡的藝術功力。但是,從“夜半來,天明去”的敘寫,可知這裏取喻於花與霧,在於比方所詠之物的短暫易逝,難持長久。如果單看“夜半來,天明去”,頗使讀者疑心是在說夢。但從下句“來如春夢”四字,可見又不然了。“夢”原來也是一比。這裏“來”、“去”二字,在音情上有承上啓下作用,由此生發出兩個新鮮比喻。“夜半來”者春夢也,春夢雖美卻短暫,於是引出一問:“來如春夢幾多時?”“天明”見者朝霞也,雲霞雖美卻易幻滅,於是引出一歎:“去似朝雲無覓處”。
  有人主張這首詞通篇都是隱語,主題當是詠官妓。當時各級官府都有一定數目的官妓,供那些官僚們驅使。首句“花非花”是說官妓的容顏如花,但又並非真花。次句“霧非霧”中“霧”字是雙關。借“霧”為“婺”。“婺女”即女宿星。因官妓女性,上應女宿,但又並非雲霧之霧。
“夜半來,天明去”既是詠星,也是說人。語意雙關,而主要是說人。唐宋時代旅客招妓女伴宿,都是夜半才來,黎明即去。因此,她來的時間不多,旅客宛如做了一個春夢。她去了之後,就像清晨的雲,消散得無影無蹤。官妓不同于一般的妓女,更不同于正式的妻子,她們與官僚之間互為依存,但關係又不便十分密切,只能以夜來明去為限,可謂會短別長。元稹有一首詩《夢昔時》,記他在夢中重會一個女子,有句云:“夜半初得處,天明臨去時。”…