[書摘] 統計,讓數字說話
必讀指數:★☆☆☆☆(如果你一點都不喜歡數學的話)
好書指數: ★★★★☆(淺顯易懂,歷久彌新的好書)
今天介紹的書是一本老書,1998年出版的天下文化科普系列,至今已有16年了。但如果你只是想要對統計學有膚粗淺的認識,那這本書算是相當優良的教材,你不需要任何數學的先備知識,只要懂基本的加減乘除就可以了。
看完這本書你可以得到什麼?
了解非常粗淺的統計學知識、填問卷時可以問訪問者一些專業的問題、和朋友炫耀我是個有在讀科普讀物的人。獲得一些1998年代的常識聊天時可以唬爛朋友。
大意
全書分為六個小節,分別是樣本、實驗、量度,以及分佈、關聯、指數。最後還有一章探討機率
樣本
統計學的根基就是抽樣,抽樣抽不好,就像大樓根基沒打好一樣。因此學會「正確的抽樣」是非常重要的。本書會教你如何分辨什麼是好數據、什麼樣的統計設計可以產生好數據、以及哪些陷阱可能會造成數據不可靠。
你可以獲得的小常識:
- SRS的意思是「簡單隨機樣本」,Simple Random Sample 。
- 樣本統計量的精確性是由樣本大小決定,而不是母體大小決定,只要要求同樣的精確的,就得抽相同大小的SRS。
- 了解偏差與欠精確的差別
- 如何增加SRS的精確度?什麼叫做95%的信心水準?
- 相信一個統計調查結果前,你應該問的問題:
- 調查是誰做的?政黨問的或專業機構問的結果會不一樣 母體是什麼?是想要尋求哪些人的意見? 樣本是怎麼被選的?有沒有作到真正隨機? 樣本多大?如果不夠大的話,就不夠精確應答率多少?原來預定的受訪對象有多少人真的提供了資訊 用什麼方式聯絡受訪者?電話?面對面?網路問卷? 調查是什麼時候做的?會不會剛好在一個可能影響結果的事件發生後? 問題確實是怎麼問的?會不會影響到受訪者的回答?
實驗
你可以獲得的小常識:
- 學到安慰劑實驗如何讓胃冷凍療法失去科學上的意義
- 實驗的結果要有統計顯著性,也就是靠隨機產生這樣的結果的機率很小時,才有意義
- 知道什 麼是霍桑效應,可以應用在你的生活上(?)
- 第三煞車燈的小故事
- 愛滋病新藥的道德議題,應不應該繞過傳統隨機臨床話的實驗,來准許病患使用未經謹慎評估的療法呢?
量度
你可以獲得的小常識:
- 和朋友討論定義「什麼叫做失業?」,該如何做「失業率調查」,你得出的調查結果到底有什麼意義?例如一個人必須要有什麼樣的行為,才能算是找工作呢?一星期要工作多少小時才算是全職工作?沒有準備就業的人、學生算不算勞動人口呢?
- 請小心定義你的量度,盡量不要隨時間改變,否則會造成困擾,像是你改變對失業量度的標準,政府就會靠背你,你改變對愛滋的定義,疾病管制局也會靠背你。
- IQ測驗到底有沒有效呢?智力這種複雜的性質真的可以度量嗎?
- 永遠要問:「資料是怎麼產生的?」「所度量的到底是什麼?」
- 小心假數字,假數字可能會過度精確或過有規律,另外要小心自發性回應樣本,那對你人生一點幫助都沒有。
分佈
你可以獲得的小常識:
- 知道什麼叫做「莖葉圖」,我以前從來沒有聽過這種東西。小心不要打成精液圖。
- 知道什麼是標準差、什麼是變異數,但這本書還是沒解釋為什麼要把差平方除以n-1而不是除以n,這個問題幾乎可以列為這一生一定要搞懂的答案之一了。
- 常態曲線這個專有名詞在1783年首次出現。
關聯
你可以獲得的小常識:
- 了解小常識:「辛普森悖論」,以後聊天時可以不經意的說出來假裝自己很厲害。
- 面臨複雜的狀況,潛在影響結果的變因很多時,不要對關聯太快下結論
- 了解相關係數r,但是你還是不懂為什麼要除以n-1。
- 對最小平方回歸直線有粗淺的認識
- 「相關」不代表「因果」
指數
你可以獲得的小常識 :
- 了解指數的定義「變數值/基期值*100 = 指數」
- 消費者物價指數(CPI)背後的意義
- 1960年代早期,有個有趣的預測美國總統的方法,那就是猜測姓氏字母比較多的候選人會當選。1876~1960這個方法只失敗過1次。
機率
- 了解什麼叫做independent
- 破除短期機率的迷思,擲銅板出現「正反正反反正」和「正正正反反反」的機率一樣大
- 理解「將一個公正的銅板值很多次後,正面出現的比率會接近1/2」和「將一個公正的銅板值很多次後,正面出現的次數會接近總次數的1/2」講的是完全不同的兩件事,而前者是對的,後者是錯的。
總結
這是一本非常,非常,非常,淺顯易懂的好書。可以幫助你補充很多無用的小常識。對於理工科的學生而言, 這本書大概一點幫助都沒有,建議你可以直接從「統計學課本」下手。