2016年3月28日 星期一

得到-統計-未來,統計學很有用

文章出處:未來,統計學很有用


統計學有什麼用?可能在大多數人看來,它就是個枯燥的跟數字打交道的學科而已。
會讀書寫字,會說英語,對生活還有點幫助,會統計學,有什麼用武之地呢?
但是你想過沒,倒退個幾十年,什麼開車,什麼電腦,也都沒有用。
所以,換個角度想,統計學,或許就是你進入下一個時代的入口。
那統計學到底有什麼用,怎麼用呢?
解讀版電子書《赤裸裸的統計學》的作者從書裡給我們做了一個總結。

我們先來說說統計學有什麼用。

第一,它可以協助警察來管理治安。 
《紐約時報》曾經有過這樣一篇報導:美國有個小鎮叫聖克魯斯,當地的警察局發現,
大多數暴力犯罪都是團伙作案,而且作案手法和作案時間都很有規律。
於是,他們就請來了兩位數學家、一位人類學家和一位刑事學家,
讓他們一起設計一套電腦程序來預測下一次犯罪的時間和地點。
結果這些人還真做成了這個程序,把以往的案例都輸進去之後,
果真就預測出:鬧市區的某個停車場即將有案件發生。
警方按照程序計算的時間趕到了這個停車場,
果然當場逮捕了兩個正在偷瞄車窗的女人,阻止了一起汽車盜竊案的發生。
這兩個人裡,一個是警察局的常客,另一個身上還帶著毒品。


第二,它可以給你的生活提供一些小竅門。
比如說,幫你快速找到一個商場的入口啊,幫你快速判斷一個學校裡學生的成績啊等等。
統計學裡有個概念叫正態分佈,意思是說,
數據的分佈就像一個鐘罩的形狀,總是兩邊低,中間高,大部分數據都在平均數附近。
那商場附近停著的車的數量也是呈正態分佈,
也就是說,正對商城入口的地方車最多,越往兩側,車的數量就越來越少。
所以,當你來到一家陌生的商場的時候,找到入口最快的方法就是哪車多就去哪。
那既然數據是對稱地分佈在平均值附近的,
如果你想知道一個學校所有學生的平均成績,
只需要掌握正確的樣本抽樣方法,選對100個人,就能算出所有學生的平均成績了。


第三,它可以協助醫學找出病因
比如說自閉症。以往的各種調查研究都把自閉症的原因指向什麼超聲波、疫苗啊等等。
但是統計學發現,跟這些原因相比,自閉症跟大腦的腦容量關係更密切。
研究人員經過統計發現,自閉症兒童的腦容量幾乎​​要比一般兒童高出10%。
所以說,自閉症很可能就是腦容量的差異造成的。


但是,統計學也是把雙刃劍。大多數人都有這樣一個認知:精確的就是準確的。
統計學都是數字,數字那麼精確,那統計學就應該可信。
但事實是,如果你沒有抓對數據的要義,就很可能被它騙。
馬克吐溫說過這樣一句話,“謊言有三種:謊言、該死的謊言,以及統計學”。
下面就說說統計學是怎麼欺騙我們的。

先舉個例子。如果我跟你說,今年國家稅收裡,
用來支持肺結核養老院的金額比例上升了527%,你的第一反應肯定是,怎麼給這麼多錢!
我要抗議!但是我告訴你,實際增長的數額連一個三明治都買不來。
之所以會出現增長527%,是因為原來的基數實在是太小了。
再有,說美國2013年軍費開支增長了4%。 4%不多吧,
但是考慮到基數是7000億美元,4%就是280億美元,
這比NASA的全部預算還要多,相當於美國勞工部和財政部預算的總和。
所以說,如果你單看統計學的的某個數字,很可能是片面的,甚至是有欺騙性的。
下次,如果你的老闆跟你說,“新一年每人將加薪10%”,
你心裡要明白,老闆增加的薪水很可能是你的20倍哦。

再舉個例子。一家酒吧里坐著10位顧客,他們的年收入都是3.5萬美元,平均下來還是3.5萬。
這個時候,比爾·蓋茨走了進來。
假設蓋茨當時的年收入是10億美元的話,
這個酒吧裡顧客的平均年收入就上升到了9100萬美元。
但是你會發現,這9100萬根本不能代表這些人的收入水平。
所以說,我們雖然最愛關注平均數,但是很多時候,平均數是有迷惑性的。
那平均數不靈的時候怎麼辦呢?可以看中位數,也就是這組數字裡佔中間位置的那個數。
在這個例子裡,這群顧客年收入的中位數就還是3.5萬美元,
顯然,這個數字更能代表他們的收入水平。

你看,統計學其實有點像經濟學,學了之後可能沒有立竿見影的效果,
但是它能給你提供一種看問題的思辨的視角,讓你離真實的世界更近一點。

本文源自:解讀版電子書《赤裸裸的統計學》
稿:羅雪
轉載:得到

沒有留言:

張貼留言