2016年11月26日 星期六

❤得到-科技-大數據是全新材料而不是高科技

文章出處:大數據是全新材料而不是高科技


這條音頻和你說說一位大數據專家對大數據的最新解讀。

我們知道,今天大數據的應用越來越廣泛了,
不管是用來預測總統選舉,還是在雙十一的時候給你推送各種商品,
大數據已經從各個方面改變了我們的生活。
最近,前阿里巴巴集團副總裁、阿里巴巴集團數據委員會會長車品覺,
接受了上海市科學學研究所副研究員李輝的採訪。
在採訪中,車品覺說,大數據是一種全新的材料,而不是另外一種高科技。
所以我們在考慮問題的時候,要從本質上,從體系上來思考大數據。
車品覺從三個方面解釋了他的看法。


第一,車品覺說,大數據時代,最重要的是關聯。
因為大數據和以前的數據不一樣,首先就是很多數據不是你自己蒐集來的,
所以你需要有一個對外部數據的認知,儘管你自己的數據有時候已經足夠大了,
但還是要把別人的數據“關聯”在你自己的數據中。
這是和過去最不一樣的,過去的數據是封閉的,但今天我們一定要和外部的數據關聯。

比如說,打車軟件告訴你,從公司打車到家要45分鐘,但你有急事,想在半小時之內到家。
於是你發現,可以先打車到一個地鐵站,然後坐地鐵回家,這樣半小時就能到了。
解決問題的原因,就是你必須關聯第三方數據,不只是出租車的,還有地鐵的。
所以大數據的起點就是關聯第三方數據。
當第一方數據和第三方數據能很好地結合的時候,
我們對數據的分析就會有一種全新的理解。


第二,大數據還有一個特點,就是快。
因為大數據的這種關聯,讓中間環節需要人工判斷的地方減少了。
過去我們用數據去解決問題的時候,從“發生了什麼”,到最終“怎麼解決”,中間有很多環節。
隨著數據技術的發展,中間環節需要人工判斷的地方在逐漸減少。

當然,說大數據快,不是減少人手這麼簡單,
其實它是“兩秒鐘”的科技,意思是讓決策提高了兩秒鐘。
不要以為兩秒鐘很簡單,很多事情,勝負就是兩秒甚至兩毫秒的事。
比如說反恐,一個人從新加坡坐飛機到北京,
從上飛機開始,就已經開始和各種數據關聯了。關聯的速度越快,計算的時間就越充分。
據說美國在“9·11”之後,用了三年的時間拿到了一種快速計算的技術。
有了這種技術,一個人過了海關之後,只要用五分鐘,
就能計算出這個人有多大的概率是恐怖分子。
原因就在於,這個技術把你的數據和恐怖分子的數據進行了關聯和計算。

所以,從你進入海關的那一刻,之後不管你是在空中,
還是在陸地,計算機都在不斷關聯和計算你。從人臉識別到匹配全世界十幾億人數據,
如果你需要三個小時來計算,那肯定就完蛋了。
所以說大數據時代的快,也是建立在關聯的基礎上的。


第三,車品覺說,除了快,大數據想要創造價值,還涉及另外兩個問題,
就是“準確”,以及“過去的經驗”

“準確”是說數據要準確,比如自動駕駛對路上的人臉識別,
過去的準確率是90%,如果你能提高到95%,那就是一場革命,
很多過去實現不了的功能就能實現了。
 “過去的經驗”也就是可重複性,人從高處跳下去會不會死?
這是一個低概率事件,根本沒有重複性,因為人只有一條命。
所以我們喜歡看的是天天都有的數據,就是發生率非常高、重複率非常高的數據,
這樣的話,數據分析才有大用途。

以上就是大數據專家車品覺的最新觀點,供你參考。

本文源自:公眾號“三思派”(車品覺:我們正站在大數據帶來的整個創新生態的臨界點)音頻稿:亞平寧講述:成亞

------------
主旨:
1. 大數據時代,最重要的是關聯
 把別人的數據“關聯”在你自己的數據中。
 這是和過去最不一樣的,過去的數據是封閉的,但今天我們一定要和外部的數據關聯。
 比如說,打車軟件告訴你,從公司打車到家要45分鐘,

 但你有急事,想在半小時之內到家。
 於是你發現,可以先打車到一個地鐵站,然後坐地鐵回家,這樣半小時就能到了。
 解決問題的原因,就是你必須關聯第三方數據,不只是出租車的,還有地鐵的。
 所以大數據的起點就是關聯第三方數據。
 當第一方數據和第三方數據能很好地結合的時候,
 我們對數據的分析就會有一種全新的理解。
2. 特點就是快
 據說美國在“9·11”之後,用了三年的時間拿到了一種快速計算的技術。
 有了這種技術,一個人過了海關之後,只要用五分鐘,
 就能計算出這個人有多大的概率是恐怖分子。
 原因就在於,這個技術把你的數據和恐怖分子的數據進行了關聯和計算。
 所以,從你進入海關的那一刻,之後不管你是在空中,
 還是在陸地,計算機都在不斷關聯和計算你。從人臉識別到匹配全世界十幾億人數據,
 如果你需要三個小時來計算,那肯定就完蛋了。
 所以說大數據時代的快,也是建立在關聯的基礎上的。
3. “準確”,以及“過去的經驗”
 “準確”是說數據要準確,比如自動駕駛對路上的人臉識別,
 過去的準確率是90%,如果你能提高到95%,那就是一場革命,
 很多過去實現不了的功能就能實現了。
 “過去的經驗”也就是可重複性,人從高處跳下去會不會死?
 這是一個低概率事件,根本沒有重複性,因為人只有一條命。
 所以我們喜歡看的是天天都有的數據,就是發生率非常高、重複率非常高的數據,
 這樣的話,數據分析才有大用途。

沒有留言:

張貼留言