2015年1月6日 星期二

評論「IoT 和 Big Data 商機的迷思」

其實這些媒體寵兒Buzzwords,例如Big Data & IoT,都是決策輔助工具被神格化的結果,一個是分析工具(Big Data),一個是採樣工具(IoT)。


謝昆霖Sir的理解是正確的,作者Ben Jai在底下「IoT 和 Big Data 商機的迷思」文章中也說得極好,我們應該關切的重點是如何理解問題的本質或根源,就是搞懂你到底想解決什麼問題。也就是說,應該先確定目標而何,與理解問題的根本成因,再來找適當的工具,尋找適當的解決方法,...


假如你不是這個領域的專家,沒有Domain Knowledge,餵給你再多分析好的資料也沒用,你也不能調整那些分析工具進行有意義的探索,因為你根本看不懂它在分析什麼,也看不出來竅門與關鍵值,...

所以,
工具不重要,手段也有很多種,你要達到的目的與所欲取得的效果才重要。而且,你是不是那個問題領域的專家,和你使用的工具的好壞,其實根本沒那麼大的關係。


Ben Jai 寫了篇新的網誌文章: IoT 和 Big Data 商機的迷思.

最近這幾年很多人聽到這兩個話題就覺得很有商機, 但商機在哪裡?
IoT 裡面的組成可以分成四個層級:
  1. 最下層的 device: 如何在每一個 device 上加上 sensor, 來製造 data source.  台灣硬體廠想的多半是這一層, 但這是利潤非常低的一個行業.
  2. 上來的 communication protocol: 這是把所有 data 收集起來的必要工具, 但沒有人能靠 protocol 賺錢.  有了 QualComm 3G 標準的例子在前面, 沒有人會再同意使用一個要付錢的 protocol.  這只會是一個像 TCP/IP 一樣的地位.
  3. 再上來的 data warehousing: 這是一個重頭戲, 所有的 data 要如何儲存, 以及系統能提供什麼樣的工具來讓你分析這些 data.  在 IoT 中這也是和 big data 產生關連的地方.  但有些人以為 big data 就是用 Hadoop 架一個系統.  這種想法就像三十年前有人認為學電腦就是買一台 Apple II clone 一樣.  還有一些聳動的標題出來 (我不標連結, 以免幫深度不夠的文章製造流量).  感謝學弟洪士灝先寫了一篇評論 (http://hungsh-ntucsie.blogspot.tw/2013/04/big-data.html), 我就不用多費事了.  Hadoop 這一類的工具只是讓你可以開始存這些 data, 以及開始寫分析程式.  就像你買了一套 Oracle 回來, 還是要自己制定 data schema 和寫 (或買) SQL 程式, 你的公司才會有人資系統, 會計系統等等.  所以真正重要的是...
  4. 最上層的 business intelligence: 這些 data 中到底有什麼有用的資訊在裡面?  有了這些資訊之後有能用它們來做什麼事?  這一方面就需要非常深厚的 domain knowledge 才能做到.  重點不是用什麼樣的工具, 而是應用領域的專家夠不夠.  很多業主以為挖了一個某大顧問集團的高級主管就可以做這一行了, 事實上人家背後龐大的顧問團你沒看到, 事後才抱怨好像花錢請人沒有發揮效用.  台廠是沒辦法在這一方面跟人家競爭的, 最好也只能選定一兩個領域, 集中開發.  不過如果有個五十一百家公司各自有自己的專長, 全台灣湊起來可能就有得拼了.
之前有一家國際大廠來談 IoT 的合作.  簡報完之後敝公司一位非常厲害的資深副總 (1) 提了一個問題, 一刀切中要害: "你們說可以技術轉移給我們, 請問這四層技術中有哪些是你們會保留的?  有哪些是會轉移給我們的?"  這位外商的高層技術主管大方地說: "大部份都可以轉移, 我們只保留一小部分."  這位副總當然不能輕易讓他混過去, 又再追問: "保留哪一部分?"  對方尷尬地說: "我們只保留 BI."  事實上就是利潤最高, 最賺錢的部分.  後來經濟部一位很認真把關的事務官 (2) 告訴我, 這家外商跟政府要錢設立 IoT 研發中心要不到, 就希望有台廠幫他背書, 以尋求掩護.  所以我後來才寫了那篇 "外商來台設立研發中心, 還要政府補助? 門兒都沒有!".
https://www.facebook.com/notes/ben-jai/%E5%A4%96%E5%95%86%E4%BE%86%E5%8F%B0%E8%A8%AD%E7%AB%8B%E7%A0%94%E7%99%BC%E4%B8%AD%E5%BF%83-%E9%82%84%E8%A6%81%E6%94%BF%E5%BA%9C%E8%A3%9C%E5%8A%A9-%E9%96%80%E5%85%92%E9%83%BD%E6%B2%92%E6%9C%89/10151146171924113

想要做 big data 的人請先認清楚: 什麼是 data?
  • 存得起來的, 就是 storage.
  • 看得到的, 才是 data.
  • 看得懂的, 叫做 information.
  • 用得出來的, 才能稱為 intelligence.
Big data 這個名字事實上是有點誤導.  真正賺錢的, 是從 big data 中萃取出來的 big intelligence.  為什麼 CIA 叫作 Central Intelligence Agency, 而不是 Central Information Agency 或 Central Data Agency?  而萃取 information 和 intelligence 的技術並不是現在才有的.  隨便問一個有水準的資訊/資工系教授, 就會告訴你 data mining, neural network, pattern recognition, statistical machine translation, information retrieval, ... 等等領域的歷史.  這些才是困難而需要投資開發的領域, 而不是一個簡單的大量儲存和平行運算系統.

希望我們台灣的企業主能認清這些技術的本質, 作出正確的投資.  不止是金錢, 更重要的是人力.  不要跟著沒水準的記者起舞, 而浪費了台灣寶貴的年輕人力資源.



註:
(1) 對! 台灣現有產業主管還是有很多有眼光和遠見的.  年輕人不要隨便看不起人家, 以為人家都跟不上時代.
(2) 對! 我們政府官員還是有很多有水準又認真做事的!