「大數據:巨量資料掀起生活、工作和思考方式的全面革新」讀後感徐承佑

按讚加入E河川-交流水知識粉絲團 

  發刊期數:第0101期/ 發布日期:2014/12/19

_pic

壹、前言

近年來資訊革命風起雲湧,隨著網路環境發達、雲端服務盛行及智慧型行動裝置之普及,大家都能感受世界在快速的變動中,而大數據即是未來資訊革命中衍生的後續效應,這股浪潮正在重塑我們的生活、工作和思考方式。

筆者現任職水利單位,綜理資訊(網路、雲端、資安、資料庫等建置管理)及監測站業務(轄區內各處水位、雨量及水質數據收集),本次特別選擇「大數據」這本書,不但發現其內涵恰與筆者業務性質有直接關連,而且讓我學到不少新觀念,也期望未來能將此相關知識運用在職場上。

本書作者麥爾荀伯格1-以淺顯易懂的文字,輔以大量的實際案例,深入淺出地提出大數據時代的三大新思維、價值、風險及解決之道。本報告首先摘要專書對大數據時代各視角分析,後提出個人之省思與心得,包括如何應用於公務體系及因應大數據時代的來臨,世人應自我提升之個人素養。


1.Viktor Mayer-Schönberger:牛津大學網路研究所教授,擔任微軟、世界經濟論壇等大公司和組織的顧問。大數據領域公認的權威,寫過八本書以及上百篇專論。


貳、專書摘要

本書開宗明義就舉例讓讀者迅速感受大數據的影響-美國官方傳統追蹤疫情擴散方式,乃靠蒐集醫師出診資料來推估,因一般民眾覺得身體不舒服,通常會過幾天才就醫,通報流程亦需時間,故掌握疫情速度仍慢了約1~2週;Google則發表了另一種追蹤方法,挑出美國最常使用的5,000萬個搜尋字詞,再與疾管局的流感傳播資料比對,嘗試套用4.5億的數值模型,發現可利用其中45個搜尋字眼(例如「止咳退燒」),搭配某數值模型,預測結果與官方資料極為相近,意即未來善用這套工具,可不用造訪醫院診所蒐集資料、採集檢體,僅利用每天數以億計的搜尋紀錄,就可精準且即時的掌握疫情擴散情況,並加以因應,如儘早發布警訊、隔離、調度醫療資源。

一、 3V與三大新思維

高納德集團分析員Doug Laney指出大數據有三個方向的挑戰和機遇,簡稱3V2:大數量(Volume,資料大小)、快速度(Velocity)與多樣性(Variety),筆者將此3V與書中所提大數據時代之三大新思維融合說明。

(一) 大數量(Volume)─資量龐「大」:

過去資料不足的時代,乃受成本與技術的限制,難以掌握全體資料,故僅能抽樣去推估母體的概況,但科技的進步,數據蒐集工具隨手可得,資料挖掘技術更臻成熟,『樣本=母數3』 已不再是夢,其將改變資料分析的哲學。大數據的「量」並非絕對、而是相對的概念,資料量並不一定非常龐大,重點在於「資料集」盡可能地完整。例如日本相撲比賽發現疑似有放水情況,研究完整六萬四千場的比賽紀錄,發現在某些季末或不重要的場次,強者反有比較高的敗率,加以分析是因選手必須要在每賽季取得過半勝場才能保留級別與收入,故已取得保留資格的強者有大比率在季末或不重要的比賽會「放水」作個人情,這些比賽的資料容量其實比一張相片還小,但因為資料完整,才能有別傳統抽樣方式察覺出這細微的現象,這就是大數據「量」的價值所在。

(二) 快速度(Velocity)─效率飛「快」:

仰賴現今科技及網路的發達,已大幅降低了資料輸入輸出的成本及速度,可更普及、更細微、更快速的蒐集、處理及利用數據。許多大數據應用,「效率」是核心需求,如前述掌握疫情的例子,必須要搶快才能拯救更多生命;談到效率,就必須學習接受『擁抱不精確4』的觀念,以筆者工作的經驗為例,傳統河川水位變化的調查,乃人工每週量測一筆水位數據,因人親自現場量測,資料可確保正確且無缺測情況,缺點是資料量甚少,然近年科技的進步,已改用自動監測儀器取代人工監測,但儀器一定會有偶發性異常,造成部分數據錯誤或缺測之情況,但長期來看,由於資料量夠多,異常比率相對很低的時候,這些異常並不會影響對水位變化的解讀(圖1),所以在大數據時代,我們為了獲得更多資訊,就必須犧牲一點點的精確性。

相關圖片

(三)多樣性(Variety)─種類繁「多」:

科技的進步,我們有能力蒐集更多項的資料,並記錄更多樣格式的資料,例如本書提到的文字(如Google 圖書掃描計畫)、位置(如Google Map)、互動(如Facebook、Twitter及Link In等5)等案例,其他還有聲音、影像及類比式訊號等結構化及非結構化資料6。當一切資料「數據化」後,除了更容易傳遞、複製、保存外,最重要的是可交互作更多樣化的分析。大數據時代的資料分析,將改變我們看待事物『不再拘泥因果關係』7,而是在更多樣化的資料中尋找出事物的模式及彼此的相關性,我們可能無法瞭解某件事情為何如此,但卻能夠知道事情正是如此。例如根據賣場發票大數據的分析,買尿布的人有極高的比率會一併買啤酒,對賣場經理而言,不一定需要知道為什麼會如此,只要知道正是如此,並作出決策-把尿布和啤酒放在一起賣就對了!


2.Douglas, Laney. 3D Data Management: Controlling Data Volume, Velocity and Variety. Gartner. [2001-02-06].

3.專書p.30(大數據新思維一)

4.專書p.48(大數據新思維二)

5.Facebook將關係數據化、Twitter將情感數據化,Link In將經歷數據化

6.結構化資料係可數字化的數據,可方便通過電腦和資料庫技術進行管理。無法完全數字化的信息稱為非結構化資料,如文檔文件、圖片、圖紙資料 、縮微膠片等。

7.專書p.72(大數據新思維三)


二、價值8

大數據時代正是以上述三種維度(Volume、Velocity、Variaty)產生爆炸性的增長,量變產生質變,大幅提昇了資料的價值(Value)。因資料屬於經濟學家所謂的「非競爭性商品」9,使用後不會有貶值的問題,故除了能夠為同樣的目的重複使用,也能為許多不同的目的而重複使用。要釋放資料的「選項價值」10,本書提出三種重要的方式:

(一) 重複使用資料:

最佳例子就是「搜尋字眼」,當初只是消費者和搜尋引擎的互動,用來產生了一串網站名稱的列表,以及相關的廣告罷了,但將這些資料重複使用,變成可以分析消費者的喜好,掌握經濟的脈動,搜尋字眼儼然變成一種經濟指標。

(二) 重新組合資料:

與其他的資料結合,靠著全新的方式混合資料,可以創造不同的價值。例如丹麥利用了三項原本使用目的全無交集的數據集-全國行動電話用戶、全國癌症病患名單及關於教育程度和人民所得資料,因這些資料均接近母數,可以很客觀的驗證手機的使用是否會提高罹癌風險。

(三) 讓資料買一送一:

促成資料再利用的方法之一,即是一開始就蒐集時即加入可延伸的設計,讓資料達到「一分錢兩分貨」的效果。例如Google街景車在路上趴趴走的時候,除了照相之外,同時蒐集GPS資料、檢查地圖資訊、甚至蒐集附近WIFI的名稱及信號強度,最後延伸到用來研發自動駕駛車輛等目的。


8.專書 p.145-154

9.非競爭性(Non-ricalrous):經某人的使用並不妨礙他人的使用

10.選項價值(Option value):非原本用途所產生的價值


三、 資料價值鏈11

根據巨量資料價值的不同來源,出現了數據、技術及思維三種關鍵角色,Google即是少數兼具此三種角色的先驅代表。大數據時代出現了一種新興的行業-「數據中間人」,他們會從各種地方搜集資料進行整合,然後再提取有用的資訊進行利用,一些中小企業,多以此型態成功發跡。

(一) 數據(擁有資料的人):

擁有大量資料或者至少可以收集到大量資料的公司,其所需要的人才包括資料收集、資料儲存、資料授權、資安管理等;資料可謂最核心的部分,是價值鏈的基礎。

(二) 技術(能分析資料的人):

通常是諮詢公司、技術供應商或分析公司。它們掌握了專業技能,其人才著重於開發資料蒐集及分析之軟硬體。

(三) 思維(能開創大數據價值的人):

對某些公司而言,技術跟資料並非成功主因,而在於有創新思維的人才,能提供挖掘資料新價值的獨特想法,早他人一步取得先機。這種角色很多都是外行人,因為他們的思想觀點更自由,不受到可能性的限制。


11.專書 p.177-184


四、風險12

(一) 隱私受損:

人民生活將越來越沒有隱私。筆者認為數位資料被竊取有兩大風險,第一是數位資料因可輕易複製、傳遞與重複使用,一旦被竊取即覆水難收,無法亡羊補牢,其二是數位資料不像實體物質可見,被竊取或被不當利用不一定可知,故人民將對自己資料的掌控權力越來越低。

(二) 根據習性的懲罰:

大數據時代很可能出現電影【關鍵報告】的情節,預測某人可能有犯罪的意象,而在付諸行動前就給予羈押或處罰,這種強行使用在不該使用的地方顯然違反了公平、正義和自由意志的理念。

(三) 資料獨裁:

陷入對資料分析的迷戀。例如Google為了設計網站的工具列要什麼顏色要用數據分析,徵才也要用數據分析,什麼東西都要用數據來決策,導致有工程師無法接受憤而離職。

(四) 麥納瑪拉謬誤:

數據的收集過程有問題。如果當權者堅持追求數據上的成就,那麼底下的有心人士很可能為了特殊目的而操弄假數據,依此作出的決策可能就很危險。


12.專書 p.214-237


五、 管控之道13

前述風險之本質,並非來自大數據,而是其運用者-「人」,故我們必須警惕,不宜過分依賴資料,要如何掌控大數據,而不被大數據掌控,作者整理了三大管控策略:

(一) 保障個資隱私:

並非要求人們同意他們的資料可供使用,而是讓資料使用者對自己的所作所為負責,因資料的再利用變得更普遍,責任的負擔將會從大眾轉移到使用者身上。

(二) 不依預測定罪:

社會必須重新調整對於正義的認知,法律也必須明確宣示人們只須為自己的實際所為負責,而不涉及傾向。那些能夠確保人類能動性14的法律,必須在司法系統中享有神聖的地位。

(三) 演算法的審查:

大數據時代將需要一種新型態的專業人士,專門檢驗資料來源的正當性,分析工具的適合性,以及結果解釋的合理性,以確保應用之正確性及有效性。


13.專書 p.255-256

14.能動性(human agency):人類出於自由意志而選擇其行動


參、見解與反思

一、 見解:傳統專家的影響力減弱

讀完本書收穫頗豐,激發出不少新的想法,如本書第七章所述「傳統專家讓位」乙節15,該文以「統計分析改變」之角度論述,因大數據時代統計學者能不受舊方法的拘束,不帶有任何偏見的巨量資料分析,將推翻過去專家的判斷模式。筆者則以「科技產品革新」之角度分享不同例子與觀點:

「專家」即比一般人具備更多專業知識或經驗,能短時間內掌握問題因果,分析並作出決策。傳統的攝影,在底片費用昂貴,無法重複拍攝的條件下,攝影師必須用專業知識及經驗,在短時間內構圖,決定對焦點、光圈及快門,方能拍出絕佳的照片,想像大數據時代的一個科技產品,把光場相機16加上HDR(同時拍不同曝光值之照片),再加上全景(超高畫素,拍大畫面細節仍然清楚)的技術,攝影師已不需要知道光圈及快門的關係,在當下直接按鈕拍下去就完成了,回到家裡慢慢決定要怎麼裁切合適的構圖,再決定對焦點及曝光值,即可輕鬆完成一張絕佳的照片,因資料已經可在短時間內全面地掌握,所以已無傳統專家需短時間內決策的壓力,從反面說,也是人人可以更輕鬆的入門成為專家的概念。

另一例是近年智能手環17的出現,目前主要用作計步器及睡眠偵測,現已有科學家正在研發體溫、心跳、血壓、血糖等能否用類似的裝置一併監測,當這些項目能用類似手錶的東西戴在手上即可隨時隨地監測變化,將比傳統到醫院才能檢測更全面掌握身體的變化狀況,未來勢必會開發出可預測身體的疾病的功能,達到預防勝於治療的效果,屆時,「智能手環+雲端分析軟體」就是最好的家庭醫生,人民對傳統醫生(專家)之依賴程度勢必會降低(表1)。

相關圖片

16.維基百科:http://goo.gl/95ekTE

17.互動百科:http://goo.gl/VEy7Sh

18.本例以《鶡冠子•世賢第十六》中扁鵲三兄弟的故事借喻不同時代醫療層次之變革


二、 反思:大數據是萬能的嗎?

大數據可謂人類在科技的一大躍進,它宛如雙面刃,在帶給人類更精準便捷資料處理的同時,大數據為誰所用?如何使用?皆可能帶來種種問題,茲就幾點可能產生的社會議題提出反思:

(一) 消費主義之擴張:淪為商業誘導之標的

在資本主義為基礎的全球化浪潮下,個人將在大數據的推波助瀾下,更加被捲入消費至上的漩渦。以借助廣大資料庫建立個人化的溝通服務「精準廣告」為例,當個人一舉一動包含消費行為、偏好、習慣等皆被掌握,企業能更加精準預測和控制消費者的需求及行為,而進一步誘導操弄,過去經濟供與需平衡的理想模型可能已脫離現實,因為擁有大數據的供應者將支配需求。

(二) 無限上綱的監控:個人自由隱私的喪失

當人人皆成為資料庫的分析數據,未來的生活彷若透明人,生活中大大小小面向皆無所遁形,因為當網路科技更加滲透生活食衣住行,我們行為的同時也被記錄與監控著。而越依賴科技的便利,越以犧牲自由和隱私為代價。

(三) 誰能掌握大數據:社會差距的激化

大數據的蒐集與應用需要龐大成本,通常僅有社會少數人能掌握,如大企業、政府等。新科技的掌握反映了原有的社會的分層,當大數據僅為少數人利益所用,將更激化原有社會的差距和對立。相形下,沒有大數據和更加反抗工具的個人,對於自己權益之受損更顯得深層的無力感。

(四) 無因果關係之推論:給人貼不適當的標籤

最近新聞嘉義市政府衛生局發布一份宣傳單19,其羅列28條簡易判斷學生可能染毒之指標(如喜愛搖滾樂及穿軍用夾克),有家長投訴指「根本是歧視!」,數據統計若不求兩者的因果關係,只求數據的關聯性,涉及到個人評價的分析很容易給人貼上不適當的標籤。

(五) 反思人類的意義:工具化的價值觀

若當電腦數據能精準預測分析人的各種行為,將重新挑戰人類根本價值觀,「人存在的意義為何?」,使得個人更喪失自主,更加流於工具化。除此,當一切皆由大數據中最大值和平均值主導,也使得非主流聲音和多元價值被消滅。


19.嘉義市政府衛生局103年暑期保護青少年「熱血反毒 青春起藝」藥物濫用防制宣導企劃案


肆、對公務員的啟示

筆者身為公務員,自應思考大數據與公務體系之間的關連,如何結合?如何因應?政府與民間企業之差異,在於政府握有最大的資源、最大的資料以及最大的權力。麥肯錫全球研究所報告20指出,政府在應用大數據面臨的困難最小,且從大數據的價值潛力及獲利幾乎是最大。政府必須擔任領頭羊的角色,先從高點規劃好政策布局,提昇相關的技術設備,最後是以「為國為民」宗旨推動相關的應用服務。以下是筆者提供的一些想法:

一、 政策面

(一) 確立大數據戰略地位:

未來國家競爭力將體現於一國擁有數據的規模、彈性及解讀運用的能力,故政府應儘速從內部部門、民間企業及社會機構、全體公民,點線面的思維建構出全新的公共治理藍圖。政府可以有以下三種具體作為:

1.促進國內外交流:大數據價值在於多樣化資料的整合運用,傳統時代各部門各自為政,數據分散在不同層級、不同部門或不同地域,成為所謂的「訊息孤島」,故政府內各部門必須要先充分交流,互相激盪,尋找新的利用可能性;此外,我國在大數據的運用上顯然是落後的國家,所以還要積極地向國外取經,從各國的案例中尋找適合我國的應用模式。

2.各部門制定戰略報告:當政府各部門已具備了大數據應有的思維,也汲取了國內外的經驗,各政府部門應就權責業務範圍提出大數據時代的戰略報告,例如環資部掌控最多環境資訊,應對其運用提出新的策略、交通部掌控最多交通資訊,也應該在其領域提出新的措施。

3.鼓勵競賽與數據共享:為鼓勵民間參與,創造數據共享或交易市場,並提升全民數據意識,政府應提供數據共享的獎勵措施,並舉辦相關應用競賽,鼓勵人才提供更多創新思維及先進技術。

(二) 提升大數據處理效能:

1.系統標準化:目前在形塑大數據之過程中,最大困擾是沒有標準化的系統架構,致使各單位均花了很多心力在彙整不同階段產生之數據,政府務必要及早推展各產業標準化作業,此為極重要的基礎建設,採用統一格式標準,統一的行政流程,統一的網路平台,方能達到事半功倍之效。

2.行政單純化:在公共管理上,政府必須要思考傳統的行政流程,有那些數據(例如行政表單)是可以更加智慧的蒐集,那些數據可以在各部門之間整合共享,簡化行政程序,避免資料的重複蒐集,降低不必要的蒐集頻率,以降低管理成本,也減輕人民的負擔。

3.作業高效化:政府擁有最大的公權力,應跨單位整合既有資源,投入同樣的成本能創造更多的效益,例如在市區公車上內建各種監測設備,以監測城市內的環境資訊,可達到移動式、即時性高的掌握整個城市每個角落的資訊。

(三) 健全大數據保護規範:

1.保護品質:從客觀實驗數據及主觀民意調查,政府一直以來都在利用數據決策並訂出政策,資料從蒐集到利用的過程好壞皆影響最終政策實行的成果。美國政府雖已立法「數據質量法」21,規範政府發布訊息及統計數據的質量、客觀性、實用性及完整性,但仍遭遇困難,例如根據某研究後發布「每天食鹽量低於1,500毫克,可降低一般人罹患高血壓的風險」訊息,影響了鹽產品的銷售,鹽業就依據「數據質量法」向政府提起訴訟,抗議1,500毫克這個數據並不可靠。此問題的困難在於很難規範誰有對數據的質量與分析結果有最終的裁量及解釋權;所以政府要如何訂定合理的審查機制以保障其品質,還要在決策中兼顧企業與人民的利益,是大數據時代政府愈發重要的課題。

2.保護價值:當資料從更多面向增值後,資料的價值就更難估計了,在大數據時代,一個合理的做法是,資料持有人授權都不是收取固定費用,而是收取利益的一定百分比,好比生科領域之智慧財產權協議,授權者有權利針對此而衍生的發明,要求後續的權利金,這樣各方都有重複使用資料的動機,能夠讓資料的價值最大化,未來亦可能發展多方交叉授權的常態,政府在這方面也必須有所規範。

3.保護人權:大數據包含大比例個人資料,未來無論告知或許可、對個資的模糊化及匿名化,這些保護策略都失效了,政府必須制定全新的制度規範,而非修改舊有規範的適用範圍,想要保護個人隱私就需要個人資料處理端對其政策和行為承擔更多的責任。同時,我們必須重新定義公正的概念,以確保人類的行為自由,避免不當歧視。另外也要向那些可能受害於大數據的人—因之被剝奪了工作、接受醫療或貸款權利的人,提供支援。


20.“Big data: The next frontier for innovation, competition, and productivity”(Mckinsey & Company, 2011)

21. Data Quality Act, (DQA),詳維基百科:http://goo.gl/Bjr0pQ


二、 技術面

(一) 培育專業人才:

在大資料處理環節中,資料科學家是能否點燃大資料價值的關鍵。然而,資料科學家的培養並不容易,因為資料科學家必須同時具備3個條件,包括深入瞭解內部的業務與組織、具備資料探勘等統計應用知識、熟悉資料分析工具操作。傳統的資料分析師較擅長的是處理已發生的問題,找出問題源頭,並且排除問題,相對缺乏發掘未知問題的能力。大數據的更大應用價值在於預測未來。因此,無論是從政府還是企業角度,都應未雨綢繆,提前做好大資料人才培養。

(二) 研發尖端科技:

大數據的蒐集、處理到應用,都會牽涉相關的軟硬體,政府或企業大概可從蒐集更快速使用更方便掌握更精準擴充更彈性服務更智能費用更便宜等六個方向投入資源研發,值得一提的是數據中心在當今雲端儲存與運算流行之下,所扮演的角色是越來越吃重,科技在節能的進步幅度,遠遠趕不上大數據時代爆炸性的耗能程度,如何壓低電力空調與空間成本,讓地球環境於大數據時代能永續經營,將是未來技術面最重要的挑戰。

(三) 結合網路社群:

大數據的傳遞,透過互聯網當屬效率最高的方法,如個人透過網路填報資料,城市裡各處監測設備也透過網路傳送資料,未來數據的蒐集將全面「物聯化22」;另外社群的力量不可小覷,一個著名的例子是Google的圖書數位化結合ReCAPTCHA計畫23,讓數以億計的網民在註冊帳號前,先看一小段歪七扭八的文字輸入辨識結果(原意是確認是真人而非網路機器人濫用服務),系統在背後蒐集眾人輸入的結果來判定文字的辨識結果,大家都沒想到當我們在填認證碼的同時,正在幫Google進行數位化書籍的工作吧!所以如何結合社群,善用眾人的力量,花小成本而創造高效益,也是政府必須思考的方向。


22. 把所有物品通過射頻識別等信息感測設備與互聯網連接起來,實現智能化識別和管理。

23. 維基百科:http://goo.gl/iigKqs。


三、 應用面

(一) 一體政府:

當政府已擁有大大小小的數據庫,資料必須要先整合才能提升其利用價值,整合資訊必須放下各單位之本位主義,以提升為民服務為戰略目標,例如美國有六個單位(如農業部、食品藥品管理局、消費者委員會等)涉及商品召回的管理工作,故建立一商品召回的平台讓民眾可以快速掌握相關資訊;又如筆者身為設籍台北市並於新北市工作之聽覺障礙者,如要購買助聽輔具,經多方查詢方知新北市勞工局及台北市社會局各有職務再設計與身心障礙者輔具費用的補助,筆者希冀未來政府能建構出整合跨縣市、跨單位並提供訊息的平台,方便民眾查詢,這就是「一體政府」的概念。

(二) 開放政府:

除了先將既有的資料整合並主動提供服務外,未來政府還必須要開放比現在更多的資料,我國雖已有「政府資料開放平台」24,但資料量仍太少,僅有約兩千個資料集,目前世界上最大的政府開放資料平台25在美國,已超過十萬個資料集,顯然我國仍有很大進步空間,主要差異在於我國各部會多停留在「政府資訊公開」而非「開放資料」的層次26。政府開放更多資料有以下優點:

1.減少弊案:充分的資料公開及共享,讓政府接受外部的監督與回饋,能更快速的發現管理問題,提高自身的工作效率,並促進各界的良性競爭。

2.刺激經濟:資訊的公開可降低人民消費資訊的不對稱,某種程度上可刺激人民經濟活動;另外開放資料讓民間投入開發,除了可以創造就業機會,也可以節省政府開發軟體的經費。

3.鼓勵創新:開放資料可讓商業、非營利機構、第三方能發揮創意開發更好的應用,從而為公部門創造利益,包括金錢及社會價值的獲利。

(三) 智能政府:

政府先將資料整合後,再開放資料結合企業的力量,最終目標就是達到「智能政府的目標」,其內涵符合美國企業家Tim O'Reilly提出的「政府2.0」27的概念,以人為本,通過政府、市場、社會的協同與互動,最大限度的呼應人民的需求,激發公共服務的活力並塑造新的公共價值。筆者以下列幾個角度來討論智能政府中政府服務的重大轉型。

1.全時域服務:傳統臨櫃式的服務,在大數據的時代,可以預見各項政府的服務將全面雲端化,或是擴散在城市裡的各據點(如現在的便利超商),甚至把每個公民都當作感知和運算的單元來參與數據運用的過程,不只是政府對人民單向提供服務,還包括接受民意的回饋,一旦人民可不受地域、時間、天候的限制接受與回饋訊息,就能擴大公眾參與,達到提昇應變效率及滿意度的效果。

2.主動式服務:相對於被動式的服務,在大數據的時代,自動化的科技將取代或輔助人工決策(腦力)及勞動(勞力),並提供主動式的服務。例如水利署將導入動態LBS28簡訊服務,利用電信基地台訊號定位,於汛期發布警報時,民眾進入指定之區域時,將自動發送簡訊告警,即時主動式服務的一種。

3.客製化服務:傳統的公部門傾向對所有人民提供相同的服務,但其實人民具有多元的個性化需求,大數據時代政府因能掌握更微小單位的需求(不一定是人),故可提供客製化的服務;如英國導入自適性交通控制系統,根據各路口的車流自動調整紅綠燈的等待時間,避免人多時綠燈時間太短,沒車時漫長的等待。

4.預知型服務:所謂「預知」,乃於嚴重問題爆發前儘早發現,或預知尚未發生之情況。大數據時代的預知型服務對政府內部可用來快速掌握內部管理的問題(如犯罪偵防),對外可提供與人民生活直接相關的預測資訊(如天災預報)。


22.把所有物品通過射頻識別等信息感測設備與互聯網連接起來,實現智能化識別和管理。

23.維基百科:http://goo.gl/iigKqs

24.http://data.gov.tw/

25.http://data.gov/

26.「政府資訊公開」給人民「知的權利」,「開放資料」則擴大到給人民「用的權利」

27.維基百科:http://goo.gl/J4PI3T

28.詳MBA智庫百科:http://goo.gl/XyjtAJ


伍、個人因應之道

談完大數據於公部門的應用,筆者回歸到個人的思維,試著思考每個人應該自我提升哪些素養來因應大數據時代:

一、 學習過濾資訊

掌握資訊贏得先機,隨著網際網路的發展,內容產業將為下一世代之重點產業,但另一方面資訊流通愈來愈快,內容虛虛實實真假難辨,「巨量資訊」也意味著「巨量垃圾資訊」,資訊氾濫成災導致人們難以適應,故人們應該要及早學習獨立思考判斷及資訊過濾之能力,才不至於受到蒙蔽29

二、 充實跨領域整合的能力

就像維基百科一樣,大數據的形成,是要千千萬萬不同領域的人合力完成,未來大數據上游資料的收集及下游資料的探勘、應用解讀,均需要具備有跨領域整合的能力才能勝任,學習與人合作與尊重差異亦為大家須有的基本認知。

三、 提昇資安觀念

大數據時代人要更懂得保護自己,人民要有瞭解自己的資訊如何被蒐集、處理及利用的覺知,可從日常生活中防詐騙觀念學起,安全的電腦使用行為,甚至善用網路工具,如Disconnect、Ghostery30等工具多少可掌握平常瀏覽的網站到底蒐集了哪些資訊。網路時代人與人之間其實是緊密結合的,在企業內只要一臺電腦被駭,帶來的可能是整個公司全部遭殃,所以只有整個網路下的所有個體共同重視資訊安全,才能真正提昇整體的資安能量;另外人民必須要先整體提昇自我保護意識,才有可能聚集公民的力量,向政府或企業主張知的權利,在提供與接受資訊間雙方的地位盡可能取得平衡。


29.專書作者Viktor Mayer-Schonberger繼《大數據》後之下一部作品為《刪除-大數據取捨之道》,旨在傳達「把有意義的留下來,把無意義的去掉」的觀念。

30.「10 個 Chrome 安全外掛,幫你防駭、擋廣告、保隱私」(PCuSER, 2012)/iigKqs。


陸、結論

大數據時代人稱「第五波科技浪潮」31,大幅擴展了資訊在社會中的應用範圍與規模,舉凡醫學、教育、交通、經濟…等各種不同面向都正在變革,甚至影響人類哲學思辨。麥爾荀伯格透過《大數據》說明了大數據的量、快、雜之價值、風險及管控策略。筆者並試著借用本書觀點於政府部門,思考如何提升公共服務,包含一體政府、開放政府及智能政府。另外,有關未來個人面臨大數據所引發種種社會衝擊和負面效應,亦提出應對之道-提升過濾資訊、跨域整合、資安保護意識。

大數據不僅是代表一種海量資料的狀態,一系列先進的訊息技術,更是一套認識世界、改造世界的新穎觀念與方法,但水可行舟、亦可覆舟,大數據勢必會帶給社會新的威脅,但總體來說利多於弊,因它能夠讓人類解決以前解不了的問題。無論如何,不管大數據有多海量,終究僅是大自然或人類文明的一小部分而已。儘管讓公民、政府、社會帶來的種種挑戰和變革,大數據只是工具,勿忘謙卑與人性,人需要更加努力開創,為自己的「直覺、常識和運氣」保留一些空間,正如賈伯斯的觀念 「我從來不問消費者需要什麼,因為他們不知道他們需要什麼」,引導潮流,而非一味追逐潮流。

本報告嘗試從各面向探討大數據趨勢,分享個人觀察和心得,希望面對大數據時代的到來,國人能預作準備,儘早儲備個人之能力素養,更期許能作為政府未來政策之參考,激發出社會對大數據更廣泛的認識與討論。


31.第一波是大型電腦,第二波是個人電腦,第三波是網路,第四波是社群媒體,第五波則是大數據(巨量資訊)。


柒、參考文獻

一、 書籍

1.經濟部水利署(2011-2012)《主動式民眾淹水預警系統應用技術之研發》臺北:經濟部水利署

2.塗子沛(2012)。《大數據:正在到來的資料革命》。桂林:廣西師範大學出版社。

3.城田真琴(2013)。《大數據的衝擊》。人民郵電出版社。

4.胡世忠(2013)。《雲端時代的殺手級應用:海量資料分析》。臺北:天下文化出版社。

5.奈特.席佛(2013)。《精準預測:如何從巨量雜訊中,看出重要的訊息?》臺北:三采出版社。

6.徐繼華;馮啟娜;陳貞汝(2014)。《智慧政府:大數據治國時代的來臨》。桂林:廣西師範大學出版社。

二、 網站

1.百度百科:(http://baike.baidu.com/)

2.維基百科:(http://zh.wikipedia.org/)

3.台灣政府開放資料平台:(http://data.gov.tw/)

4.美國政府開放資料平台:(http://data.gov/)

5.T客邦:(http://www.techbang.com/)

主題回應