鏗鏘集

大數據

doc-download pdf-download

播出日期: 2017-02-20學習單元: 今日香港 
片長: 22分鐘
簡介:
近年炙手可熱分析「大數據」的潮流,正在滲透全球。在人人機不離手的時代,由網上購物、瀏覽網頁,到社交媒體的狀態更新等,都會在互聯網世界留下足印並奉獻「大數據」予不同企業、機構甚至政府用作分析。數據除有助分析各類人士的行為模式外,亦可用作制定公共政策。然而,有網絡安全專家擔心,數據會洩露個人私隱,政府亦能以「大數據」監控人民。究竟「大數據」能提升人類的生活水平,還是成為防不勝防的「計時炸彈」呢?

  • 了解大數據的應用情況、範圍和效用
  • 了解企業如何利用大數據協助營銷
  • 分析政府利用大數據監控人民的風險
  • 了解數據的收集途徑和市民的私隱風險
  • 探討使用大數據與提升人類生活水平的關係

持分者:

持分者

人物 / 組織

經歷 / 看法

立法會議員

莫乃光

(立法會議員(資訊科技界))

  • 將來在網上的一言一行,可能都會被分析,成為我們的信用評分,令很多人會先考慮清楚(才發言),既然如此,就要乖乖的,寧願風花雪月,其他事不多談。這種做法一定會在一些國家構成白色恐怖的效果
  • 《截取通訊及監察條例》因過時而有漏洞,擔心執法部門在沒監管下,向互聯網服務供應商索取用戶資料;近年在審議這條例的修定時,政府說仍視這條例是以前俗稱的「竊聽條例」,只嚴格監管竊聽電話通訊,但當談到網絡資料,政府就說那不是竊聽,只是取證,只是事後向互聯網公司取得紀錄,完全繞過這條例,這只有令人懷疑,政府這麼做的次數不少,或至少政府不想受到公眾和立法會監察

網絡安全公司

龐博文

(網絡安全公司總裁)

  • 「老大哥在背後看著你」的世界已經來到 (源自小說《1984》,意指人們和社會隨時隨地受著政權的監控)
  • 為何有人會給你免費郵箱、免費儲存空間、免費照片空間?在專頁讚好,就可以有折扣,為何會有這麼多這種東西改變生活模式和商業模式?
  • 近年全球數據保安敲起警號,原因是不正當收集大數據的方法越來越多,更令人擔心的是人們一般都不重視這些陷阱
  • 當有人使用接駁了有天線的機器,模擬假的Wi-Fi熱點,當用戶連結這個不正常、冒認的Wi-Fi熱點時,所發送的照片、訊息,如沒經過加密,就有可能被記錄下來;(若你的裝置) 找到可用的無線接入點就自動登入,你的數據流就肯定被人偷去
  • 一個讓人可在旅遊時合租房間的手機應用程式,它要求取得相機權限是有意義的,有可能是用作拍照、分享等,但需要電話狀態及身分就值得商榷;難以明白為何電筒應用程式要求讀取你的電話狀態及身分,甚至能讀取照片、書籍、USB儲存裝置的資料。(使用這些應用程式) 你成為替人賺錢的機器,亦同時在出賣自己的私隱,把自己的電話簿資料、位置等,作為別人大數據分析的一部分
  • 曾經進行手機軟件的安全測試,發現有被第三方盜取的情況;在檢測一個零售軟件時,發覺它除了正常地把資料,送回原本的伺服器外,中途還出現一個不知名的IP地址,我們曾詢問過這IP地址是否屬於客戶自己的平台及其伺服器,回答卻指不知道
  • 人們可能沒想過私隱、跟朋友的關係和動作、每登入一個網頁等數據的價值加起來,遠比免費軟件或低價的高性能硬件手機,有價值得多
  • (監控鏡頭的風險) 例如有一個 (閉路‎) 鏡頭應該是家長讓自己在外工作時也看到家中情況,但明顯整個登入頁面都不受密碼保護,也沒使用安全方法把它鎖起;(另一個鏡頭) 一間商場裏的金舖,時間是現在,是實時的,可以看到客戶和售貨員在買賣金器等
  • 每個人的個人資料和行為,就是互聯網上的一種貨幣,當有公司讓用戶換取免費服務時,例如能把照片張貼到社交媒體,其實在社交媒體的用戶協議說明中,該照片的版權屬於社交媒體,而不屬於該用戶
  • 當用戶使用了個人資料或其他來換取免費服務,必須弄清楚可有相關的法例或機制、行業標準、法例法規能向提供服務的服務者作出制衡

大數據使用者

 

許遵發

(電腦科技公司區域科技長)

  • 公司其中一個提供的是語言認知服務,能即時將英、法語同時翻譯翻譯雙方以不同語言輸入的對話
  • 另一產品主要是利用大數據,加上人工智能科技,辨認出消費者是甚麼年齡、性別,是否高興,都在大數據環境裡搜集,資料全都在雲端上

車品覺

(大數據應用比賽評審、前電子商務數據公司副總裁、多間企業的數據分析部門主管)

  • 生活上有很多東西已應用大數據,例如人工智能,給了我們一些好處,只是我們仍未感覺到
  • (就著余俊朗的參賽項目) 如果有一天,中國國術中每套拳,只要師傅帶着感應器,使用多次之後,另一個人再打這一套拳時,就可告訴他,他跟這師傅的距離到底有多遠,這應是余俊朗團體的夢想,但這項目的難度在於感應器的靈敏度是否足夠
  • 人類發展至今,以往比拼誰的刀鋒銳利,到了電腦時代,誰懂得用電腦誰就優勝,後來是誰懂得用互聯網誰就佔優,到了現在的年代,就是誰的數據多,誰就了不起
  • 從出發地到中環,走紅隧只需19分鐘,走西隧要24分鐘,但若紅隧擠塞,可能花45分鐘也到不了中環。故此出門前會看一看,到底走哪一邊比較好,這是很好的大數據例子,因為每個人拿著手機在車上用地圖時,其實也是一個感應器,這些感應器收集的數據,可以令Google地圖計算出,到底要多久才可以去到目的地
  • 近年大數據廣泛應用在不同範疇,例如交通、天氣、金融、以及打擊罪案等,為政府或商業機構在制訂策略,甚至將來要發展智能城市,提供重要依據,數據出現令每個人所作的決策都更有根據,而這些根據是因為其他人提供的大數據,令我們有這些可能性
  • 有些人不知何解很有眼光,比如買牛仔褲也比你買的漂亮,我們能否以數據抓住這種眼光?又能否搜集到足夠數據製作出「超級達人」?後來找到了方法,十分興奮,因為以往從來沒人想過,可以用數據人工智能,訓練出數據超級達人,而這系統可以預測未來牛仔褲的趨勢和價格走勢
  • (大數據分析) 整體準確度跟數據量大有關係,數據量越多,準確度越高;當廣度不大,只有某一類型數據也是不行
  • 我們從所得數據中找出規律,放進去應用,如電子商務的推薦系統,以往是你喜歡看到甚麼,商戶就推薦甚麼,後來最著名是「顧客同時購買的物品」,例如買這本書的人也買另一本書,就把其他人的數據用在你身上。另一例子是商戶知道你剛買完一張機票,準備三天後去某個地方,所以現在就應為你提供便宜的租車服務等
  • 社會在享受大數據應用帶來好處的同時,亦要關注政府和企業如何收集和使用這些數據
  • 相信大部分人的憂慮都是關於個人隱私的數據,會否在不知情時被其他人使用,然後會否影響到自己
  • 其中一個重點是,當用戶不希望他的數據被收集,是否就可不收集,但當用戶認為收集數據對他有好處,就讓商戶收集他的數據。由自己控制這一點更重要,而不是拒絕收集,不再用大數據和人工智能,這有違科技發展
  • 香港企業未廣泛意識到大數據的價值,加上這方面的專才短缺,發展較其他國家相對落後,要急起直追
  • 一種新科技出現,必然會有人用這工具做好事,有人用這工具做壞事,但這不是科技的錯,是人類在使用時,是否從好的角度和態度去使用科技

馮己政

(資訊智能方案供應商區域營運總監)

  • 以前 (商戶了解消費者對產品的反應之) 方式,是要先完成市場調查,花1、2星期收集完,再做報告,可能已過了一個月
  • 現在的速度是今天開始推廣一件產品,人家給予很多讚好和分享,參與度很高,但到產品真正推出市面時,卻很少人讚好和關注,就意味著商店要用不同的推廣方法,由此可即時反映給客戶 (相關的商店),讓他更快作出反應,比以前快得多

林翠婷

(資訊智能方案供應商區域解決方案經理)

  • (使用人工智能對不同資料作分析時,可能會出現在不同處境,用詞意思可能相反的情況,當數據收集不足的時候,人工智能系統分析就會有限制) 例如「屈機」一詞,資料庫(顯示在白板上)「屈機」是放在正面一欄,但這次的報告中,我們把這詞語放在負面一欄,因為有些詞語要由人去目測,看它可有反諷含意,再去判斷

余俊朗

(大數據應用比賽參賽者)

  • 自己是個功夫迷,也留意到李小龍會不斷用科技來改善自己的訓練方法,相信如果李小龍處於現代,他會用大數據去改善訓練方法

其他資料:

互聯網與大數據的相關資料

  • 全球有35億互聯網用戶,我們在互聯網上的一舉一動,無論是網上購物、瀏覽網頁,到社交媒體的狀態更新,不知不覺都會留下數碼足跡,這些資料可能對個人而言毫無價值,不過對於企業或政府就是寶藏,甚至可以透過這些數據,找出解決問題的方法
  • 大數據的應用和普及,儲存系統是其中一個關鍵,一些跨國互聯網公司,會在雲端儲存網民的每一個點擊、下載、瀏覽網站等原始資料,再利用這些大數據推進人工智能的研發
  • 現時大數據資料庫掌握於幾間跨國互聯網公司手上,用戶一直關注它們的保安系統,如何免受黑客入侵,不過近年更多人關注,政府會直接向這些公司索取用戶資料,除了侵犯私隱,更擔心政府機構,利用這些資料作監控用途
  • 每個人都有份就大數據作出奉獻,不過互聯網公司在收集資料時會否侵犯個人私隱,一直充滿爭議
  • 科技界形容大數據像黃金和石油,是「取之不盡的石油」

科技界形容大數據的3大特徵

  • Volume︰即是巨大規模的數據量,需要運用雲端收集和計算
  • Variety︰即是多樣性,與傳統相比,當今世上最具價值的數據,已不再是文本,更多是音頻、圖片、影像、地理位置,甚至是社交媒體狀態更新等形式
  • Velocity:即是速度,智能電話越來越普及,用戶隨時隨地可以在社交媒體和搜尋引擎,無間斷地輸出數據

部分可能對市民存在風險的大數據收集途徑

  • 偽裝和冒認Wi-Fi熱點的收集資料機器
  • 手機應用程式是收集大數據主要的渠道,其中免費軟件最常見
  • 來自電腦或智能電話的攝錄鏡頭、商店及住所安裝的閉路電視、俗稱「天眼」的監控鏡頭,所拍攝的片段

應用大數據成功分析的例子

  • 大數據的應用,顛覆了很多傳統數據分析方法
  • 例子一:2016年美國總統大選,特朗普的選情一直在傳統民意調查中落後,不過印度一間公司在社交媒體收集超過2千萬個數據作分析,就在大選前一個月預示他會勝出
  • 例子二︰圍棋人工智能機械人AlphaGo連續擊敗超過60位棋王,成為世界第一。AlphaGo有學習能力,吸收超過3千萬步人類高手的圍棋步數,以決定如何走下一步棋,致勝關鍵也是背後的大數據庫

以大數據監控人民的相關資料

  • 2013年的「斯諾登事件」,揭露政府運用大數據進行監控,震驚全球。美國前中情局技術員斯諾登向傳媒揭露,美國政府代號為「稜鏡」的秘密項目,可以直接進入互聯網公司的中心伺服器搜集情報,看到用戶的電子郵件、在線聊天,甚至是信用卡信息等
  • 歐洲有政府也被揭發有類似美國政府「稜鏡」的計劃
  • 中國內地有政府部門在2014年提出,2020年開始實施利用大數據為市民作信用評分的計劃,到時市民買樓、借貸、入學,都要依靠這個個人的數據信用評分,建議引起極大爭議,被批評是要用大數據監控人民

與監控訊息相關的本港條例

  • 網絡監控成為全球焦點,現時香港有《截取通訊及監察條例》,規管由執法機關截取市民的通訊行為,當中包括郵政服務、電話,以及電訊系統傳送的訊息,但現時普及使用的電郵及網絡即時通訊軟件,就不在條例的監管範圍之內

 

  1. 甚麼是大數據?根據節目內容和就你所知,有哪些行業會使用大數據?
  2. 莫乃光認為現時的《截取通訊及監察條例》存在甚麼漏洞,及會帶來甚麼潛在影響?
  3. 龐博文指出,在大數據收集的過程中,對市民會帶來哪些風險?
  4. 車品覺認為應該如何平衡使用大數據和保障個人私隱?你多大程度上同意他的看法?解釋你的答案。
  5. 根據節目內容,大數據的應用如何提升我們的生活質素?試舉兩個例子說明。
  6. 「對一般市民來說,大數據的收集和應用是利多於弊。」你在多大程度同意以上說法?解釋你的答案。
(01:27) - 對余俊朗參加大數據應用比賽項目及車品覺的意見
(03:08) - 車品覺指每個人共同提供數據令所有人的決策都更有根據
(04:33) - 使用大數據來進行數據分析的成功例子
(06:06) - 大數據應用的特徵和原理
(08:03) - 商界應用大數據進行人工智能分析時的限制及優勢
(09:54) - 大數據的儲存及相關的風險
(11:34) - 龐博文講述部分大數據的來源和市民可能面對的風險
(16:35) - 各地政府利用大數據及進行監控的情況和爭議
(18:03) - 條例對香港執法機關截取市民通訊的監管,及莫乃光的擔心
(19:28) - 車品覺指大數據可能引起私隱問題,但應由用戶決定是否提供
昔日節目
2017-10-16

鏗鏘集 - 單車成災

近年,愈來愈多人喜歡以單車用作短程代步。半年前香港首間共享單車公司開業,短時間內已陸續有新公司加入戰團,多間共享單...

2017-10-02

鏗鏘集 - 出租情人

在網路的虛擬世界中,社交媒體、色情內容和情慾關係,只在點指之間。今年,網上相片分享平台禁止用戶使用「#ptgf」的...

2017-09-25

鏗鏘集 - 逆權少年

佔領運動三周年,當年走在社運最前線的黃之鋒、羅冠聰和周永康等學生,因為律政司覆核「反新界東北撥款案」及「公民廣場案...

2017-09-18

鏗鏘集 - 走過凡間的天使

生命之初,由一團分裂的細胞不斷成長,經歷36周,胎兒便會變成生命。不過,不是每個胎兒都可以平安健康誕生,約有20%...

2017-09-11

鏗鏘集 - 長期短租

中環摩天輪的新舊營辦商交接風波,令短期租約這種租地方式,再次引起市民關注。短期租約的租用年期,究竟是長是短?一般市...

版權聲明 | 會員使用條款 | 私隱政策 | 免責聲明 | 無障礙網頁 | 回應及意見 | 關於我們 |
Copyright © 2017 eTVonline. 版權所有 不得轉載