6年香港開放數據發展停滯不前

還有一星期就到國際開放數據日 [4]。從香港政府資訊科技總監辦公室 OGCIO 在 2011 年推出公共資料 (Public Sector Information,簡稱 PSI) 網站資訊一線通 data.gov.hk 服務,2015年改版至今,這 6 年香港的開放數據發展仍停留害怕真正的開放數據所帶來的新科技、新經濟、新社會的轉變,甚至連「開放數據」(open data) 這名詞也在文字內容中避談,只有口談。

應用程式開發者和數據分析師喜歡開放數據,因為可以輕易使用外,還可以為大眾開發更好的應用程式和數據應用,帶來更大和更好的社會利益。而近年香港提倡大數據 (big data),但同時嚴重缺乏推動開放數據,令大數據技術只局限各機構、公司、開發者自行用自己掌握的數據來開發數據應用,而不能做到真實大數據中數據種類 (variety) 所帶來的效益。

2016年香港立法會秘書處資料研究 [1](註a) 開放數據的資訊述要,已清楚說明開放數據定義上,都包括授權數據使用者不受限制、自由再用。文件結語亦指出,開放數據的價值來自數據是否被廣泛應用。因此,開放數據必須以使用者為中心,切合他們的利益和要求。

文件亦提到,World Wide Web 萬維網發明家英國人 Tim Berners-Lee 爵士所提倡五星開放數據實踐方案 [2],實踐方案中最基本要求是授權自由使用數據,這才能成為一星級的開放數據,然後另一個要求是機器可讀 (machine readable),便能成為二星級的開放數據,還有其他條件才能達到最終的五星級開放數據。英國政府亦根據 Tim Berners-Lee 這套方案來訂立一套清晰的標準 [3] 來開放政府數據。

香港政府部門及公共相關服務機構和公司都擁有不少數據,亦提供給公眾閱讀或使用。但從6年前直至今天,香港仍未有真正的「開放數據」,面對的困難有兩方面:

1. 非開放授權;
2. 數據實用性。

目前香港各種數據或資料授權上,不少數據都是不能再轉發 (non-redistribute)、不能作商業用途 (non-commerical),甚至不能自由取得,必須先開設及登入帳號才能得到。而提供的數據亦缺乏實用性,應用程式開發者和數據分析師難以使用香港的開放數據,只能自行從各式各樣資料文件或其他方法,來發掘和收集所需的數據,大大增加所需時間和資源。

在缺乏開放數據,除了應用程式開發者和數據分析師需要多花工作和時間來取得資料外,亦或局限他們如何使用從互聯網及其他方式收集回來的數據及資料。

科技發展應該接受以新思維來發展,而不是停留在傳統或稱 Old School 的思維來發展。希望香港能盡快在開放數據發展上,繼續向前走。

[1] http://www.legco.gov.hk/research-publications/chinese/essentials-1516ise18-open-data.htm
[2] http://5stardata.info/en/
[3] http://guidance.data.gov.uk/five_stars_of_openness.html
[4] https://opensource.hk/open-data-day-hong-kong/

(註)
a. 該文件把 open data 中譯為開放資料。

香港開源年會的發展歷史

昨晚開了今年第一次香港開源年會 HKOSCon 的義工月會。

從1997年 HKLUG 開始,大約早於2005年,我希望香港有 open source conference 年會,但一路以來,各種資源缺乏之下,認為在香港很難成事而沒有仔細研究。

2011年夏天,我們約十位香港開源朋友,第一次去外國開源會議:台灣開源人年會 COSCUP,親身體會過他們的開源發展和人文文化,促使我們至今每年夏天也必定過 COSCUP 走走。

另一方面,經過 GNOME Asia 兩年邀請提交計劃書,2012年頭,我們在香港舉辦 GNOME Asia Summit,亦是香港開源社群第一個 conference。在遇不同資源上的嚴重困難下,只有很少數目的義工,最終也順利完成。

完成 GNOME Asia Summit 後,我認為,既然我們能完成一個讓20多位外國講者來港的亞洲區開源會議,那麼辦本地 open source conference 不再是夢吧?

2013年我們開始第一年香港開源年會 HKOSCon。除了本地講者參加者外,發揮香港國際都會特點:多邀請外國講者來參加。這樣,每年就能有一次,不用坐飛機到外國,在香港也能接觸外國開源發展及人文文化,藉此向香港人介紹和推廣外國 open source 如何影響國際科技發展。

轉移 domains 去 Gandi

今晚從 GoDaddy 轉移幾個 domains 去 Gandi,決定轉移的原因是兩間價錢近乎相同,而且 Gandi 在某些服務比知名(?) 的 GoDaddy 好,而且 Gandi 還提供 API 供開發者使用。

Gandi 還免費提供 whois 資料的私隱服務。有別於 GoDaddy 額外收費的私隱服務,Gandi 的私隱服務仍然展示名字,但地址及電話則以 Gandi 地址和電話代替了。同時,Gandi 還提供免費的 anti-spam 用的 Gandi 電郵地址來取代和過濾電郵。

在轉移 domains 時,Gandi 會清楚地列出幾個 steps,來說明轉移過程在等甚麼。

Gandi 本身是一間來自歐洲,也跑去台灣開分公司,還有歐洲人長註台灣,對亞洲有一定了解。GoDaddy 用 ASP.net,而 Gandi 系統用 Linux 和 FreeBSD,還贊助和支持台灣及香港等地區的 open source 會議。那麼又多一個支持 Gandi 的理由。