6年香港開放數據發展停滯不前

還有一星期就到國際開放數據日 [4]。從香港政府資訊科技總監辦公室 OGCIO 在 2011 年推出公共資料 (Public Sector Information,簡稱 PSI) 網站資訊一線通 data.gov.hk 服務,2015年改版至今,這 6 年香港的開放數據發展仍停留害怕真正的開放數據所帶來的新科技、新經濟、新社會的轉變,甚至連「開放數據」(open data) 這名詞也在文字內容中避談,只有口談。

應用程式開發者和數據分析師喜歡開放數據,因為可以輕易使用外,還可以為大眾開發更好的應用程式和數據應用,帶來更大和更好的社會利益。而近年香港提倡大數據 (big data),但同時嚴重缺乏推動開放數據,令大數據技術只局限各機構、公司、開發者自行用自己掌握的數據來開發數據應用,而不能做到真實大數據中數據種類 (variety) 所帶來的效益。

2016年香港立法會秘書處資料研究 [1](註a) 開放數據的資訊述要,已清楚說明開放數據定義上,都包括授權數據使用者不受限制、自由再用。文件結語亦指出,開放數據的價值來自數據是否被廣泛應用。因此,開放數據必須以使用者為中心,切合他們的利益和要求。

文件亦提到,World Wide Web 萬維網發明家英國人 Tim Berners-Lee 爵士所提倡五星開放數據實踐方案 [2],實踐方案中最基本要求是授權自由使用數據,這才能成為一星級的開放數據,然後另一個要求是機器可讀 (machine readable),便能成為二星級的開放數據,還有其他條件才能達到最終的五星級開放數據。英國政府亦根據 Tim Berners-Lee 這套方案來訂立一套清晰的標準 [3] 來開放政府數據。

香港政府部門及公共相關服務機構和公司都擁有不少數據,亦提供給公眾閱讀或使用。但從6年前直至今天,香港仍未有真正的「開放數據」,面對的困難有兩方面:

1. 非開放授權;
2. 數據實用性。

目前香港各種數據或資料授權上,不少數據都是不能再轉發 (non-redistribute)、不能作商業用途 (non-commerical),甚至不能自由取得,必須先開設及登入帳號才能得到。而提供的數據亦缺乏實用性,應用程式開發者和數據分析師難以使用香港的開放數據,只能自行從各式各樣資料文件或其他方法,來發掘和收集所需的數據,大大增加所需時間和資源。

在缺乏開放數據,除了應用程式開發者和數據分析師需要多花工作和時間來取得資料外,亦或局限他們如何使用從互聯網及其他方式收集回來的數據及資料。

科技發展應該接受以新思維來發展,而不是停留在傳統或稱 Old School 的思維來發展。希望香港能盡快在開放數據發展上,繼續向前走。

[1] http://www.legco.gov.hk/research-publications/chinese/essentials-1516ise18-open-data.htm
[2] http://5stardata.info/en/
[3] http://guidance.data.gov.uk/five_stars_of_openness.html
[4] https://opensource.hk/open-data-day-hong-kong/

(註)
a. 該文件把 open data 中譯為開放資料。