訪問開發者對地址搜尋服務 API 的意見

筆者曾在 2021 年 3 月訪問一位開發者有關香港政府資訊科技總監辦公室(OGCIO)的地址搜尋服務 API。開發者 2020 年尾曾在社交網絡表達意見,不明為何同一座大廈有不同的 GeoAddress (19位數值)。開發者曾查閱 API 的規格文件,文件指 GeoAddress 是地址的 Easting 和 Northing,但開發者發現測試結果的 Easting、Northing 與文件的 spec 不同。

他認為地址系統是一個複雜問題,種類分法也有不同,例如以大廈、法團或地址為單位三種分法。還有,相連大廈究竟是一棟還是多棟。

數據不齊全及數據問題

該位開發者指出數據亦不齊全,他舉例地政總署有登記的工業區工業大廈,地址搜尋服務卻沒有相關數據。他亦覺得 API 不好用,他認為可能 API 設計不想開發者作以下用法。

例如:開發者想得到某街道上所有地址,但 API 卻不容許這樣做。

  1. 回傳的數據會有重複。例如大廈是16-18號,API 回傳16號/18號/16-18號。
  2. 回傳的數據有上限,只得200,出奇地少。

他認為很多開發者不介意 OGCIO 公開分享整個數據庫,讓開發者自行思考怎去用,但他猜測 OGCIO 可能不想。

他舉例,坊間開源專案 HKAddressParser 用兩套不同 API 來做地址搜索,還須額外 hacking,他估計效果只有八成。

不乎開發者期望的功能

開發者認為絕大多數的用家期望輸入地址後,系統只回傳唯一數據,但這不是 API 的問題,不能怪有關部門,而是地址系統本身問題。另外,開發者希望可用 ID 來搜尋地址,例如 GeoAddress。如果 API 能以經緯度或其它可分辨位置來搜尋也好。

筆者問到開發者如何解決 coding 需要?也是用兩套 API?

開發者的想法是用任何方法盡量取得所有數據,然後自己再思考用甚麼方法重整數據結構,所以開發者認為就算數據不完整,還是希望當局能分享整個數據庫,然後開發者自行重整數據結構就能解決 coding 需要了。最理想大家不用使用 Google Map API,因為該 API 也不是很準確,價錢亦貴。

他亦認為另一套由地政總署開發的香港地理數據站的 API 搜尋地址功能更差。


請成為 Patreon 會員支持森路歷程寫作及筆者的開源工作。 – https://www.patreon.com/sammyfung

開源香港就巴士新專營權的2021年意見

筆者代表開源香港在2021年巴士新專營權公眾諮詢提交意見,跟進巴士開放數據。

開源香港致力鼓勵透過開放科技改善社會,為改善公共運輸服務,本會分別在 2014、2016 年兩次巴士專營權公眾諮詢提交意見,建議政府要求巴士公司提供開放數據。

經過貴署多年與各巴士公司洽商,繼城巴、新巴、新大嶼山巴士公司近年提供實時到站開放數據後,九巴和龍運巴士公司亦按照香港智慧城市藍圖2.0時間表,在本年3月同樣提供數據。

本會 2016 年意見書提到﹐臺北市政府早已透過 data.taipei 資料開放平台提供公車實時到站數據,包括車牌編號和車型。多年來,讓「台北等公車」等 iPhone 或 Android 手機應用能以車牌編號和圖標顯示出車輛大約位置和車型。

香港作為世界科技領先城市,我們應致力做一個更優秀的智慧城市,讓其他城市借鏡香港的智慧出行。本會建議貴署要求香港巴士公司在實時到站開放數據中,盡早加入車牌編號和車型。除了進一步刺激更多智慧出行的創新應用外,亦幫助貴署、大學和機構研究和改善香港公共運輸服務。

本會亦樂意擔當貴署和各巴士公司與開發者、大學機構間的溝通橋樑,協助改善公共運輸服務和相關開放數據。

馮振華
開源香港會長

原文發佈:開源香港

區議會應推展開放數據

香港2019年區議會選舉結果出人意表,非建制派在17區區議會獲得大多數議席來主導議會,新議員較多使用互聯網科技,亦能接受較開放的議政文化。因此是好機會在區議會層面推展開放數據,並在這任期內制訂開放數據標準程序來達至開放議會。

區議會的議政水平影響地區居民生活,加上近月社會事年亦推動多些年青人和當區居民走出來關注地區事,而不少候任議員亦與熱心居民有所聯絡。而civic hacking亦在香港社會事件到區議會亦發揮不少作用,新一屆區議會應成立各區數碼社區小組,定期讓區議員、開發者、社區工作者等交流,討論如何創造更多高質素的社區開放數據,透過開放合作關係,讓區議會與居民從地區層面共同建立智慧城市。

我建議:

  • 訂立開放數據SOP,讓開放數據成為區議會常規。
  • 建立開放數碼溝通平台讓區議會與地區居民一直交流和合作。

為推動開放數據發展,萬維網發明人Tim Berners Lee 爵士製訂五星開放數據分級條件。如區議會能以至少乎合三星級開放數據條件為標準,提供開放授權、使用結構性數據及採用開放文件格式,開發者和數據分析師便能輕易地創造有利地區發展的軟件和分析。

在2019年12月中,區議會只透過政府公眾數據平台提供三個CSV數據集,對軟件開發和數據分析近乎沒有幫助。而各區區議會網站提供會議紀錄和相關文件,文件除了只是一些經整合的會議討論資料外,少部份相關資料並難以直接開發和分析。而居民較有興趣的區議會出席率數據,只以CSV列出每位區議員的出席次數和百份比,這類總結資料未能完整表示每位議員的實際出席情況,應該細分到每次會議的出席紀錄。既然會議紀錄文件有,以CSV紀錄只是簡單工作。同時,應增設投票紀錄的CSV紀錄,方便居民查閱。這些都是一些屬三星級開放數據的建議。

新一屆區議員須認識開放數據,在議會到地區事務,應不時留意資料格式,多向區議會、民政處以至政府要求合乎開放數據標準的資料。例如政府提交區議會的非保密檔案(文件、數據、圖片、影片等)需要以原來、完整電腦檔案上載到網站。

再進一步,在開放數據以外,各區區議會建立如 accessinfo.hkvtaiwan.tw 的地區居民網上平台,讓居民透過網上平台為地區提出意見,甚至開放資料,讓區議員回應和跟進要求。

除筆者外,亦有不同的有心人亦有意在區議會層面推動開放數據,相信能在協調下在不同地區、網絡上進行工作。希望經過一屆區議會後,透過開放數據來提升區議會議政能力和透明度。