GNOME Asia Summit 2022 吉隆坡情況

吉隆坡在12月2-5日舉行 GNOME Asia Summit 2022﹐這次我首次以 Board Member 身份參加 GNOME 活動。經過因疫情而 2 年轉移到網上舉辦,今年終於實體進行。沒想過吉隆坡團隊願意委身連續三年舉辦 GNOME Asia Summit。當我到埗去到 KLIA 一個中途站,登上主辦人的汽車,終於能當面與他見面了!我們就像認識多年的伙伴,半小時路途一直交談到酒店。

十年前我也來過吉隆坡到 MOSC 演講,今次亦是單純參加會議和 GNOME community 交流,甚至試過有一天會議後,回到酒店就留在房間到朝早。

今年 summit 有幾個講題幾好,首先,今次有一個 newcomer workshop 可以讓新手了解如何入手 contribute GNOME project。對 GNOME 社群發展,有 Rosanna 講的 GNOME Code of Conduct,兩場不同的 D.E.I. (Diversity, Equity, Inclusion) 工作坊。其他有趣 sessions 還有字型講座,幾個 student interns 的分享,還有當地的 Keynote 講者比我預期的好,他有實戰經驗嘗試在醫療機構用 open source software,例如從醫療設備 Capture vital sign,亦用 hostapd 扮 Wifi AP 來與醫療設備通訊。

會議最後一天,PyCon MY 主辦者也百忙當中來到會場找我交流,談談 Python Community。原來這次會場 iSpace VASD 亦曾是 PyCon MY 的會場。

雖然出席人數比預期低,主要欠缺當地人參加,我明白當地主辦團隊亦有點失望。亦從 KLIA Express 未回復以前時間表,也顯示當地疫情過後亦未完全回復社會交流。希望 GNOME 社群能逐步回復亞洲社群交流。

延伸閱讀:

開始製作基督教中文詞庫作文字數據分析

做中文文字數據分析時,數據科學家需要先做中文分詞工作,但做聖經和基督教文章的文字數據分析,還是需要額外詞庫協助改善分詞結果,所以我想製作基督教中文詞庫。另一方面,我使用 YouVersion 聖經APP 時,搜尋中文字詞總會出現奇怪結果,可見中文搜尋和分詞有待改善,例如搜尋「以馬」(以馬內利、以馬忤斯),頭四個結果是正常。

然後幾個結果就不關「以馬」事了。

這個月我終於開始第一步,先取得聖經經文來試驗中文分詞 。在數據科學常用的 Python 語言﹐jieba 是常用的免費開源中文分詞套件。我寫了一個開源 web scraper 來收集所用的中文聖經經文,並用 jieba 的基本詞庫來分詞。

例如:

經文:人要稱他的名為以馬內利。
Jieba基本分詞:人要|稱|他|的|名為|以馬|內利|。
經文:(以馬內利翻出來就是「神與我們同在」。)
Jieba基本分詞:(|以馬|內利翻|出來|就是|「|神|與|我們|同|

我打算將來有時間和資源時,再寫程式做一個免費而開源的基督教聖經詞庫,讓 jieba 可直接使用,方便中文文字大數據分析等數據工作,或是較準備地搜尋中文聖經文字,或有利網上文章內容分析和機器學習。

誰是Ben?我代波蘭人上來深圳取開源源碼!

照片來源:Naomi ‘SexyCyborg’ Wu 的 YouTube 影片(CC BY)

早前波蘭開發者 Patrycja 發電郵向中國深圳公司 UMIDIGI 索取基於 Android 10 開發的 UMIDIGI F2 手機系統內核源碼,尤其 ft8719_dsi_fhdplus 顯示屏驅動程序。Android 10 的內核 Linux 和不少開源軟件都是以 General Public License 發佈程式和源碼,所以 Patrycja 是合理的。

但 UMIDIGI 一位署名 Ben 的人回覆 Patrycja,她可以在「辦公時間」上來「只會就中國國語」的深圳辦公室來「要求」索取源碼,還在括號中註明大多數都不是「自由」和由 MediaTek 擁有。

Patrycja 就張貼在 Twitter 帳戶上說:到目前為止,這是我「最喜愛」的企業溝通。然後有另一位開發者 cc 給深圳技術推廣者兼 YouTuber 機械妖姬 Naomi Wu(SexyCyborg)。

機械妖姬回覆杖義一試,並在 Twitter 向 UMIDIGI 預告,這星期她會親身上來深圳南山區的 UMIDIGI 辦公室,索取有關源碼並拍攝 YouTube 影片,向她的外國觀眾展示中國人並不會偷智識產權,亦會遵守開放源碼授權條款。

8月20號,機械妖姬在 Twitter 先發佈一段一分鐘短片,主要是她走入 UMIDIGI 辦公室內問誰是 Ben,她現在按照電郵上來拿取開源代碼。公司有員工說 Ben 已離開公司了,她問現在誰跟進這件事?

昨天(8月26號)機械妖姬再在 YouTube 發佈完整版,後來 UMIDIGI 的前台人員出來了解,前台人員請她留下 WeChat 微信帳號,並保證公司會聯絡她。而 UMIDIGI 最終亦有按照 GPL 向 Patrycja,Patrycja 在 Twitter 分享源碼能幫助她的開發工作。

Software Freedom Conservancy 亦為這事件發了一篇 “…Anyone???” 的網誌,亦說如果各公司也遵守開源授權條款中的承諾,這世界將會如何呢?