中學生研發AI平台獲獎被指有背後加持,五問解構「藥倍安心」科研風波

端傳媒整理事件時間線,訪問吹哨人鄭曦琳及尋求相關單位回應,還原爭議來龍去脈。
今年6月中,聖保羅男女中學的中四生潘浠淳被質疑聘請美國公司「AI Health Studio」(AIHS) 製作藥物處方輔助 AI 平台「MediSafe 藥倍安心」,以此獲得多個本地和國際科研獎項。攝:林振東/端傳媒

【編按】報導發出後兩日,8月22日,當事女生的父母、潘冬平夫婦,向香港社會作出回應聲明。聲明指「藥倍安心」為女兒的原創概念,原創性無可否認,惟其母憂慮此概念會被商業抄襲,因此自行接洽AI公司、但又並未告知該公司此概念已參加比賽,確實考慮欠妥。目前所有調查完結,他們已向各主辦機構提出自願放棄所有獎項,對引起的社會紛擾深表歉意,也懇請停止對女兒的網暴,感謝各界理解。

與比賽相關的機構之一「香港教育城」,也回覆了端傳媒的查詢,指知悉「藥倍安心」參賽學生及其家人發佈公開信公佈放棄所有比賽相關獎項,理解決定,而該學生放棄比賽獎項並不影響教城早前就調查結果的闡述。教城亦呼籲社會各界保持冷靜、理性、正向溝通及仁愛,懇請大眾停止發表惡意攻擊及過激言論。

對於這個聲明,吹哨人鄭曦琳亦作出回應,指當事人即已承認為了比賽「請槍」、潘同學在傳媒訪問中多次說謊,但歉意卻僅僅用一句話帶過。她又指聲明將自己作為吹哨人的用意扭曲成欺凌,卻避而不談其揭發事件後承受的大量真正的人身攻擊與恐嚇。她指「潘家這份聲明的真正用意,相信大家心中有數。」

今年6月中,國際肝癌權威、香港大學醫學院外科學系名譽教授潘冬平之女潘浠淳(Clarisse Poon)捲入「請槍」爭議,網民質疑她聘請美國公司「AI Health Studio」(AIHS) 製作藥物處方輔助 AI 平台「MediSafe 藥倍安心」,以此獲得多個由官方或公帑資助機構主辦、參與的本地和國際科研獎項。

香港城市大學計算數學系二年級生鄭曦琳(Hailey Cheng)首先質疑潘的計劃的原創性,認為她「請槍」由商業公司代為開發。事態沉寂一個多月後,AIHS 聯合創辦人 Ahmed Jemaa 於8月4日投下震撼彈,指在2024年3月受潘浠淳母親、港大醫學院前外科學系助理教授彭詠枝付費委託,製作相關平台。

AIHS 在聲明中指,彭詠枝委託時未告知作品會被用作參賽,並強調當時客戶僅提供初步想法,公司由零開始製作 MVP(Minimum Viable Product,最簡可行產品),項目開始前沒有得到程式碼、使用者體驗和技術架構方面的資料。又指彭在爭議爆發期間,要求他們移除網站上有關 MediSafe 的資料,以及修改字眼,將公司的角色轉為商業推廣(commercial rollout)。

另一方面,政府相關機構被指牽涉在內及有掩飾的嫌疑。AIHS 聲明指事件發酵後,與比賽相關的兩個機構——獲教育局資助的香港資優教育學苑(學苑),以及政府全資擁有的香港教育城——聯絡 AIHS。AIHS 向它們提交合約、電郵紀錄和付款紀錄等與彭詠枝交涉的證明,不過兩間機構在7月中回覆,指潘浠淳早在2024年提交作品參賽,認為有充分原因相信「作品是原創並且由學生獨自創作 」,又要求 AIHS 對外口徑一致,以及將傳媒查詢轉介給他們。AIHS 指兩度提供抗辯證據,但未獲回覆。

Ahmed Jemaa 強調公開事件不是為了邀功,而是不願意活埋真相,「當機構行事不公、事實被漠視時,我們別無選擇。」聲明曝光後,輿論快速擴散。《金融時報》中文網總編輯王豐在 LinkedIn 指有多間政府相關機構和教育團體捲入在內,當中似乎有所隱瞞,「有可能演變成香港多年來最大的教育醜聞。」

兩個月以來,事件引發多方爭論,包括科研計劃的原創性、比賽的公平性,病人私隱是否受保障等等。端傳媒整理事件時間線,訪問吹哨人鄭曦琳、曾參與相關賽事的科研中學生、香港科研專家,並尋求相關單位回應,還原爭議來龍去脈,探討現今科研學生劇烈競爭的狀況。

潘浠淳憑作品藥倍安心 (Medisafe)獲得2024香港資訊及通訊科技獎學生創新獎大獎得主,亦是首位獲得該大獎的初中生,並與數字政策專員黃志光合照。網上圖片

一:潘浠淳是誰,做了什麼?MediSafe 爭議的來龍去脈是?吹哨人指自己遭受了怎樣的攻擊和威嚇?

潘浠淳是聖保羅男女中學的中四生。她自稱研發的 MediSafe 是人工智能網頁應用程式,透過與病人資料交叉檢查處方,偵測藥物處方時的潛在錯誤,現時網站已無法連上。她今年4月獲獎後受表示,留意到錯配藥物的新聞,從而受啟發研製MediSafe。她又稱市面上沒有類似項目能夠自動比對處方及病人病歷,MediSafe 屬首創。

她憑 MediSafe 獲得多個獎項,包括:

  • 2024年11月,「香港資訊及通訊科技獎」中的特別嘉許獎、學生創新獎 – 初中、大獎和金獎(由政府數字政策辦公室﹐即數字辦舉辦,教育城是籌辦機構之一);
  • 2025年4月,以「教育局代表隊(中學生)」身分獲得第50屆「日內瓦國際發明展」銀獎(教育局資助學苑,委託新一代文化協會甄選及培訓學生參加);

其中,翻查「香港資訊及通訊科技獎」的得獎簡介,評審均為相關行業的著名人士。學生創新獎評審委員會的主席是香港通訊有限公司主席兼行政總裁陳重義,成員包括香港大學計算機科學系榮休教授錢玉麟、香港電腦教育學會主席和沙田培英中學校長朱嘉添等等,數字辦總系統經理(數據平台)翁慧卿亦在名單之內。

當時評審委員會對 MediSafe 的評價為:「從一個優秀的構思開始,基於詳盡的資料搜集、對LLM(大型語言模型)、SQL(結構式查詢語言,在關聯式資料庫中儲存和處理資訊的程式設計語言)、Vector(向量資料庫)的充分了解和深入的醫療知識,善用藥物資料庫,成功構建出一個非常出色而且易用的系統。」

直至今年6月13日,香港城市大學計算數學系二年級生、計算生物學領域的本科生研究員鄭曦琳(Hailey Cheng)在 Threads 發佈帖文,質疑計劃非潘一人完成,引爆 MediSafe 爭議。

她附上平台的簡介海報,說科研展覽很多時候是「富家子弟玩具」,「大家都知中學生根本做不到什麼東西出來。」另外她引述潘浠淳今年4月受訪表示有76位醫生推介 MediSafe ,質疑項目或將病人資料外流至第三方,有私隱疑慮。

潘浠淳隨即在 LinkedIn 回應,對鄭曦琳的帖文表示「humiliating(侮辱)」,批評是削弱在香港從事 STEM 的女性。帖文之後被刪。當時有網民嘗試登入 MediSafe ,發現導向 AI Health Studio 網站,當中包括 MediSafe 個案的簡介,指明項目客戶是潘冬平和胞弟潘冬松所成立的香港肝膽胰及結直腸微創外科中心(Hong Kong Hepatobiliary-Pancreatic & Colorectal Surgery Centre),花8星期製作。

網站亦顯示一個更詳盡的 MediSafe 版面,羅列製作軟件技術、數據來源等,同樣列明客戶是該外科中心。鄭曦琳和網民陸續列出 AIHS 網站的截圖、潘浠淳以往訪問內容等證據,質疑她聘請公司製作 MediSafe。

熱議不斷之際,AIHS 網頁在6月17日被發現有修改痕跡, MediSafe 個案簡介的字眼被改成「協助優化(help optimize)」AI 藥物安全軟件、「將已有的發明商業化」。

這跟 AIHS 近日聲明上的說法吻合,包括彭詠枝在6月16日要求移除 MediSafe 網站上的資訊和調整字眼,將公司角色由從零開發轉為商業推廣(commercial rollout),公司稱有猶豫但依從。聲明又透露她表示願意付費,讓 AIHS 繼續協助對公眾發布訊息。公司指對此感到不安,與彭詠枝斷聯。

後來,公司發現網站在香港的流量比其他地方多出45倍,才發現有吹哨人公開質疑作為中學生的潘浠淳如何製作如此複雜的產品,並揭發 AIHS 和 MediSafe 的聯繫。

此外,鄭曦琳在事件發酵期間不斷於社交平台發帖跟進最新情況,並指曾遭受網上攻擊及實體威嚇,包括言論攻擊她的外貌、雙性戀傾向,及以匿名帳號發訊息指會控告她誹謗,並寫道:「You’ve no idea whose line you’ve crossed」。

12日早上,她指住所外有一名男子大聲呼喊「快啲出嚟」,並疑以不明物體敲打大門,她指已報警及尋求立法會議員意見。19日,她指收到了聲稱來自北京市東元律師事務所、受「鄭浠淳女士」委託發出的律師信,要求賠償港幣2500萬元。

香港並沒有專門保護吹哨人的法律,《信報》引述議員江玉歡指事件涉學術誠信、公帑運用、公平原則等問題,如有人因揭露事件而受到恐嚇屬違法,政府部門和公帑資助機構應介入處理,並指作品若不光彩地獲獎有害香港形象。

香港城市大學計算數學系二年級生鄭曦琳(Hailey Cheng)。攝:林振東/端傳媒

二:各涉事的政府部門、比賽主辦機構如何回應?最新的資優學苑調查報告出爐,為什麼他們認為「藥倍安心」符合比賽規則,又如何回應坊間質疑?

事發後,潘浠淳何時聯絡 AIHS,是否以其製作的項目投獎成為了關鍵爭議之一。

此前,數字辦在6月17日曾回覆傳媒,表示「非常重視」爭議,已要求教育城和標準保證小組委員會進行全面調查。其後,新一代文化協會和學苑均指,潘聯絡美國公司是為了將作品「商業化」,而公司是在香港資訊及通訊科技獎和日內瓦國際發明展後才介入,認為不影響公平性。日內瓦獎評審團則在6月24日表示已審查個案,認為申報資料有效並符合標準,將保留潘的銀獎。

但按照 AIHS 近日聲明中的說法,該公司在2024年3月獲彭詠枝委託,於去年3月11日至2025年6月16日分三個階段製作、升級和完善 MediSafe,時間早於潘浠淳得獎;同時在過去一年多來,AIHS 斷斷續續參與 MediSafe 的研發工作。這跟新一代文化協會和學苑的說法有出入。

另外,日內瓦國際發明展的香港聯絡人楊孟璋近日亦回應傳媒查詢,指潘參賽時向評委展示她的創意概念,輔以一套自行開發的原型程式來說明,但沒有採用任何專業系統做展示,認為她是基於創意和原型而獲得銀獎。

端傳媒去信各涉事單位查詢,部分單位於8月12-13日回應。教育局指已要求學苑及香港比賽主辦了解,學苑及相關機構正在查證資料,局方會繼續與相關單位保持聯絡。創新科技及工業局下的數字辦則回覆,教育城的相關調查結果將適時公布。

教育城則指自知悉事件起已立即了解及跟進,包括向涉事人士及機構搜集資料並提問,亦一直以嚴謹、透明、公平公正的方式積極跟進,相關工作仍在進行中。就 AIHS 發表的聲明,教育城正要求有關機構及人士提供更多資料,釐清事實。

學苑則於18日以調查報告作回覆,報告指「藥倍安心」符合比賽規則,同時建議比賽機構持續檢視申報機制。

學苑指進行了約兩個月的調查,重申該學生早在2024年1月及2月分別向「第26屆香港青少年創新科技大賽」及「少年警訊創新科技大賽2023-24」遞交作品,提交合共22頁的簡報,涵蓋了問題分析、原理、立論、個案例子、應用程式須具備的功能及建議解決方案等。學苑取得電郵資料,確認該學生於2023年10月已向老師提出其作品概念。

學苑又指,確定相關美國公司及該學生家長,在向兩項比賽遞交作品後的時間點、即2024年3月開始聯繫。據了解,雙方以有關同學的作品資料,包括設計理念及操作原理等資料為基礎,展開商討工作的方向,對於該公司提到其作品「完全從零開始」(entirely from scratch),學苑認為說法值得商榷;但及後雙方交涉的商業活動不屬於其調查範圍,不宜評論。

對於原創性討論,學苑表示每個比賽的評審準包括創新性、作品是否具科學性與實用性、參賽者是否具有 ESG 理念、領導才能及創科熱誠等。文末建議比賽機構在日後要求參賽者必需留意各樣使用人工智能及數據的道德原則,包括需妥善申報任何涉及專業技術及第三方意見的情況。

學苑亦表示,對在過去兩個月不同人士遭受攻擊等感到痛心,希望各界能停止相關行為。「對於家長或者學生而言,獎項並非最重要,參賽的過程、培養正直及良好的學習心態最為可貴。」

吹哨者鄭曦琳表示最初對 MediSafe 生疑,是因為當中的技術和編程語言「未必是一個中四學生可以做到出來。」攝:林振東/端傳媒

三:MediSafe 是否原創?何為原創?其他科研學生怎樣看待今次事件?

MediSafe 是否由潘浠淳原創、何謂「原創」,是事件最大的爭議點。

事件中的吹哨者鄭曦琳接受端傳媒訪問,表示最初對 MediSafe 生疑,是因為當中的技術和編程語言「未必是一個中四學生可以做到出來。」她解釋,網站分為前端的界面,以及後端的系統——例如是次的藥物數據儲存和 AI ,而將兩者整合,成為可用、甚至商用級的平台,屬十分複雜的事。「大學三四年級才會教,又或是資優學生從小到大、編程幾年後才學得到。」

她又說,不少編程界人士會在代碼托管平台 GitHub 分享代碼,但她未見潘浠淳在 GitHub 的帳號和以往的編程紀錄,因此覺得事有蹺蹊。

端傳媒曾聯絡一名於香港從事 AI 工作的人士,他表示「公開討論比較敏感」而拒絕受訪。

今年3月潘浠淳受訪時,表示已為系統申請短期專利。翻查過往的訪問,她沒有否認獨自研發 MediSafe,也沒提及「AI Health Studio」跟產品有關連。她在5月接受香港電台訪問,主持人指 MediSafe 利用病人病歷和公開數據,中學生未必認識或有機會研究。潘浠淳回答說靈感來自醫生開錯藥的新聞,而她曾在於醫院和診所實習,所以思考以 AI 填補漏洞。她表示對 AI「有一定認識」,曾參與 Azure AI 和 AI 及處方藥物相關的課程。

主持人笑說潘浠淳「單打獨鬥」,獨自思考程式和搜集資料。潘浠淳說研發過程有困難,她經常需要 debug(除錯),又認為自己性格頗獨立,提及有兩位醫生在研發過程中為她解答醫學問題。

「在 technical 方面,我覺得有這樣能力去 handle 到、解決到問題,就會盡量獨立去完成。但當我意識到是 out of my reach……我都要去請教別人,或問別人的 opinion。」潘浠淳當時說。

回看潘浠淳參賽的時間線,按學苑日前說法,她早於2023年10月提出作品概念,又在2024年1月參加「青少年創新科技大賽」,證明項目具原創性。翻查資料,潘浠淳和另一位朱同學在2024年3月於該賽事代表聖保羅男女中學,以 MediSafe 奪得一等獎。該賽事由新一代文化協會主辦,學苑協辦。

鄭曦琳表示不知道潘浠淳有否在2023年製作 MediSafe 平台,但她指潘在2024年獲得「香港資訊及通訊科技獎」,官網的得獎名單顯示 MediSafe 的網址—— 指明潘浠淳似乎提交了Al Health Studio 第一期開發的 MVP 參賽。「我們看到一定有外判的元素在裡面,不是學生100%原創的作品。」

AIHS 發聲明後,鄭曦琳曾以潘浠淳於日內瓦國際發明展中所用的海報,詢問 Ahmed Jemaa 該作品是否由 AIHS 研發。Ahmed Jemaa 回答指海報所顯示的使用者介面(UI)跟 MediSafe 的最新版本相似,顏色、設計和元素亦與公司發布的一致,「似乎是基於我們的工作」。他當時指日內瓦國際發明展從來未聯絡其公司進行調查。

A 同學是去年香港資訊及通訊科技獎的參賽者之一,他用半年構思和製作產品,以往在不同科研比賽中跟潘浠淳碰過面。他覺得要視乎評審準則決定作品是否合規,不過「有些事可能合規,但不是很道德,你明白嗎?」

「評審的決策怎樣都會跟 product 的 demo 有關,而這個 demo 不是她(潘浠淳)做的話,對我們不公平,尤其給錢一間大型公司幫你開發,這樣更加不公平。」他指坊間不少科研比賽的參賽者是「sell concept」,因為評分準則亦包括匯報和組織能力;現成產品只佔其中一部分,但是「當然最後贏的大部分都有喇。」

若然「請槍」事件屬實,A 同學認為相關機構應取消獎項。

香港資優教育學苑「傑出學員獎」得主潘浠淳。網上截圖

一名不願意具名的香港科研專家 B 則向端傳媒表示,不同科研計劃對原創性的定義都有所不同,且每一個科研比賽的定位不同,「小學生或中學生比賽,我想一般而言,你不會 expect 他自己做整件事出來。但去到諾貝爾獎,當然需要有很多證明。」

他認為要由比賽主辦單位解答:「我們討論的完成度是去到哪個位置?每個人都有 idea,但是否真的做到?是不是 fraud(欺詐/作弊)呢?比賽機構準則是什麼?」

鄭曦琳對學苑和教育城的調查結果有保留。她不認同學苑有關「概念原創性」的說法,認為實行方法在比賽中同樣重要。「概念固然佔一個成份,但怎樣去實行這個概念,都是我們作為 science 人會 concern 的……例如我要造一架火箭,但不知道怎樣造,只給一個 idea,而這些人(評審)憑著一句 idea 去評分。」

「任何人只要提出想法,就能將整個產品交由第三方完成,這對於真正由學生獨立研發、從零開始的參賽者極為不公平。」她指,「有資源聘請外判公司的學生,將比沒有資源的學生佔盡優勢,違背比賽『公平競賽』的初衷。」

她以香港青少年創新科技大賽為例,指引列明個人參賽須由單一學生獨立完成作品,小組參賽則最多三名學生組成,必須共同完成作品;香港資訊及通訊科技獎則要求有關產品或服務的主要創新、設計及研發,必須來自香港的資源。她認為若參賽作品的技術開發大部分由外判公司完成,已經不再符合比賽的精神與規定。

鄭曦琳又指學苑和教育城未有回覆 AIHS 有關彭詠枝「請槍」的指控,但讓公司將傳媒查詢轉介給它們,做法有如「不希望大家追究」,「會覺得很黑,好像包庇的這些同學的作弊行為……令人覺得比賽就是這麼不公平,就是可以益(有利)有錢請槍的學生。」

她希望相關機構能回應大眾質疑,澄清事件的始末並讓調查透明。在比賽評審制度上,她認為機構應嚴肅且認真檢查作品的原創性,例如評估學生的能力範圍,以及審視他們親自製作的證明。

A 同學說科研圈子對事件的討論寥寥,他亦專注在自身的研究上,「如果其他參賽者有不誠實的行為,其實我們改變不了什麼,可以做的是令到自己的 project 更加好。」他說自己不會「請槍」,有公開項目的程式碼,亦不是為爭勝而參賽。「就算沒有這個比賽,我都會想做這個 project。」

四:科研比賽流程是怎樣的?想進入科研界的學生,面對競爭有多大,怎樣想自己的出路?

自6月以來,鄭曦琳於社交媒體上發佈多項帖文狙擊潘家,做法備受爭議。她向記者解釋,這不是私怨,而是想比賽公平進行,以及讓外界反思不良的競爭風氣,「我希望大家去享受學習、building 的程序(過程),也不要為了入學、為了名譽去參加比賽,製作 APP。」

她說自己對事情反應很大,是因為感同身受。鄭曦琳今年初參加一個科學園的比賽,其中一組參賽者的指導顧問為博士生和教授,讓她覺得不公。她指該比賽沒有規定參賽者列明分工和崗位,「只要那位學生不公開,大家真的不知道有幾多成是其他人做,或者自己做。」

她解釋,香港的創科比賽通常給予一段時間作研發期,參賽者毋須現場製作產品,而外國較常見的 Hackathon(黑客松) 則是將參賽者聚集起來,規定他們在限時內現場編寫程式,「至少看到對手的電腦在做什麼」,她覺得這較為公平。

鄭曦琳也覺得有評判未必具有技術背景,難以看出作品有否「請槍」。她認為香港比賽著眼在商業價值,外國會看技術,聚焦部分不同,香港有些比賽的評審來自創業投資、銀行或學術界,會考慮商業成分、市場定位和項目可行性評分,但將技術部分放輕。

另外是搜集證據的難度。鄭曦琳最近在中學的科研比賽中擔任評審,參賽者向她匯報和展示海報,並回答問題。她說有項目太複雜,令她很驚喜,估計背後有老師協助,不過她沒有證據,亦無從跟進。

「可能大家有種心態,assume 這些比賽全部人都會『請槍』。」鄭曦琳說。「我們肉眼看得出來,但沒有實質證據。沒有實質證據的話,就不可能令到這些人被取消資格。」

潘浠淳以Medisafe平台參加獲得2024年香港資訊及通訊科技獎學生創新大獎。網上圖片

事件的另一爭議點,是名校和家長給予學生、子女的資源,與其他背景的學生之間的差距。

回想去年的香港資訊及通訊科技獎,A 同學說初賽和決賽均以即場匯報形式進行,匯報約長10分鐘,評審向他提出問題,包括有沒有其他人幫忙、市場上有沒有類似的現成產品等。他指比賽競爭很大,幾百個項目當中,或只有十多個獲獎。

不過在他看來,「請槍」參加科研比賽是少數情況,因為他跟同好言談之間,能聽得出他們有研發產品的能力,而且「請槍很貴。」他評估聘請外國公司研發類似 MediSafe 的項目,花費約為10多萬港元。而鄭曦琳根據 AIHS 的公開資料推算三個開發階段:MVP、功能改進和 UI 優化的合計成本至少約為15萬港元。

談到參賽的意義,鄭曦琳覺得是興趣之餘,也有不少學生為了堆砌履歷,從而在競爭中突圍而出。她留意到 AI 行業在國際上很吃香,但香港較少大型科技公司和技術崗位,所以不少學生會考慮到英美發展。而英美學校收生著重課外活動和獲獎經驗,外國的競爭又比香港大,「無形地令學生去 push 自己、去奪獎。」

她又提到「直升機家長」和「怪獸家長」等,覺得家長和社會對帶起不良競爭風氣有責任。

A 則覺得,「最重要是我喜歡這件事,所以想挑戰,看我有幾勁、能力在哪。」建立人際網絡、提高產品知名度,以及獲獎會有助升學等,都是他參賽的原因。他說亦有參賽者對創科興趣不大,只為了奪獎入讀心儀大學。

他不同意鄭曦琳所指的科展很多時是「富家子弟玩具」。訪問開初,A 指明:「我的屋企很正常,我家人不懂創科。」他來自非傳統名校,學校資源不多,而他在幾年前從網上自學 AI,現在正鑽研自己的產品,找機會創業。

「對於普通學生來說,這些比賽反而才是機會。我們沒有參加這些比賽的話,我們那條路就剩下讀書和考 DSE。」他說。

五:MediSafe 還面對哪些醫療倫理,以及版權侵犯爭議?

除了非原創的指控外,鄭曦琳亦質疑 MediSafe 違犯病人私隱和侵犯版權。

潘浠淳在今年4月的訪問談及,其時已經有醫生試用 MediSafe,「為逾千名病人處方藥物,至今系統未有出錯,準確度達百分之百。」她又指曾向78名醫生諮詢建議,其中76位推介繼續使用 MediSafe,另外在5月訪問中,她曾表示讓一間腫瘤中心和一間專科診所的醫生試用平台。

而2024年香港資訊及通訊科技獎中,評審亦曾提到 MediSafe 經過「醫生和大量臨床病患實證,這個系統有效協助醫生處方藥物」,減輕醫療經濟負擔,以及對醫療安全起重要作用。

6月19日,潘冬平回覆《明報》查詢,開腔指潘浠淳作品採用「模擬病人(simulated patients)資料」,又表示十分重視病人私隱,從沒採用或向第三方提供任何病人資料。AIHS 8月的聲明亦提及系統沒有涉及真實病人的數據,而是使用由電腦模擬或演算法產生的合成數據(synthetic data)。

相關機構之一學苑則指,該平台的數據收集符合它們協辦的比賽及創科用途,學生在參賽時遞交的報告已註明資料僅為「模擬病人」的數據,惟在部分展示品存在令人誤會的用詞,已提醒留意及改善。又指經該藥物數據庫澄清,該藥物數據可用於非商業用途,未有違反當時的使用條款。

AI醫療輔助平台「藥倍安心(Medisafe)」。網上截圖

不過,這並未釋除鄭曦琳的疑慮。她指 AIHS 僅就開發期間使用的數據作出回應,但她針對的是平台開發後,潘浠淳曾稱有逾千個病人經 MediSafe 獲處方藥物——她認為,這些數據有可能在未獲病人同意下被儲存至系統內,甚至泄漏到海外的伺服器。

鄭曦琳又補充,當數據被用於訓練或查詢模型,將難以被完全清除。她指即使潘以「向量資料庫」(Vector database)儲存病歷,把文字變成特殊數字,而非儲存原文,亦不代表安全。這因為在「模型反轉攻擊(Model Inversion Attack)」中,黑客可以設計問題「試探」AI 模型並猜出原始內容。「即使只留『數字指紋』,別人仍可能從中拼湊出原本的病歷。」她說。

另外, MediSafe 透過 Microsoft Azure Open AI 整合雲端資料庫的病患和藥物資料,鄭曦琳亦擔心數據會被傳送至海外伺服器,失去香港法律的保障。她指希望潘浠淳能釐清有否以真人數據試用 MediSafe。

另外,MediSafe 使用了 Rxlist、Drugs.com 及 WebMD 三大線上藥物資料庫的資料。鄭曦琳質疑這些商業網站沒有官方 API(Application Programming Interface,允許不同的應用程式、系統等之間共享資訊與功能)供人合法提取數據,潘浠淳或以「數據抓取」(俗稱「爬蟲」)大規模複製資料到 MediSafe 的數據庫內,有侵犯版權的隱患。

就此,她和網民向 Drugs.com 查詢事件,在今年6月得到電郵回覆Drugs.com 表示沒有授權讓 MediSafe 複製、散佈和使用網頁上的資料,而在未經授權下使用網頁的內容會構成侵犯版權和違反使用條款。平台又指已向 MediSafe 發信要求將有關內容移除。

「這的確是一個很常見的挑戰。」接受端傳媒採訪的科研專家 B 表示,本地大學也正努力解決科研過程中出現的私隱、版權問題,「人工智能就是數據訓練,如何去保障?Federal learning (聯盟式學習)是其中一個方法。」但是這個技術還有改進空間,大學亦正研究利用科技梳理版權使用的追溯等等。

他又指,目前許多大公司會提醒員工不要將數據輕易放上公開 AI 平台,也開始會以企業人工智能,即私有化 AI 模型確保數據在獨立的環境中使用,確保其私隱性。「AI 私隱是一件頗費力的事。」被問到學生科研項目是否有足夠資源做到相關保障程度,他指未能論斷,要看看個別人士是不是相關方面的專家。

鄭曦琳對記者表示,最近收到的恐嚇很頻密,感到很大壓力,「其實我更擔心的不是自己,而是這些事件會削弱公眾對教育和科研的信任。」她計劃未來轉到美國升學,繼續做 AI 醫療相關的研究和發展初創,「因為在那邊的科研環境、學術風氣、創業機會都更加開放和多元。」

「我相信這才是對社會真正有價值的方向,而恐嚇只會令我更確信這條路要堅持走下去。」她說。

(端傳媒曾去信潘浠淳 LinkedIn 上顯示的電郵地址、經香港肝癌及腸胃癌基金會向潘冬平、彭詠枝尋求回應,並兩度致電至潘冬平成立的香港肝膽胰及結直腸微創外科中心,截稿前未獲回覆。)

(尊重受訪者意願,A 及 B 均為化名。)

評論區 3

評論為會員專屬功能。立即登入加入會員享受更多福利。
  1. 身有屎仲咁理直氣壯我第一次見

  2. 黃子華:Buffet 不妨食過份,出貓唔好太高分

  3. 多謝端,多謝鄭曦琳。