賀!蔡宗翰副教授團隊於BioCreative V「國際分子生物競賽」榮獲第二名、第四名

2015-11-30 10:09:06

恭賀中央大學資工系蔡宗翰教授的研究團隊在BioCreative V http://www.biocreative2015.org/ 「國際分子生物競賽」的生物性表現語言和專利文獻化合物辨識項目中,榮獲第二名及第四名之佳績。

中央大學資工系蔡宗翰老師所帶領的智慧型資訊服務研發實驗室(NCU-IISR)研究團隊,於2015 年西班牙塞維亞舉行的 BioCreative V「國際分子生物資訊擷取競賽」獲得佳績。該競賽為生醫資訊擷取之最重要國際競賽,自2004年以來,已舉行六次競賽。本屆主辦單位為西班牙國家癌症研究中(CNIO)與美國國家生物技術信息中心(NCBI)。

蔡教授團隊於生物性表現語言(Biological Expression Language, BEL)項目,僅次於NCBI團隊,獲得第二名的佳績。並且在專利文獻化合物辨識項目,從21個來自世界各地的頂尖團隊中奪得第四名。大會於每個競賽項目中就方法新穎性與有效性擇優挑選三隊進行口頭發表。蔡教授團隊在兩項中均獲選http://www.biocreative2015.org/selected-talks

分子生物系統模型的建構與更新對生醫人員極為重要。生物性表現語言競賽主要目的在發展自動化擷取學術文獻中各類生物專有名詞與它們的生物關連性。這項技術能夠加快生醫人員在建構分子生物系統模型與資料庫的程序。跟其它的競賽相比,生物性表現語言項目除了需要辨識及正規化基因、蛋白質與化合物等不同專有名詞,還要分類它們在句子中參與的生物性事件及活動。NCU-IISR 團隊整合近幾年實驗室開發的基因與化合物專有名詞辨識正規化技術,並結合實驗室開發的生醫語意角色標註技術,成功地在競賽中榮獲第二名。

專利文獻化合物辨識競賽,旨在發展化合物與藥物名詞搜尋技術。化合物與藥物專利文獻資訊對生醫人員極為重要。這項技術能夠大幅提升專利文獻的檢索品質。跟上屆的競賽相比,本屆競賽針對專利文件而非學術論文,學術論文通常敘述比較清晰且錯字較少,專利文獻則更加考驗參賽團隊的能耐。在該競賽中,NCU-IISR 團隊針對專利文件辨識化合物與藥物名稱,提出將原子與化合物分開來辨識之方式,並利用事先辨識易與化合物混淆的專有名詞,將化合物專名辨識的正確率,提升至近90%,榮獲第四名。

蔡老師團隊的獲獎,肯定其為國際生醫文獻探勘領域領先團隊之一的地位。且有助於提升本系院校於國際生醫資訊領域的知名度,增進更多國際合作的機會。