賀!蔡宗翰教授研究團隊在BioCreAtIvE V.5國際分子生物競賽之「基因與蛋白質相關對象辨識」項目榮獲第一名

2017-09-01 15:07:05
/file/6431c5286b0799f5cc80aaa4be1dea70

由中央大學資訊工程學系蔡宗翰老師領導的IISR研究團隊,與中研院資訊所IASL研究團隊合作,共同合作參與 2017 年西班牙巴塞隆納舉行的BioCreative V.5國際分子生物競賽之「基因與蛋白質相關對象辨識」項目,榮獲第一名的佳績。其中參賽的隊伍包含來自哈爾濱工業大學、大連理工大學、法蘭克福大學以及歐洲等世界各地的頂尖團隊。

基因與蛋白質相關研究成果對生醫人員極為重要。以往基因與蛋白質名稱辨識相關研究中,主要為辨識生醫摘要中的基因與蛋白質相關字詞組。但是在這些大量的基因與蛋白質名稱中,其實僅有可以連結至公開生醫資料庫(例如:EntrezGene或UniProt)的名稱,才是對生醫研究人員真正有意義的資訊。因此「基因與蛋白質相關對象辨識」項目中,主要目的是從專利文獻之標題及摘要中,辨識出重要的基因與蛋白質名稱。本研究團隊使用一種新的方式(統計式準則模型),其為一基於模版的機器學習方式,能在高召回率下(於所有隊伍中,有最高的召回率及F-Score),辨識基因與蛋白質相關對象。並使用條件隨機域模型來根據競賽提供的語料,學習與微調辨識名稱之邊界。