本课题的特色是多学科、多领域的有机整合,技术路线清晰明确,并易于延展。在自行开发的自组织图整合平面展示技术(Component Plane Presentation integrated Self-Organizing Map,CPP-SOM)(US patent:6,897,875B2)基础之上,进一步优化SOM算法,利用巴拿马草帽型邻近核心函数进行预处理,结合奇异值分解(SVD)、假发现率(FDR)等一系列算法和方法实现在统计显著水平上调变基因的特异性筛选,并对整合转录因子-DNA结合作用数据、蛋白-蛋白相互作用数据进行大量实践,深层挖掘。以SOM为核心的CPP-SOM、EDGE、SOM-SVD等为蕴藏在组学数据背后生物学信息深层挖掘搭建了扎实的分析平台,为转录调控网络的研究提供了极大的便利。目前取得的阶段性成果包括三篇SCI文章:Current Drug Metabolism(2008,9,1038~1048)、PLoS ONE(已投入),其中数据分析过程中用到该方法的文章已发表在BMC Genomics(2008,9:369)。相关软件正在申请专利中。
本课题开发的SOM-SVD基因筛选方法、CPP-SOM基因聚类与可视化展示技术在各大科研教育机构(上海生命科学研究院各大研究单位、上海交通大学医学院以及附属瑞金医院上海血液研究所)得到了推广,并免费提供用于科研。相关研究结果已广泛地开展交流,并参与转录组数据挖掘方面的培训。这无疑将会对中国的转录组学以及其它生命科学领域的纵深发展做出方法学的贡献,有着较为广阔的应用前景。
本课题组将进一步推广与应用所开发的数据分析方法,提高其在国际上的认知度,树立在海量组学数据挖掘领域以CPP-SOM为核心的生物信息分析与可视化框架的品牌。 |