达尔文树-分子数据分析与应用环境 (DarwinTree-Molecular Data Analysis and Aplicaiton Enviroment) 是以陆地植物为切入点并逐渐拓展到整个生物世界系统内发育研究的数据汇集和系统发育分析的网络集成平台。该平台旨在以陆地植物为切入点,通过批量下载和甄选网上共享数据资源(如GenBank,DDBJ和EMBL),并实现自测数据的上传和整合,建立一个包括苔藓植物、蕨类植物、裸子植物和被子植物在内的所有陆地植物的分子数据库,并实现系统发育树的流程化构建,以方便用于以系统发育为基础的相关科学研究,为本领域及其他相关领域的科学研究提供应用和操作平台。
达尔文树项目网址:www.darwintree.cn
*注:2010年3月原"陆地植物系统发育平台"正式更名为“达尔文树-分子数据分析与应用环境”。
自1753年瑞典博物学家林奈出版《植物种志》(Species Plantarum)以来,人们开始广泛使用人为分类体系为丰富多彩的生物界确立秩序。在其后的200多年里,系统发育研究由主要依靠形态学特征逐渐过渡到形态学和解剖学等传统方法与分子生物学技术相结合。尤其是近年来各种分子生物学技术的快速发展,使分子手段更加广泛地应用到系统发育研究的各个方面。
常规系统发育分析需要经过数据搜集、整理和分析计算等各个步骤,同时需要借助一系列的分析软件包(BLAST、Clustal X、BioEdit、PHYML和MrBayes )才能最终完成系统发育重建过程。在这些分析过程中,研究人员往往需要手动将大量的数据进行处理和格式转换,以实现在不同分析软件包中的数据识别和运算。同时,大量的手动处理不仅费时费力且极易出错。因此,面对繁重的数据处理工作,迫切需要一个能够整合多种系统发育分析工具,实现数据在不同软件包之间的自动输入/输出和格式转换,从而达到系统发育树的流程化构建。达尔文树就是基于这种科研需要而开发的网络集成平台。
达尔文树旨在以中国陆地植物为切入点,构建涵盖整个陆地植物分子数据浏览与管理、多种数据处理和分析的网络资源(图1)。该平台的主要功能包括:(1)从公共数据库(如GenBank,DDBJ和EMBL)自动获取和甄选数据,并保持数据的及时更新;(2)实现自有数据的提交和系统发育构建,并保证公共和自测数据的结构化、整合化;(3)实现系统发育树的流程化构建(包括数据抽提、甄选、整理,系统发育关系的构建和评估);(4)根据目前系统发育研究领域的发育趋势,实现超大树的构建和组装。
达尔文树项目于2009年4月正式启动,由来自北京和深圳两地的三家单位共同实施开发(深圳市中科院仙湖植物园,中科院植物研究所,中科院计算机网络信息中心)。目前平台共有44名相关领域的专业人员来负责和参与平台的开发、测试和功能改进,以期在接下来的几年内构建一个完善的系统发育网络平台系统,并选择合适的分子标记对中国陆地植物3980属进行测序,从而完成中国陆地植物系统发育超大树的重建。
截止到2009年12月16日,平台数据库已经具有包括苔藓植物、蕨类植物、裸子植物和被子植物在内的共44772条基因序列(图2)。在系统发育分析软件开发方面,目前平台已经可以实现在线多序列比对、系统发育分析(包括最大似然法和贝叶斯分析)和系统发育树的编辑等功能。
版权所有:深圳市中科院仙湖植物园 粤ICP备09129350号-13
联系地址:深圳市罗湖区仙湖路160号仙湖植物园 邮编:518004
咨询电话:(0755)2573 8430 Email:lvyoubu@szum.gov.cn
您是第 位访问者 自2009年10月1日起