1 MB/教育学习
该软件只适用于PC端安装使用,请前往PC页面下载
简介
GPAT生物序列模式搜索程序是时下互联网常用的教育教学软件之一,该软件绿色、安全、无毒,让你可以放心使用。
GPAT生物序列模式搜索程序,开发的基于IBM Splash算法的生物序列模式搜索程序。运行环境为LINUX,多线程运行,使用多CPU,运行速度快,特别适合序列中重复模式的定位。
目的获取IBMSPLASH算法核心代码,为进一步开展生物序列模式识别研究提供一个高效算法引擎。方法基于SPLASH算法开发核心代码,运用开源软件工具,开发、调试和优化程序。结果开发出GNUPattern(Gpat)程序,高效实现了SPLASH算法的核心部分,并提供全部源码,其他研究人员可以在GNU许可协议下修改该程序。结论Gpat成功地实现了SPLASH算法,并为下游生物序列模式识别研究提供铺垫。
生物序列数据挖掘的主要目的是识别序列中的功能元素、研究序列间的相互关系等等。生物序列模式挖掘和生物序列聚类是生物序列数据挖掘中重要的两个研究内容。生物序列模式挖掘是识别功能元素进而了解序列功能等的关键技术, 序列模式还能够描述序列特征,作为生物序列聚类相似性度量设计的依据;生物序列模式挖掘也是生物序列关联分析的基础。生物序列聚类是研究序列间相互关系进而解释进化关系等的主要手段,其结果是具有共同特征的序列簇;另外在这样的簇中挖掘序列模式能进一步提高序列模式挖掘结果的准确率,从而更好的指导功能元素的识别;生物序列聚类也可作为分类、异常挖掘等的预处理步骤。
展开