GPAT生物序列(liè)模式搜(sōu)索程序是(shì)时下互联网常用的教育教学软件之一,该软件(jiàn)绿(lǜ)色、安全、无毒,让你(nǐ)可以放心使用(yòng)。
GPAT生物序列模式搜索程序,开发的(de)基(jī)于IBM Splash算法的生物(wù)序(xù)列模式搜索程(chéng)序。运行环境为LINUX,多线程运行,使用(yòng)多CPU,运行速(sù)度快,特别适(shì)合序(xù)列中重复模(mó)式的(de)定位(wèi)。
目的获取(qǔ)IBMSPLASH算法(fǎ)核心代码,为进一步开(kāi)展生物序列模(mó)式识别(bié)研究(jiū)提供一个高效(xiào)算法(fǎ)引擎。方法基于SPLASH算(suàn)法开发核心代码,运(yùn)用开(kāi)源软(ruǎn)件工(gōng)具(jù),开(kāi)发、调试和优化程序。结果开发出GNUPattern(Gpat)程序(xù),高效实现了SPLASH算(suàn)法的核(hé)心部分,并提供全部源码,其他研究人员可(kě)以在GNU许可协议下修改(gǎi)该程序。结(jié)论Gpat成功地实现了SPLASH算法,并为下(xià)游生物序列模式识别研究提供铺垫。
生物序列数据挖掘的主要目的是(shì)识别序列中(zhōng)的功能元素、研究序列(liè)间的相(xiàng)互关(guān)系等等。生物序列模式挖掘和(hé)生物序列聚类(lèi)是生物序列数据(jù)挖掘中重(chóng)要的(de)两个研究内容。生(shēng)物(wù)序列模式挖掘是(shì)识别功能(néng)元素进而了解(jiě)序(xù)列功能等的关键技术, 序列(liè)模式还能够描述序(xù)列(liè)特(tè)征,作为生物序列聚类相(xiàng)似性(xìng)度量(liàng)设计的依据(jù);生(shēng)物序(xù)列模式挖掘也是生物(wù)序列(liè)关联分析(xī)的基础。生物序列聚类是研究序列间相(xiàng)互关系进而解释进化关系等的主(zhǔ)要(yào)手段(duàn),其结果是具有共同特征的(de)序列簇;另外(wài)在这样的簇中挖掘序列模式能进一步(bù)提高序列模(mó)式挖掘结(jié)果(guǒ)的(de)准确率,从而更(gèng)好的指导功(gōng)能元素的识别;生物序(xù)列聚类(lèi)也可作为分类、异常挖掘等的预处理步骤。
