科学网三代基因组拼接软件
- 编辑:admin -科学网三代基因组拼接软件
html5lib-0.999999,再由daligner,排序,精选新闻,支解巨细有参数可控,参考信息: https://github.com/PacificBiosciences/FALCON/wiki/Manual ,SGE。
DAMASKER,需要结合计较机资源以及拼接数据的巨细来选择,进行自我纠错以及查找重叠信息,isodate-0.5.4,这里介绍local, 6.Constructing contig from graph (通过图信息构建 contigs) 按照图信息以及序列构建contigs。
e取值范畴【0.7,所以也可通过参数过滤掉低笼罩度(fc_ovlp_filter完成的),wheel,这些反复区域不能提供特别信息故可通过参数记挂一些, 1.python 安装 1.1 自行下载python安装包如Python-2.7.9.tgz https://www.python.org/ftp/python/2.7.9/Python-2.7.9.tgz tar -zxvf Python-2.7.9.tgz cd Python-2.7.9 ./configure --prefix=你想安装的路径 make make install 1.2添加python情况变量 vi ~/.bashrc export PYTHONPATH=$PYTHONPATH:python路径 source ~/.bashrc 2.virtualenv安装 2.1自行在下安装包 tar -zxvf virtualenv-15.1.0.tar.gz python setup.py install --prefix=python路径 --record install.log 2.2激活进入虚拟情况 virtualenv --no-site-packages --always-copy --no-setuptools --no-pip --no-wheel --python=python路径 $FC(你想指定的虚拟情况路径) . 虚拟情况路径/bin/activate 3. python相关依赖包安装 setuptools,热点新闻,。
LAcheck,具体可以按照集群资源进行设置,PBS,SLURM,PBS,归并 ,按照计较资源来确定) pa_DBsplit_option = -x500 -s200 ovlp_DBsplit_option = -x500 -s200 (-s支解数据块的巨细即block的巨细,pypasing-1.5.7,LAmerge进行查抄,也是由HPC.daligner生成一个所有jobs数的荟萃脚本run_jobs.sh,) #################################################################### pa_concurrent_jobs = 20 ovlp_concurrent_jobs = 20 cns_concurrent_jobs = 20 (提交的任务的并发数。
TORQUE,该软件支持PBS,再按照设定的job_type以及参数投放到节点上,SGE通过qsub,这些模块互相间再彼此比对,decorator-3.4.0等,SLURM用sbatch将这些job投到相应的计较节点上去,rdflib-3.4.0,边的信息存放在sg_edges_list,归并,故过滤之;序列两端的重叠信息冗余,SGE,pip,LAsort,DAZZ_DB,slurm与pbs的配置参数) #job_type=local #job_type=SLURM job_type=PBS input_fofn = input.fofn #input_fofn = preads.fofn input_type = raw(指定输入数据类型) #input_type = preads # The length cutoff used for seed reads used for initial mapping length_cutoff = 10000 用于错误矫正的序列的最低长度 #The length cutoff used for seed reads used for pre-assembly length_cutoff_pr = 10000用于预组装的序列的最低长度 #the job of queue jobqueue = yourqueue ############################################# #THE CONFIGURE OF LOCAL ############################################# #sge_option_da = -pe smp 8 -q %(jobqueue)s【stage-0】 #sge_option_la = -pe smp 2 -q %(jobqueue)s【stage-0】 #sge_option_cns = -pe smp 8 -q %(jobqueue)s【stage-0】 #sge_option_pda = -pe smp 6 -q %(jobqueue)s【stage-1】 #sge_option_pla = -pe smp 2 -q %(jobqueue)s【stage-1】 #sge_option_fc = -pe smp 8 -q %(jobqueue)s [stage-2] ################################################################## # THE CONFIGURE OF PBS ################################################################## sge_option_da = -l nodes=1:ppn=12 -q %(jobqueue)s sge_option_la = -l nodes=1:ppn=12 -q %(jobqueue)s sge_option_pda = -l nodes=1:ppn=12 -q %(jobqueue)s sge_option_pla = -l nodes=1:ppn=12 -q %(jobqueue)s sge_option_fc = -l nodes=1:ppn=12 -q %(jobqueue)s sge_option_cns = -l nodes=1:ppn=12 -q %(jobqueue)s (这是PBS功课调治系统sge_option参数的参考配置信息。
然后再用De Bruijn算法进一步拼接生成contigs,--min_cov 种子序列的最低笼罩度, 要领就是从网上搜源码安装包。
LSF等事情类型,DEXTRACTOR安装包解压,概略的事情道理是将长reads离开成指定巨细模块, Falcon是PacBio开发的一款用于三代基因组devono拼接软件,接着再按照设定的job_type类型,再HPC.daligner生成多个job数的shell脚本放在run_jobs.sh里, #################################################################### 三、输入参数解析:主要在fc_run.cfg文件中 [General]