医药生化之家

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 2838|回复: 0

[交流帖] 常见生物软件使用技巧汇集

[复制链接]
发表于 2015-7-4 22:46:05 | 显示全部楼层 |阅读模式
和生物学软件打交道,难免会遇到各式各样的问题,如何针对不同软件的特点,择优选用以事半功倍解决问题?鉴于此,特整理此帖,希望对新手有用,持续更新,敬请关注(http://user.qzone.qq.com/58001704/blog/1359983112):
Q1.怎么查找序列保守区?
A1:很多人查找序列保守区,一般通过序列多重比对后,肉眼判断序列保守区,但此法难免太主观,不具重复性,且选择的保守区无法受统计上的显著性检验。其实,实现这一目的,可以使用DnaSP-->  “Analysis”  -->“Conserved DNA region”...
【Raindy 注】设计简并引物,用此法,简单易用 ,强烈推荐...

Q2.  多个 FASTA格式保存的单条序列如何批量快速合并为一个文件?
A2 : 一条条添加,费时费劲,且容易出错。解决的办法有两个:一是可以通过DNAMAN的“多重序列比对”后导出功能,即:添加序列所在的目录,或全选相关文件,进行多重比对,导出Clustal aln 文件,然后再转换为FASTA;二是使用我们2012年新开发的序列火枪手套件的“Seq Merger.exe” 即可快速实现合并。

Q3. 如何解决 Clustalx 多重比对(*.Aln格式)后转为MEGA 格式时提示出错的问题?
A3:检查所转换 MEGA 的 *.meg 文件最后几行内容是否有*号,全部删减之即可。因为 Clustalx 多重比对后,程序会自动添加一致序列。

Q4. 为什么DNAMAN软件的很多功能菜单都显示无法使用?
A4:DNAMAN软件的精华在于通道(Channel)的应用,遇到功能菜单呈灰度无法使用时,不妨将序列载入通道后再试试...

Q5. 如何让多重比对美观显示又不占篇幅?
A5:推荐使用Web Logo (http://weblogo.berkeley.edu/logo.cgi)或 Sequence Logo之类的在线工具处理。其实这类工具还有一个妙用-可用于设计简并引物,简并序列一目了然,如下图的第7个碱其位点,G/A=R。

Q6. 如何在多重比对序列的上方显示对应的蛋白质二级结构?
A6:使用 ESPript(http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi)对多重比对序列着色的同时,上传预测的蛋白质结构文件*.pdb 即可,效果如下图所示,详见《马铃薯Y病毒pipo基因的分子变异及结构特征分析》一文。具体操作方法可以参考《ESpript 美化多重比对序列图解(By Raindy) 》。

Q7. 如何批量将核苷酸序列翻译为蛋白质序列?
A7:推荐使用 MEGA 中的Alignment Explorer,先将待翻译的序列以 FASTA 格式保存,鼠标右键“打开方式”选择用MEGA打开,在MEGA界面点击“Translated Protein Sequence”即可(下图箭头指示位置),最后在“Data”菜单导出序列保存:

Q8. 如何快速批量下载指定的序列?
A8:通常办法是借助一些生物软件的检索功能,诸如:Bioedit、Geneious、MacVector等。其实,NCBI自带的Batch Entrez 只需简单三步即可轻松完成这一任务,详见本人空间日志《如何批量下载指定的序列》:http://user.qzone.qq.com/58001704/blog/1359943301

Q9. 如何快速进行基因的选择压力检测及检验?
A9:提及基因选择压力的检测,Phylogenetic Analysis by Maximum Likelihood (PAML)可能是第一反应的分析工具,但PAML的操作令不少初学者望而却步,快速完成基因的选择压力分析,推荐使用一个在线服务器Adaptive Evolution Server(http://www.datamonkey.org/),提交序列后,先选择一个最适的进化模型,再选择一个压力检测方法即可,如:病毒群体的可以选用IEFL法。具体操作方法详见《基因的选择压力检测及检测图解教程(By Raindy)》一文。
【Raindy 注】Adaptive Evolution Server中GARD法是目前流行用于检测重组的方法,非常不错,推荐使用。

Q10. 如何对多重比对序列进行排序?
A10:由于序列比对矩阵分值的不同,Clustalx比对后的序列顺序会发生变化,解决比对后序列重新排序的问题,可以使用两个软件:(1)MEGA5 中的子程序 Alignment Explorer,点击下图中的红色箭头即可实现序列升/降排序;(2)直接用 MAFFT软件比对,在输出格式选项设置输出序列顺序即可,详见本人空间日志《MAFFT多重序列比对图解教程(By Raindy) 》。

Q11. 如何解决 Word 2007/2010 中打开带 EndNote X6/7 的文件响应缓慢甚至假死问题?
A11: 由于Word中某一项拼写和语法检查功能与 EndoNote 冲突,依次打开在 Word 中点击"文件"-“选项”-“校对”-“在Word文档中更正拼写和语法时”标签,取消选中“键入时标记语法错误”即可。

Q12. 如何快速判断测序得到的序列方向并批量删除载体序列?
A12:将测序得到的序列(大于800bp的需先拼接)和参考序列文件均以FASTA格式合并在一个文件内,先在MEGA多重比对,根据比对结果判断目的序列的方向。如果与参考序列差异较大的序列,则可能为需要调整的序列,选定这些序列外,依次在“Data”-“Reverse complement”反向互补后,重新比对后,然后删除参考序列以外的两端序列,最后导出为FASTA的文件即可。

Q13. 如何使用MEGA 批量进行系统发育分析?
A13:图形化界面(GUI)的MEGA每次处理一个批次的数据,不同批次数据需要做相似或相同系统发育分析时,可以用MEGA 6.0 Compute Core (CC) 进行批量分析,将不同批次的数据(每个建树序列/行)保存在一个文本文件中,通过命令行进行: M6CC.exe -a Model.mao -d seqpath.txt -o Modelresults,MEGA 6-CC官网下载地址:http://www.megasoftware.net/megaccusage.php,详见教程:MEGA6 Compute core 图解教程(By Raindy)

Q14. 如何快速批量重命名序列名称?
A14:可以用“借来还去法”实现:将FASTA格式的序列排序后,复制粘贴入Excel文档中,并手动添加第一列,进行编号后,再对第二列排序,实现序列名称和序列内容分离。批量替换序列名称后,重新以第一列排序,最后删除手动添加的第一列,具体操作详见日志:http://user.qzone.qq.com/58001704/blog/1398257250

欢迎提供各种生物学软件使用过程中遇到的问题,To be continued....
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Med&Bio&Chem Family ( 京ICP备17005084号-1 )

GMT+8, 2024-4-27 02:24 , Processed in 0.644930 second(s), 27 queries .

Supported by scjtqs
@Med&Bio&Chem Family

快速回复 返回顶部 返回列表