生物信息中常用的Linux命令

Overview 一直想把常用的命令搜集起来,以便平时用到的时候查阅,可惜一直没抽出来时间专门整理下。最近在做序列的特征提取和多个特征文件合并时,频繁使用到了一些命令,干脆一并整理到这里,以后边用边添加整理新的命令。 这里的linux命令主要在MAC 10.9.5和Ubuntu 14.04下测试,涉及到平台差异性的时候,会尽量指出来,没有区分的话就表示两种平台下都可以使用。如果仍有没涉及到...阅读全文>>

python转换文件格式的一处bug

Overview 在转换fasta格式的文件为chen's format文件时,发现前人的程序有些bug,会将最后一条正样本的class标记为-1于是将程序改了一下,这下就没有问题了。 解决方案 fasta格式如下,第一行为头信息,第二行为氨基酸序列: >sp|Q2YIT7|VIRB3_BRUA2 Type IV secretion system protein virB3 OS=B...阅读全文>>

R中randomForest包与ggplot2的一个不兼容问题

Overview 在做实验的时候因为要用到随机森林,所以使用了R中的randomForest包,但在画图的时候报了一个非常诡异的错误。 1. 错误描述 下面是我引入randomForest包之后的代码,这里省略了一些细节,只保留跟错误有关的代码: ## randomforest library("randomForest") # randomfo...阅读全文>>

使用R语言ggplot2包画图时的一个不兼容问题

Overview 昨天写了个R语言脚本,主要是借助ROCR包画ROC曲线,只是最后画图时,没用ROCR提供的plot函数画ROC曲线,而是用ROCR处理了数据后,提取了画图的数据,用ggplot2包画了ROC曲线。因为ggplot2可以提供强大的自定义绘图功能,没想到也正是这个自定义样式函数,在移植的时候出现了一些兼容性问题。 1. 问题描述 我使用的ggplot2样式函数,是一个我已经用...阅读全文>>

R语言学习笔记(一)

写在前面的后记 昨晚写完这一篇的时候,Chris看了之后跟我讨论道:“R语言开篇讲述的基本数据类型为什么和C语言等编程语言不同?”后来得出结论:每种语言都有其最适用的领域,以R为例,它主要运用在统计学领域,处理大量数据,基本单位就是向量(vector),故将其他语言中的int类型视为最简单的一维向量,如c(5)。我后来验证了从矩阵中取出一个值,类型为vector。同样的道理,Perl语言...阅读全文>>

配置Hibernate解决MYSQL连接失效问题

Overview 之前将SecretEPDB部署到了云服务器上之后,再打开需要连接数据库的网页时总是会出现莫名其妙的错误,之前一直没管它,主要是因为这个错误不是每次都出现,出现之后刷新几次又可以访问了。 1. 错误描述 每次打开需要连接数据库的网页,就很有很大概率出现下面的错误信息: Struts Problem Report Struts has detected an unhandl...阅读全文>>

perl调用系统命令的3种方式

Overview 有很多时候,我们需要在perl脚本中调用系统命令,比如调用系统的某个软件做一件事。也可以说是在perl脚本中调用外部命令,比如在一个perl脚本中调用另一个perl脚本。 有很多种方式可以实现这个目的,这里我列出来3中常见的方式,并以一个例子说明这三种方式的不同之处。 1. 被调用的perl脚本 我们在一个perl脚本(取名为testSystemCall.pl)中调用另一...阅读全文>>

SCRATCH的预测结果格式

Overview 最近在预测蛋白质序列的二级结构,结构性区域,水溶性等特征时,使用了不同的软件,发现不同软件预测结果中对同一特征的表示方式略有不同,所以在这里一并总结。 1. SCRATCH中的输出格式 我们在 SCRATCH的安装和使用 介绍了SCRATCH的安装和使用,直接使用 ./run_SCRATCH-1D_predictors.sh input_fasta out_prefix...阅读全文>>

BioPerl(三):巧用BioPerl格式化fasta文件

Overview 在处理fasta格式序列的过程中,我们经常会发现得到的fasta格式并不是很标准,比如有一个fasta文件中有多条这样形式的序列: >gi|28898692|ref|NP_798297.1| hypothetical protein VP1918 [Vibrio parahaemolyticus RIMD 2210633]|1 MKKTTLMSAVVATLSLVGC...阅读全文>>

BioPerl(二):使用BioPerl读取fasta文件

Overview 在 BioPerl(一):安装BioPerl 中我们不只安装了BioPerl,还给出了一个使用BioPerl的手动构造了一个Bio::Seq对象的例子,这个对象中包含了我们手动填入的fasta格式的信息。既然可以手动构造,那么也就可以从fasta文件中读取序列信息,由BioPerl自动填充成Bio::Seq对象。 1. 使用BioPerl读取单条fasta序列 我们有一个...阅读全文>>