小编认为学会使用一个东西必须要动手,不能只看,而是带着问题去解决,去学习。
比如说,一篇做基因家族分析的文章,首先他说从NCBI找到了300已知的MAPKKK基因家族成员,把他下载下来了。简单的一句话但这里面需要我们学习的很多,假设我们要模仿他做,那么我们就想这些已知的是如何在NCBI 中下到的,我们就去查,查到可以在nucleotide数据库中下到我们就输入MAPKKK结果出来了一大堆,联想是做植物的我们就只过滤植物的,加一步过滤选项,结果就OK 了,在这个过程中我们学会了如何使用NCBI 的nucleotide数据库,而不是漫无目的的看这个数据库的用法,总之一点我们要按需来学习,多去实战,在实战中学习,我们会进步很快。再有就是我们要做结构域预测,文献中说是这两个网站(CDD:https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi和Pfam: http://pfam.xfam.org/),那么我们就挑个序列上去戳弄戳弄,用不了多少时间我们就搞明白了用法,理解了结果,这样一来我们后面批量操作本地版本的结构域预测软件就容易了,知道如何输入输出,如何设置参数。最后就是好多初学者不知道用什么工具分析,或者就是相同的工具有好多个不知道选用哪个,这个就要根据你的研究目的来选,因为每个工具都有他侧重的一面,建议大家看最新发的工具,往往他会有跟前面工具的对比,顺便提到各工具的适用性。3、初学者part3本期小编主要介绍一些入门书籍,并有电子版可供下载。
基因组学相关的书籍:j基因组学概论这本书比较全面系统的介绍了 DNA、蛋白质序列和结构、基因组、蛋白质组、转录组和系统生物学内容,也分别对原核生物、真核生物、人类基因组结构和特性进行了介绍和比较,并将基因组变化和进化联系起来。下载地址:https://pan.baidu.com/share/link?uk=1208225235&shareid=404590447生物信息分析相关的书籍: Liunx操作系统:生物信息分析大多数软件都是在Liunux系统下运行,因此必须学会Linux操作系统。k鸟哥的Linux私房菜《鸟哥的Linux私房菜》第3版是最具知名度的Linux入门书,该书全面而详细地介绍了Linux操作系统,生物信息入门优先可以看第三部分,该部分主要介绍 Shell Script以及文字编辑器Vim,当然如果想进阶的话可以学习其它几部分。下载地址:FTP地址:ftp://ftp1.linuxidc.com用户名:ftp1.linuxidc.com密码:www.linuxidc.com在 2016年LinuxIDC.com\2月\鸟哥的Linux私房菜-基础学习篇(第四版)高清完整书签PDF版\计算机语言: 目前比较盛行python,但perl仍然也经常用,一些生物信息学软件也都是用perl写得。小编因此推荐以下两本:lLearn Python The Hard Way此书翻译过来是笨方法学python,不用说绝对是入门好教材。下载地址:http://vdisk.weibo.com/s/FNWd70pFyC8SmPerl 语言入门《Perl 语言入门》第六版,也就是大家所称道的“小骆驼书”。学完这本书基本可以满足生物信息的分析的需求,如果还需要进阶,推荐阅读俗称“大骆驼书“的《Perl高级教程》。下载地址:FTP地址:ftp://ftp1.linuxidc.com用户名:ftp1.linuxidc.com密码:www.linuxidc.com在 2014年LinuxIDC.com\8月\Perl语言入门 第六版中文清晰PDF生物信息常常需要大量的数学统计分析,且大部分结果需要已图形的方式展示,这就需要有一定的统计能力和画图能力,目前用的最广且开源的语言就是R语言。nR语言编程艺术《R语言编程艺术》,该书从最基本的数据类型和数据结构开始,到递归和匿名函数等高级主题,由浅入深,讲解细腻,读者完全不需要统计学的知识,甚至不需要编程基础。下载地址:FTP地址:ftp://ftp1.linuxidc.com用户名:ftp1.linuxidc.com密码:www.linuxidc.com在 2016年LinuxIDC.com\4月\R语言编程艺术 中文完整清晰书签版PDF\各种生物数据分析软件:o常用生物数据库分析软件《常用生物数据库分析软件》作为生物信息学经典图书,本书罗列了一些常用的生物数据分析软件,从安装到运行都有具体说明,非常适合入门级使用。下载地址:http://wenku.baidu.com/link?url=6orr9Fdqfgkk14KB3__yd93-1x5LaqRC3_hl7etM91EhtUmc1yJVCDzI_bDXP2laAk-ijdyEJGYLXLSZyKeaQOK7GTu8gV3_sxOTV_G-8Wy总之,上面的书籍都是入门的工具书,可以边用边学,会有助于你迅速入门。同时大家也应该积极阅读一些文献,尤其是一些protocol,这样能够及时掌握目前流行的分析内容及好的工具。4、初学者part4其实妨碍大家进行生物信息学学习的一个比较关键的地方就是编程了。生物信息学是大数据科学,这就要求必须具备一定的编程思想,会采用计算机程序从庞大数据中挖掘有效信息。这就要求我们会基础编程,并且更重要的需要我们精通的是会安装和使用生物信息学软件。首先计算机编程这一块有时候也是比较重要,毕竟不能手工进行处理庞大的数据吧。其实编程这一块主要是为了结果过滤,毕竟软件出来的往往并不能满足自己想要的结果,这就需要对软件出来数据进一步深挖过滤,拿到真正对自己有用的数据。编程这一块有人推荐学perl,有人推荐Python,无所谓了,关键看你周围的人用什么编程,方便在遇到问题时能够及时的解决。如果你对perl感兴趣,我们前天发过Linux与perl的推送,相信这将是非常有用的资料,快速掌握Linux与perl。编程虽重要,但小编认为对于初学者软件使用更重要。大家都是生物狗,软件一些参数用法结合一下生物学意义相对来说容易理解,但是可能对大家比较困难的是软件用之前的工作--软件安装。由于不同的软件需要的依赖(包括种类和版本)不同或者使用的是公用计算机集群你根本无权限安装,导致软件安装不成功。稀奇古怪的报错信息,对于生物狗们真好似一头雾水。
好不容易有个好软件但是不能用。
所以大家需要掌握一些软件安装的技巧与方法。本处主要讲你没有权限安装方法,即安装到自己目录下面方法:jperl模块安装我们运行一些Perl程序时经常出现找不到某个module。对于这种报错,缺哪一个就下载哪一个或者看看软件包有没有此模块直接给路径添加即可。首先下载所需要的模块,像本处为Keith module,这样我们谷歌或者CPAN(http://search.cpan.org/)上下载Keith.pm即可。运行命令:perl Bin/trf_wrapper.pl报错信息:Can't locate Keith.pm in @INC (you may need to install the Keith module) (@INC contains: /share/nas2/genome/biosoft/perl/current/lib//5.20.0/x86_64-linux-thread-multi /share/nas2/genome/biosoft/perl/current/lib//5.20.0 /share/nas2/genome/biosoft/perl/current/lib/)at Bin/trf_wrapper.pl line 13.BEGIN failed--compilation aborted at Bin/trf_wrapper.pl line 13.解决方案:只需要在trf_wrapper.pl中调用的Keith模块(use Keith;)之前加入下面红色部分即可,其中PATH为模块Keith.pm所在的目录。BEGIN{push (@INC,\"PATH/\");}use Keith;kR包安装我们运行一些R语言程序时经常出现找不到某个package。对于这种报错,缺哪一个就下载哪一个。首先下载所需要的package,像本处为ggplot2,这样我们谷歌或者bioconductor (http://www.bioconductor.org/) 或者CRAN (https://cran.r-project.org/) 上下载ggplot2即可。运行命令:Rscript heatmapV2.R报错信息:Error in library(ggplot2) : there is no package called 'ggplot2'解决方案:下载到ggplot2_2.2.1.tar.gz,然后用下面命令(针对无管理员权限,安装自己目录下)安装即可。R CMD INSTALL ggplot2_2.2.1.tar.gz注意安装log:installing to /home/xxx/R/x86_64-unknown-linux-gnu-library/3.1/ggplot2_2.2.1/libs安装完成后添加环境变量:export LD_LIBRARY_PATH=/share/nas2/genome/biosoft/hdf5/1.8.9/lib/:$LD_LIBRARY_PATHlPython包安装注意使用的python版本,Python2与Python3差别较大,因此安装时注意python版本。运行命令:/Python/3.5.2/bin/python suppa.py报错信息:Traceback (most recent call last): File \"suppa.py\", line 9, in <module>import fileMerger as joinFiles File \"/share/nas1/SUPPA-master/fileMerger.py\", line 11, in <module> import pandas as pdImportError: No module named 'pandas'解决方案:找到对应版本的pandas下载即可,文件格式一般为后缀名为.tar.gz:pandas-0.20.1.tar.gz 安装步骤:tar zxvf pandas-0.20.1.tar.gzcd pandas-0.20.1python setup.py install --user安装完成后注意在.bashrc中添加环境变量,PYTHON_PATH=/home/xxx/.local/lib/python3.5/site-packages/:$PYTHON_PATHmC包无root权限的linux系统上安装软件时候遇到的lib××× not found的问题.参见此博文:http://blog.shenwei.me/solve-lib-not-found-in-linux/更多生信分析需求请加微信:13120220117
(图片来源网络,侵删)
0 评论