当前位置: 澳门新濠3559 > 操作系统 > 正文

1质控 实验设计,QIIME的虚拟机安装

时间:2019-11-07 21:41来源:操作系统
Biom文件管理系统biom程序是QIIME的必装包,若无安装好,可尝试上边步骤重装 扩大与增添子深入分析解读6蜕变树,Alpha,Beta多样性 有些讨论花招在特定有尝试中设有过错,如二〇一一Nat

Biom文件管理系统biom程序是QIIME的必装包,若无安装好,可尝试上边步骤重装

扩大与增添子深入分析解读6蜕变树,Alpha,Beta多样性

有些讨论花招在特定有尝试中设有过错,如二〇一一Nature电视发表V5-V7在植物中扩大与扩充会偏心扩大与扩展Chloroflexi菌门,建议删除。

1质控 实验设计,QIIME的虚拟机安装。4去嵌合体 非细菌种类生成代表性种类和OTU表

澳门新濠3559,扩大与扩充子分析解读1质量控制,实验设计,双端系列合併

主页: 。BIOM是德语The Biological Observation Matrix的缩写,中文翻译为生物观测矩阵,是生机勃勃种通过格式,用于生物学样板对应观测值的报表。它至关心注重要利用json/HD5F文件格式标准,即多维散列结构,保存表格结构数据结果。方今主流的宏基因组软件均支持此格式文件,如QIIME、MG-RAST、PICRUSt、Mothur、phyloseq、MEGAN、VAMPS、metagenomeSeq、Phinch、RubiconDP Classifier、USEARCH、PhyloToAST、EBI Metagenomics、GCModeller、MetaPhlAn 2。知道它有多种要了吗。

分析前盘算

扩大与扩大子分析解读5物种注释,OTU表操作

看下边包车型大巴的总计结果,样板数据量从2k-35k,大家应去除过小的数据量样板,提供更可能高的样板最低丰度的数额用于上游标准化分析。这里大家选取只保留数据量大于3000的样板。

扩大与扩充子分析解读4去嵌合体,非细菌体系,生成代表性类别和OTU表

 

扩大与增添子解析解读7物种分类总计,筛选演变树和其它

本节科目,必要先成功《扩大与扩展子解析解读》连串早前的操作

QIIME的设想机安装

 

扩大与扩张子解析解读3格式转变,去冗余,聚类

  1. 物种注释

扩大与扩大子解析解读2领到barcode,质量控制及样本拆分,切去扩大与增添引物

# 进入工作目录
cd example_PE250

biom的详实使用验证,能够biom查看具体的机能,如增添注释效用biom add-metadata --help可查看详细表达。也可观看官方网址

# 文本OTU表转换为BIOM:方便操作
biom convert -i temp/otu_table.txt 
 -o result/otu_table.biom 
 --table-type="OTU table" --to-json
# 添加物种信息至OTU表最后一列,命名为taxonomy
biom add-metadata -i result/otu_table.biom 
 --observation-metadata-fp result/rep_seqs_tax_assignments.txt 
 -o result/otu_table_tax.biom 
 --sc-separated taxonomy --observation-header OTUID,taxonomy 
# 转换biom为txt格式,带有物种注释:人类可读
biom convert -i result/otu_table_tax.biom -o result/otu_table_tax.txt --to-tsv --header-key taxonomy
# 查看OTU表的基本信息:样品,OUT数量统计
biom summarize-table -i result/otu_table_tax.biom -o result/otu_table_tax.sum
  1. OTU表总计、格式转变、增添音信

注:要是是ITS/18S数额,提议数据库改正为UNITE,方法改为blast。详细使用验证,请读官方文书档案

 

# 按OTU丰度过滤:选择相对丰度均值大于万分之一的OTU
filter_otus_from_otu_table.py --min_count_fraction 0.0001 -i result/otu_table2.biom -o result/otu_table3.biom
# 查看过滤后结果:只有25个样品,346个OTU
biom summarize-table -i result/otu_table3.biom
# 安装依赖包
pip install numpy
# 安装biom格式转换包
pip install biom-format
# 安装2.0格式支持
pip install h5py
# 测序程序是否安装成功
biom
# 转换最终biom格式OTU表为文本OTU表格
biom convert -i result/otu_table4.biom -o result/otu_table4.txt --table-type="OTU table" --to-tsv
# OTU表格式调整方便R读取
sed -i '/# Const/d;s/#OTU //g;s/ID.//g' result/otu_table4.txt
# 筛选最终OTU表中对应的OTU序列
filter_fasta.py -f result/rep_seqs.fa -b result/otu_table4.biom -o result/rep_seqs4.fa

 

1质量控制 实验设计 双端系列合併

  1. OTU表筛选

 

再者还要过滤低丰度的OTU,日常低于优异之大器晚成丰度的菌,在效劳探究恐怕依旧相比较艰辛的(开始时代小说454测序数据量少,平常只关怀丰度千分之五上述的OTU)。

Num samples: 27 # 样本数据

Num observations: 975 # OTU数据

Total count: 409647 # 总量据量

Table density (fraction of non-zero values): 0.464 # 非零的单元格

 

Counts/sample summary:

 Min: 2352.0 # 样板数据量最小值

 Max: 35955.0 # 样本数据量最大值

 Median: 14851.000 # 样本数据量中位数

 Mean: 15172.111 # 样板数据量平平均数量

 Std. dev.: 10691.823 # 样板数据量标准变异

 Sample Metadata Categories: None provided # 样板分类消息:末提供

 Observation Metadata Categories: taxonomy # 旁观值分类:物种消息

 

Counts/sample detail: # 每一个样本的数据量

OE4: 2352.0

OE3: 2353.0

OE8: 3091.0

OE2: 3173.0

OE1: 3337.0

OE5: 3733.0

OE6: 4289.0

OE9: 4648.0

OE7: 5185.0

WT3: 10741.0

WT8: 12117.0

WT6: 14316.0

WT2: 14798.0

WT7: 14851.0

KO1: 14926.0

WT9: 15201.0

WT1: 15422.0

WT5: 15773.0

WT4: 16708.0

KO2: 17607.0

KO6: 23949.0

KO5: 26570.0

KO8: 27250.0

KO4: 32303.0

KO7: 33086.0

KO9: 35913.0

KO3: 35955.0

接下去大家上学对OTU进行物种注释;OTU的操作,包蕴格式转变、筛选增多物种音讯、数据量筛选样本、筛选高丰度的OTU、物种筛选等。

上述过滤条件是依照涉世、相关文献设计的,假如不掌握,也毫无随意过滤,轻松孳生假中性(neuter gender卡塔 尔(阿拉伯语:قطر‎。

试验中会有各类影响因素,我们要综合种种背景知识来推断哪些筛选数据表,起到断长续短,去粗取粗,就那样类推,有表及理的来回复精确难题。数据筛选是会运维剖析流程和数码解析师的丘陵。

 

 

# 按物种筛选OTU表:去除p__Chloroflexi菌门
filter_taxa_from_otu_table.py -i result/otu_table3.biom -o result/otu_table4.biom -n p__Chloroflexi
# 查看过滤后结果:只有25个样品,307个OTU
biom summarize-table -i result/otu_table4.biom
# 物种注释
assign_taxonomy.py -i result/rep_seqs.fa 
 -r gg_13_8_otus/rep_set/97_otus.fasta 
 -t gg_13_8_otus/taxonomy/97_otu_taxonomy.txt 
 -m rdp -o result
# 按样品数据量过滤:选择counts>3000的样品
filter_samples_from_otu_table.py -i result/otu_table_tax.biom -o result/otu_table2.biom -n 3000
# 查看过滤后结果:只有25个样品,975个OTU
biom summarize-table -i result/otu_table2.biom

3格式更动 去冗余 聚类

OTU表常用的BIOM格式

2领到barcode 质量控制及样本拆分 切掉扩大与扩张引物

上风流倜傥节回想:大家学习了嵌合体的变异,以致基于参照他事他说加以考查数据库去嵌合体;也学习了根据数据库比对来筛选细菌或细菌;最终依据最鲜明的OTU,大家转移代表性体系和OTU表,那是各样MediaTek量测序皆某个结果,后续的结果将全方位基于那八个文本。

对此扩大与扩展子分析,最根本的正是物种新闻。大家依照上节解析拿到的代表性体系,采取上次少年老成度下载的greengene的参阅类别和物种注释音信,比对软件选拔rdp方法,实行评释。

方今我们收获了OTU表的主干计算消息,用less result/otu_table_tax.sum查看一下吗,内容如下:

将OTU表转变为Biom格式,那样便于其它软件对其操作。可增加下边得到的物种新闻,那样表格的新闻就更丰富了,再更改为文本,便于人类可读,相同的时候使用summarize-table查看OTU表的中坚新闻。

赢得的最后结果,还要转变为文本格式,和提取OTU表对应的类别,用于上游分析。

编辑:操作系统 本文来源:1质控 实验设计,QIIME的虚拟机安装

关键词:

  • 上一篇:没有了
  • 下一篇:没有了