1 技术简介
基因组从头测序(denovo sequencing),主要针对基因组序列未知或参考基因组组装不理想的物种,构建不同类型的基因组DNA文库,并进行序列测定。然后使用生物信息学方法对序列进行拼接、组装和注释,从而绘制该物种完整的基因组序列信息。一般认为,简单基因组为重复序列低于50%,且二倍体杂合度低于0.5%的物种;复杂基因组为重复序列高于50%,或二倍体杂合度高于0.5%,或其他多倍体物种。
2 实验流程
3 样本准备
平台 | 文库类型 | 样本量(基因组DNA) | 浓度 |
Nanopore PromethION | 20-40Kb library | ≥9μg | 90 ng/μl |
Ultra-long library(>40k) | ≥10μg | 150 ng/μl | |
PacBio Sequel II
| 15-20Kb HIFI library | ≥15μg | 80 ng/μl |
20-40kb CLR library | ≥7μg | 70 ng/μl | |
DNBSEQ | 350bp library | ≥1μg | 12.5 ng/μl |
StLFR library | ≥500ng | 1 ng/μl |
分析内容
下机数据统计 | 基因组组装效果评价 | 蛋白编码的基因序列比对 | 全基因组复制事件分析 |
数据质控 | 基因组组装完整性与连续性评估 | 基因组注释 | 分歧时间估算 |
高质量数据获取 | 重复序列分析 | 杂合度分析 | 共有特有基因家族分析 |
Survey分析 | 非编码RNA预测 | 染色体共线性分析 | LTR插入时间 |
基因组组装 | 蛋白编码基因预测 | 基因家族扩张和收缩分析 | 正选择分析 |