在人基因组相关的疾病研究中,获取基因组变异信息是研究工作中最基础也最重要的一步。基于二代(Illumina/BGI等)和三代(PacBio)二代测序平台全外显子测序和人基因组重测序可以用来分析编码区和全基因组上的单核苷酸变异(SNV)以及小片段插入缺失突变(Indel)以及部分结构变异(SV)。 将人基因组测序数据与人类的GRCh38参考基因组进行比对,检测变异类型和数量,其中有500万个碱基变异的SNV,300万个碱基变异的小片段Indels以及超过1千万个碱基变异的SV。SV中的碱基变异要比SNP和Indel中的总和还多。因此,广泛的研究认为,相较于SNP和Indels,SV对基因组影响更大,更能解释人类群体多样性特征[1]。SV中的多种变异是大多数疾病或癌症基因组的标志,其对基因结构和表达的影响大大促进了我们对疾病和肿瘤发生发展的认识。 面对疾病复杂基因组中的高GC和串联重复序列区域,由于二代测序读长短,所以针对SNV和Indel的检测效能不足,SV检出率低,假阳性较高。三代测序技术的应用很好地解决了这一问题,三代单分子实时(SMRT)测序技术以其超长读长、无GC偏好性、覆盖度均一等优势可以轻松获取基因组高GC和重复序列区域的信息,通过低深度的三代测序就能有效鉴定人基因组中大部分结构变异[2]。 使用SMRT测序CCS模式能在难以mapping区域或重复序列区域检测SNV和Indel,在全基因组范围内检测SV。CCS测序模式通过构建HiFi文库,测序得到高准确度的CCS reads,全面挖掘基因组的各种变异信息,对疾病诊断、治疗和其他基础研究都具有重要意义。横滨市立大学医学院的Takeshi团队研究有智力障碍综合征的致病变异,利用二代全外显子测序未检测到有效变异,选择三代PacBio HiFi测序对Trio家系(亲子三联体)进行SV检测分析,挖掘到到一个影响该疾病的12 kb倒位变异。此外,基于Trio家系的单倍型定相分析发现该倒位变异遗传自母亲[3]。
|