service@tgs.org.cn

0755-66814606

首页 >支持与进展 > 常见问题解答
  • 动植物基因组重测序常见问题
  • RNA研究常见问题
  •     转录组常见问题
  •     RNAseq定量常见问题
  •     Small RNA常见问题
  • 医学方向常见问题
动植物基因组重测序常见问题

什么是重测序(re-sequencing)?

答:重测序(re-sequencing)是对基因组序列已知物种的个体进行基因组测序,并在个体或群体水平进行差异分析的方法。

重测序都可以检测哪些遗传变异?

答:重测序目前能够检测到的遗传变异包括SNP(single nucleotide polymorphism, 单核苷酸多态性)、Indel(Insertion or deletion, 插入或缺失)、SV(structure variation, 结构变异)等。

单核苷酸多态性(single nucleotide polymorphism, SNP)是什么?

答:单核苷酸多态性(single nucleotide polymorphism, SNP),主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换(transition)或颠换(transversion)所引起。

Indel(insertion or deletion,插入或缺失)的定义?分析软件?如何寻找?

答:Indel指的是insertion or deletion,Indel包括插入或缺失突变,或两者兼之。Indel可以作为自然群体特别是进化过程中的遗传标记。
  目前恒创采用的Indel分析软件为:SOAPindel。使用测序结果的短序列与参考序列基因组做容许gap 的Pair-end 比对,将比对结果进行聚类分析,并结合pair-end 关系检测可信的short Indel。在检测过程中,gap 的长度为1~3个碱基。对于每个Indel 的检测,至少需要3个双末端序列的支持。

SV (Structure variation)的定义?分析软件?

答:染色体发生的结构变异主要有4种:
  (1)缺失:染色体中某一片段的缺失。
  (2)重复:染色体增加了某一片段。
  (3)倒位:染色体某一片段的位置颠倒了180度,造成染色体内的重新排列。
  (4)易位:染色体的某一片段移接到另一条非同源染色体上或同一条染色体上的不同区域。
  目前恒创采用的SV分析软件为:SOAPsv。利用测序个体序列与参考序列基因组进行比对,通过pair-end关系,根据pair-end reads的插入片段大小以及方向进行分析判断结构变异。

群体重测序进行信息分析我们能获得什么?

答:重测序目前能够检测到遗传变异包括SNP(single nucleotide polymorphism,单核苷酸多态性)、Indel(Insertion or deletion,插入或缺失)、SV(structure variation,结构变异)。除此之外还可以进行连锁不平衡(LD)、系统进化树(phylogenetic tree)、群体遗传结构(Population Genetic Structure)、群体选择分析(Population Selective Analysis)等。

连锁不平衡(Linkage disequilibrium)是什么?分析软件?

答:连锁不平衡(linkage disequilibrium, LD)指的是一个群体内不同座位等位基因之间的非随机关联, 包括两个标记间或两个基因/QTL间或一个基因/QTL与一个标记座位间的非随机关联。连锁不平衡与连锁是相关但完全不同的两个概念。连锁不平衡指的是群体内等位基因之间的相关, 而连锁指的是位于同一条染色体上的基因联合传递的现象。紧密连锁可导致较高的LD水平, 但这种LD纯粹是由突变产生的等位基因出现后紧密连锁座位间所有重组事件的结果。 连锁不平衡分析是近年来的一个研究亮点和热点。基于LD的作图方法不仅是新基因发掘的有效途径, 而且也是联系结构基因组学和表型组学的一座桥梁。
  LD分析软件有Haploview等。

系统进化树是什么?有哪些分析方法或软件?

答:系统发生树(phylogenetic tree,又称evolutionary tree进化树)就是描述群体间进化顺序的分支图或树,表示群体间的进化关系。系统分析过程就是指构建群体之间的进化树,推测其亲缘关系的远近。
  分析软件有MEGA4.0或 PHYLIP 3.68等。

什么是主成分分析(Principal component analysis)?

答:主成分分析(Principal component analysis,PCA)是一种纯数学的运算方法,可以将很多可能相关的变量转变成数量更少的主成分变量。PCA应用到很多学科,在遗传学当中,主要用于聚类分析,它是基于个体基因组SNP差异程度,按照不同性状特征将个体按主成分进行聚类成不同的亚群,同时用于和其它方法做相互验证。

群体遗传结构(Population Genetic Structure)是什么?分析方法或软件有哪些?

答:群体遗传结构是指遗传变异在物种或群体中的一种非随机分布,即遗传变异在群体内、群体间的分布样式以及在时间上的变化。遗传结构的模式提供了对进化过程的见解,并帮助确定了物种群体基因型和表型关联的研究。
  分析软件有Structure、Frappe 以及Admixture等。

群体选择分析是什么?有哪些分析方法或软件?

答:选择分析就是筛选那些不同亚群之间(如,栽培和野生)之间能够造成这两个亚群在进化上为何分开,以及产生重大差异的一些变异位点,从而扩展到基因层面。
  选择分析的方法包括Fst value、Heterozygosity、Tajima’s D value、Θπ value、HKA test、GORSS test等。
  连锁不平衡(LD)分析、系统进化树(phylogeny tree)分析、主成分分析(PCA)、遗传结构分析和群体选择分析都是基于SNPs进行的分析,寻找群体差异。例如野生群体和家养群体之间的相似或者差异较大的区域,相似非常高的可能说明在这段区域在这个物种中可能相对保守,而差异较大的区域可能就是由于受人工选择或者自然选择的敏感区域,这些区域可能与选择密切相关,可能是野生群体和家养群体产生差异的主要原因。

覆盖率(Coverage ratio)是什么?覆盖深度(Coverage depth)是什么?测序深度和基因组覆盖率的关系如何?

答:Coverage ratio (覆盖比率,亦简称覆盖率),指被测序到的碱基占全基因组大小的比率。
  Coverage depth  (覆盖深度,亦简称覆盖度),指每个碱基被测序的平均次数。
  测序深度指平均碱基测序深度(测序的数据总量比上基因组大小)。
  基因组覆盖率与平均碱基测序深度c之间的关系: 碱基的覆盖深度符合泊松分布,某个碱基没有被测序到的概率为P(X=0) = e-c ,这相当于整个基因组的未覆盖率,而基因组的覆盖率则为1- e-c 。

重测序样品要求如何?

答:1)样品类型: DNA样品。
  2)样品的量:小片段文库(单次)≥ 3 µg;完成测序单个DNA 样品的总量不低于10μg。
  3)样品浓度:≥30 ng/µl(样品浓度越高越好),推荐浓度为100~200 ng/μl。
  4)样品纯度:OD260/280为 1.8~2.0。

重测序样品寄送注意事项?

答:重测序样品寄送注意事项如下所示:
  DNA如果用乙醇沉淀,则可以常温运输,否则在运输过程中,最好放在干冰中,时间不要超过72小时,如果利用冰袋运输,则时间最好不要超过24小时;且在运输过程中请用parafilm将管口密封好,以防出现污染。
  请仔细纯化样品,尽量避免污染进入,并请合作伙伴将所送样品保留备份,我们也将收到的样品保留一份备份,以防止一旦数据中出现外源DNA污染,我们能迅速的查清原因,分清责任。
  所有的生物实验都不排除有意外情况发生,如果在样品制备过程中出现非正常情况,我们会立即与合作伙伴沟通,准备新的样品DNA。

重测序的文库大小是多大?重测序的测序策略?

答:通常情况构建文库大小为500bp;测序为PE100(reads 长度100bp)。

什么是RAD-seq?

答:RAD(Restriction-site Associated DNA, 限制性内切位点相关DNA)是与限制性核酸内切酶识别位点相关的DNA。RAD-seq通过对酶切获得的RAD tag进行高通量测序,能够降低基因组的复杂度,操作简便,同时不受参考基因组的限制,可快速鉴定出高密度的SNPs,用于遗传图谱构建、QTL定位,辅助scaffolds组装到染色体等。

RAD-seq适用物种范围?

答:群体进化:二倍体物种(有或无参考基因组均可),物种内亚群的划分要比较明确,相同亚群内的个体要有一定的代表性,选择材料将影响到群体选择分析的结果。
     遗传图谱:二倍体物种(有或无参考基因组均可),适用于所有分离群体。推荐作图群体在100以上。

全基因组重测序的使用物种范围?

答:群体进化:物种内亚群的划分要比较明确,相同亚群内的个体要有一定的代表性,选择材料将影响到群体选择分析的结果。
        遗传图谱:参考基因组完成,群体大小 100以上。
  Bin-map:参考基因组完成,且基因组已组装到染色体水平,如水稻、高粱、大豆、果蝇、秀丽线虫等,理论上适用于所有纯合度高的分离群体。推荐选择永久性作图群体,如重组近交系群体(RILs)、染色体片段代换系群体(CSSLs)、双单倍体群体(DH)等,作图群体大小 100以上。

一般情况下,个体重测序的测序深度?群体重测序的测序深度?

答:一般进行个体重测序的话,推荐10-30X测序深度,群体重测序推荐3-10X。但是基因组比较复杂并且对SNP准确率要求比较高时,测序深度还需要进一步提高。

重测序项目完成周期怎样?

答:个体重测序从样品检测合格到信息分析完成需要60日,群体重测序从样品检测合格到信息分析完成需要90日。
RNA研究常见问题

什么是转录组及转录组测序?

答:转录组即特定细胞在某一功能状态下所能转录出来的所有 RNA的总和,包括mRNA 和非编码RNA(即Non-coding RNA,如 tRNA,rRNAs,microRNAs,piRNAs和 long ncRNAs等)。
        转录组测序(Transcriptome sequencing)主要通过高通量测序研究特定组织或细胞在某个时期转录出来的mRNA。

转录组测序比其他研究方法有哪些优势?

答:转录组测序具有以下优势:
  1)可以直接测定每个转录本片段序列、单核苷酸分辨率的准确度,同时不存在传统
微阵列杂交的荧光模拟信号带来的交叉反应和背景噪音问题;
  2)灵敏度高,可以检测细胞中少至几个拷贝的稀有转录本;
  3)可以对任意物种进行全基因组分析,无需预先设计特异性探针,因此无需了解物
种基因信息,能够直接对任何物种进行转录组分析,同时能够检测未知基因,发现新的
转录本,并准确地识别可变剪切位点及cSNP,UTR区域;
  4)检测范围广,高于6个数量级的动态检测范围,能够同时鉴定和定量稀有转录本和
正常转录本。

转录组测序分析对样品有什么要求?

答:1)样品类型: Total RNA。
  2)样品的量:真核:总量≧6ug;原核:总量≧20ug。
  3)样品浓度:真核:浓度≧100ng/ul;原核:浓度≧65ng/ul。
  4)样品纯度:OD260/280≧1.8;28S/18S≧1。
        RNA完整性:植物、真菌 RIN值≧6.5;动物 RIN值≧7.0;原核 RIN值≧6.0。

普通转录组和7 day-Transcriptome的区别主要有哪些?

答:主要区别如下:

 
项目周期测序策略优势
7 day-Transcriptome短(有参,14天;无参28天)PE250(双端各250bp)测序读长为双端各250bp。总长达500bp的测序读长尤其适用于转录本的拼接组装,可以得到更长的转录本和更完整的基因信息。
普通转录组相对较长PE100(双端各100bp)价格低于快速转录组

是否需要生物学重复?重复几次?

答:是的,至少需要两次生物学重复,3次以上的生物学重复更好。2011年7月Hansen发表的文章表明生物学差异是基因自身表达的特性,与检测技术的选择以及数据处理的方式无关。如果不设生物学重复,高影响因子的杂志可能会因此而拒稿。

如何对得到的数目较多的差异基因进行后期验证?

答:1. 根据GO富集结果,选取有代表性的进行qRT-PCR验证。
  2. 根据RPKM值,选择RPKM值差异成倍数的基因进行qRT-PCR验证。

转录组测序能否使用 LiCl沉淀RNA?

答:可以使用LiCl进行沉淀,虽然LiCl会使小分子RNA部分丢失但并不影响转录组测序分析。如果同一样品还要进行小分子RNA 分析,在提取总RNA时请不要使用LiCl沉淀。

mRNA与microRNA联合分析内容有哪些?

1、有参考基因组
1.1 转录组数据mapping,进行mRNA表达量的分析。
1.2 小RNA数据mapping,已知microRNA表达量的分析。
1.3 小RNA数据过滤掉已知microRNA,protein-coding region, repeat sequences, rRNA, tRNA, snRNA, and snoRNA,再做未知microRNA预测及表达量的分析。
1.4 根据表达量信息和表型信息,找到表型相关的mRNA和microRNA,或者是差异表达的mRNA和microRNA。
1.5 差异表达mRNA进行聚类、GO富集及KEGG富集分析(上调、下调统计),网络整合分析。
1.6 差异表达microRNA作用的靶mRNA的预测。
1.7 既是差异表达microRNA的靶mRNA,又是差异表达mRNA,这类mRNA进行聚类、GO富集及KEGG富集分析(上调、下调统计),网络整合分析。
2、无参考基因组
2.1 转录组数据拼接/unigene链接。
2.2 mRNA表达量的分析。
2.3 已知microRNA表达量的分析。。
2.4 小RNA数据过滤掉已知microRNA,protein-coding region, repeat sequences, rRNA, tRNA, snRNA, and snoRNA,再做未知microRNA预测及表达量的分析。
2.5 根据表达量信息和表型信息,找到表型相关的mRNA和microRNA,或者是差异表达的mRNA和microRNA。
2.6 差异表达mRNA进行聚类、GO富集及KEGG富集分析(上调、下调统计),网络整合分析。
2.7 差异表达microRNA作用的靶mRNA的预测。
2.8 既是差异表达microRNA的靶mRNA,又是差异表达mRNA,这类mRNA进行聚类、GO富集及KEGG富集分析(上调、下调统计),网络整合分析。

有生物学重复和无生物学重复在算法上是否相同,表现在哪里?

答:有无重复,判断差异基因的算法是不一样的,有重复的,变异的评估是根据重复来评估;
无重复的变异只能通过表达量类似的基因来估计,或者用技术重复的变异来代替生物变异。

转录组测序需要多少数据量?

答:转录组测序所需的测序量随研究目的的不同而有所差异。目前,为保证数据分析结果的可靠性和准确性,恒创基因推荐对有参考基因组的转录组采用最低4Gb clean data进行后续分析,如果想检测到低丰度的转录本推荐采用8Gb clean data。如果没有参考基因组,需要进行转录本的拼接组装,为了拼接组装的完整性,恒创基因推荐最低8Gb clean data的转录组测序。
转录组常见问题

什么是转录组及转录组测序?

答:转录组即特定细胞在某一功能状态下所能转录出来的所有 RNA的总和,包括mRNA 和非编码RNA(即Non-coding RNA,如 tRNA,rRNAs,microRNAs,piRNAs和 long ncRNAs等)。
        转录组测序(Transcriptome sequencing)主要通过高通量测序研究特定组织或细胞在某个时期转录出来的mRNA。

转录组测序比其他研究方法有哪些优势?

答:转录组测序具有以下优势:
  1)可以直接测定每个转录本片段序列、单核苷酸分辨率的准确度,同时不存在传统
微阵列杂交的荧光模拟信号带来的交叉反应和背景噪音问题;
  2)灵敏度高,可以检测细胞中少至几个拷贝的稀有转录本;
  3)可以对任意物种进行全基因组分析,无需预先设计特异性探针,因此无需了解物
种基因信息,能够直接对任何物种进行转录组分析,同时能够检测未知基因,发现新的
转录本,并准确地识别可变剪切位点及cSNP,UTR区域;
  4)检测范围广,高于6个数量级的动态检测范围,能够同时鉴定和定量稀有转录本和
正常转录本。

转录组测序分析对样品有什么要求?

答:1)样品类型: Total RNA。
  2)样品的量:真核:总量≧6ug;原核:总量≧20ug。
  3)样品浓度:真核:浓度≧100ng/ul;原核:浓度≧65ng/ul。
  4)样品纯度:OD260/280≧1.8;28S/18S≧1。
        RNA完整性:植物、真菌 RIN值≧6.5;动物 RIN值≧7.0;原核 RIN值≧6.0。

普通转录组和7 day-Transcriptome的区别主要有哪些?

答:主要区别如下:

 
项目周期测序策略优势
7 day-Transcriptome短(有参,14天;无参28天)PE250(双端各250bp)测序读长为双端各250bp。总长达500bp的测序读长尤其适用于转录本的拼接组装,可以得到更长的转录本和更完整的基因信息。
普通转录组相对较长PE100(双端各100bp)价格低于快速转录组

是否需要生物学重复?重复几次?

答:是的,至少需要两次生物学重复,3次以上的生物学重复更好。2011年7月Hansen发表的文章表明生物学差异是基因自身表达的特性,与检测技术的选择以及数据处理的方式无关。如果不设生物学重复,高影响因子的杂志可能会因此而拒稿。

如何对得到的数目较多的差异基因进行后期验证?

答:1. 根据GO富集结果,选取有代表性的进行qRT-PCR验证。
  2. 根据RPKM值,选择RPKM值差异成倍数的基因进行qRT-PCR验证。

转录组测序能否使用 LiCl沉淀RNA?

答:可以使用LiCl进行沉淀,虽然LiCl会使小分子RNA部分丢失但并不影响转录组测序分析。如果同一样品还要进行小分子RNA 分析,在提取总RNA时请不要使用LiCl沉淀。

mRNA与microRNA联合分析内容有哪些?

1、有参考基因组
1.1 转录组数据mapping,进行mRNA表达量的分析。
1.2 小RNA数据mapping,已知microRNA表达量的分析。
1.3 小RNA数据过滤掉已知microRNA,protein-coding region, repeat sequences, rRNA, tRNA, snRNA, and snoRNA,再做未知microRNA预测及表达量的分析。
1.4 根据表达量信息和表型信息,找到表型相关的mRNA和microRNA,或者是差异表达的mRNA和microRNA。
1.5 差异表达mRNA进行聚类、GO富集及KEGG富集分析(上调、下调统计),网络整合分析。
1.6 差异表达microRNA作用的靶mRNA的预测。
1.7 既是差异表达microRNA的靶mRNA,又是差异表达mRNA,这类mRNA进行聚类、GO富集及KEGG富集分析(上调、下调统计),网络整合分析。
2、无参考基因组
2.1 转录组数据拼接/unigene链接。
2.2 mRNA表达量的分析。
2.3 已知microRNA表达量的分析。。
2.4 小RNA数据过滤掉已知microRNA,protein-coding region, repeat sequences, rRNA, tRNA, snRNA, and snoRNA,再做未知microRNA预测及表达量的分析。
2.5 根据表达量信息和表型信息,找到表型相关的mRNA和microRNA,或者是差异表达的mRNA和microRNA。
2.6 差异表达mRNA进行聚类、GO富集及KEGG富集分析(上调、下调统计),网络整合分析。
2.7 差异表达microRNA作用的靶mRNA的预测。
2.8 既是差异表达microRNA的靶mRNA,又是差异表达mRNA,这类mRNA进行聚类、GO富集及KEGG富集分析(上调、下调统计),网络整合分析。

有生物学重复和无生物学重复在算法上是否相同,表现在哪里?

答:有无重复,判断差异基因的算法是不一样的,有重复的,变异的评估是根据重复来评估;
无重复的变异只能通过表达量类似的基因来估计,或者用技术重复的变异来代替生物变异。

转录组测序需要多少数据量?

答:转录组测序所需的测序量随研究目的的不同而有所差异。目前,为保证数据分析结果的可靠性和准确性,恒创基因推荐对有参考基因组的转录组采用最低4Gb clean data进行后续分析,如果想检测到低丰度的转录本推荐采用8Gb clean data。如果没有参考基因组,需要进行转录本的拼接组装,为了拼接组装的完整性,恒创基因推荐最低8Gb clean data的转录组测序。
RNAseq定量常见问题

什么是数字基因表达谱(DGE)?

答:恒创基因数字基因表达谱(DGE)是基于Illumina 测序平台,研究某一物种特定组织在特定状态下的基因表达情况。

DGE筛选差异基因的原理?

答:DGE测序得到的reads mapping 到参考序列上,基因表达的转录本丰度越高,定位到其上的reads数(read counts)也就越多,因此可用 read counts表示基因的表达水平。常用RPKM (Reads Per Kilo bases per Million mapped Reads,表示每百万比对到参考序列/参考基因组上的 reads 中来自于某基因每千碱基长度的 reads 数)值来表示基因的表达差异水平。

研究物种无参考序列,是否可以选用近缘物种作为参考序列进行DGE测序?

答:如果不知近缘关系有多大的情况,以近缘物种作为参考序列存在一个风险,就是结果与参考序列比对率会很低,低于70%的比对率,后期差异基因筛选等是不可靠的。

如果之前做的DGE没做重复,现在想补生物学重复,是否可以?

答:如果是同一批实验样品,保存时间不久的话,可以做试试看。由于是生物学重复,最终以重复样品的生物学重复相关性检测结果来判断数据是否可以混在一起用,如果相关系数好,至少0.92以上,表明重复相关性较好。如果重复相关系数很低,就可能会引来编辑的质疑。尽管高通量测序技术重复性较高,但是通常测序时同样的样品不同的run,不同的lane都会有一些影响,不同批建库测序影响就会更大。
        如果不是同一批实验的样品:尽管老师是同样的实验条件,但是DGE本身就是检测基因表达水平的,而这个表达水平受多种因素影响。以植物为例,不同的发育阶段,不同的环境生长条件,基因的表达水平都会有很大的差异,如果还进行差异分析的话,找到的差异基因有可能不是样品间的,而是不同的发育阶段或环境因子导致的差异表达,所以不能混在一起用,只能重新做。

与市场上常见的数字表达谱(DGE)相比,我公司DGE 及7 day-DGE (RNA-Seq)分析有哪些优势?

  1)DGE 及7 day-DGE都是采用转录组建库流程,可以最大限度的获取样品中的所有带有poly A的转录组本信息,而普通DGE法只能够检测到含CATG这四个碱基的识别位点的转录本或基因,对不含该识别位点的基因无法检测到,因此我公司DGE 及7 day-DGE比市场常见的DGE检测的基因数目更多,定量更准确。
  2)DGE只能分析真核生物的基因表达情况,而我们的 DGE 及7 day-DGE可以通过去除rRNA的办法分析原核生物的基因表达情况(但考虑到实际的操作难度,我们建议客户送真核生物样品,若客户坚持测原核生物的表达差异需将风险提前告知客户)。
  3)DGE 及7 day-DGE相对于普通DGE也大大降低了样品所需量,为客户节约了宝贵的样品。
  4)我公司是国内首家最新Miseq平台服务商,准确度、灵敏性更高,并且项目周期更短,国内首推7 day-DGE产品,在预付款到位且样品检测合格的情况下,14天内完成文库构建、高通量测序、标准数据分析过程(若客户提出个性化需求,此分析时间不包括在14日内)。

MiSeq的测序质量与HiSeq相比如何?

答:HiSeq与MiSeq都是Illumina公司推出的测序仪,而MiSeq是小型化测序仪的代表。HiSeq追求的是最高的通量,而MiSeq追求的是效率。HiSeq一个测序循环需要40分钟,MiSeq一个测序循环只要5分钟。但是MiSeq每个run测序通量很低,单位数据成本是HiSeq的几十倍至上百倍。根据我们多次测试结果,HiSeq测序质量与MiSeq测序质量没有差异。
Small RNA常见问题

什么是Small RNA测序?

  恒创基因Small RNA测序是基于Illumina 测序平台,研究某一物种特定组织在特定状态下的所有已知Small RNA,也可发现新的或该物种特有的Small RNA并预测其靶基因,为研究Small RNA的功能及此物种的基因调控机制提供了有力工具。

Small RNA测序分析对样品有什么要求?

  1)样品类型: Total RNA;
  2)样品的量:总量≧10ug;
  3)样品浓度:浓度≧200ng/ul;
  4)样品纯度:OD260/280≧1.8;28S/18S≧1.5;
        RNA完整性: RIN值≧8.0。

进行Small RNA测序对于组织样品提取总RNA有什么特殊要求?

答:RNA纯化方法主要包括有机溶剂抽提+乙醇沉淀、硅胶膜离心柱等。由于硅胶膜离心柱只能富集200nt以上的RNA分子,所以不适用于small RNA的分离纯化。有机溶剂抽提虽然能够较好的保留small RNA,但是后期的沉淀步骤非常繁琐。因此,如果要进行small RNA测序,提取总RNA时建议不要使用Qiagen等公司的过柱试剂盒,也不要使用LiCl沉淀,以免丢失小片段RNA。

Small RNA分析需要合作伙伴提供参考序列吗?

答:需要,最好提供合作伙伴所做物种的全基因组序列,如果没有,也可以提供近缘物种的全基因组序列或者是本物种的EST等序列作为参考序列,另外还需要提供相关的exon/intron,repeat信息以及基因编码序列。

Small RNA测序和7day-Small RNA测序有几种数据量可以选择?

答:目前,Small RNA测序提供6M、9M和12M clean reads三种数据量,7day-Small RNA测序提供6M和12M clean reads两种数据量供合作伙伴选择,分别采用HiSeq SE50和MiSeq SE50测序。

什么情况下应该选择7day-Small RNA?

答:1、项目时间紧迫,急需差异表达分析结果作为依据进行下一步的实验或文章撰写。
  2、7day-Small RNA是高质量测序的代表,对数据结果有很高要求的合作伙伴可以选择。
医学方向常见问题

人全基因组重测序的优势是什么?

答:与外显子组及RNA测序技术相比,技术流程简单而成熟,易操作,易实现;与外显子组及目标区域捕获技术相比,可全面挖掘各种遗传变异,特别是一些大的结构变异(倒置、易位、拷贝数变异),在全基因组范围内寻找与疾病或功能相关的位点;与传统芯片分型技术相比,可发掘新的和稀有的变异。

人全基因组重测序一般推荐多少×测序深度?

答:测序深度根据研究目的、样本量及合作伙伴的预期而定。30×测序深度左右即可鉴定绝大部分SNP,但如果客户的研究目的是找癌组 织中较大的结构变异,建议深度测序(一般至少50×以上);群体重测序可以使用较低深度测序(~10×),用群体分析策略寻找相关变异。

人全基因组重测序应用在哪些方面?

答:疾病研究:全基因组范围内搜寻疾病相关候选位点或区域,特别适合于有较少分子研究基础疾病类型的,或研究大的结构变异的情况;人类进化、比较基因组学等的研究:可利用全基因组的基因信息全面进行种族进化、种族特异性基因及区域的筛选。

外显子组测序的优势?

答:人外显子测序通过对约1%的基因组区域进行捕获测序分析,对发生突变后最有可能影响功能的序列进行针对性的研究,性价比高。另外,除了外显子区域,目前探针的设计还包括了大量small RNA及UTR非翻译区。

外显子组捕获测序中的捕获效率(capture  specificity)及覆盖度(coverage ratio)分别指什么?哪个指标比较重要?                                                       

答:捕获效率指比对到目标区域的有效数据量占总的数据量的比例。捕获效率的高低不影响数据质量,只影响数据的有效比例。覆盖度是目标区域被覆盖到的比率,是一般合作伙伴关心的指标。

同样是4Gb转录组测序分析,不同服务商为何价格相差很多?

答:合作伙伴需要考察以下两点:
一、实验流程
(1)样品检测一步是否有四种检测报告?
(2)文库构建是否用Illumina Truseq RNA/Small RNA Sample Pre Kit及其推荐的配套试剂,而不使用其它替代试剂?如果样品的质量和建库质量无法保证,会从数据源头上导致低丰度转录本信息的丢失和数据偏好性。
(3)是否提供4Gb clean data(指去除了接头及低质量序列的数据)?恒创基因每次产出6Gb以上的raw data,以保证在过滤了低质量的序列后,获得4Gb clean data的产出。
二、生物信息分析服务
合作伙伴需要关注服务商是简单跑流程,还是根据科研目标,选择分析软件,调整参数,并且对结果给出合理解释。

是否需要生物学重复?重复几次?

答:是的,至少需要两次生物学重复,3次以上的生物学重复更好。2011年7月Hansen(按照案例的方式加reference)发表的文章表明生物学差异是基因自身表达的特性,与检测技术的选择以及数据处理的方式无关。如果不设生物学重复,高影响因子的杂志可能会因此而拒稿。

转录组测序需要多少数据量?

答:转录组测序所需的测序量随研究目的的不同而有所差异。目前,为保证数据分析结果的可靠性和准确性,恒创基因推荐转录组采用最低4Gb clean data进行后续分析,如果想检测到低丰度的转录本推荐采用8Gb clean data。

如何对得到的数目较多的差异基因进行后期验证?

答:1. 根据GO富集结果,选取有代表性的进行qRT-PCR验证;2. 根据RPKM值,选择RPKM值差异成倍数的基因进行qRT-PCR验证。

进行small RNA测序对于组织样品提取总RNA有什么特殊要求?

答:RNA纯化方法主要包括有机溶剂抽提+乙醇沉淀、硅胶膜离心柱等。由于硅胶膜离心柱只能富集200nt以上的RNA分子,所以不适用于small RNA的分离纯化。有机溶剂抽提虽然能够较好的保留small RNA,但是后期的沉淀步骤非常繁琐。因此,如果要进行small RNA测序,提取总RNA时建议不要使用Qiagen等公司的过柱试剂盒,也不要使用LiCl沉淀,以免丢失小片段RNA。如果直接提供small RNA样品,可以使用small RNA提取专用试剂盒来进行提取。

Small RNA测序对于提供的总RNA样品要求为什么比转录组测序样品要求还要高?

答:如果采用总 RNA进行小RNA文库构建,因总 RNA中含有的小RNA量很少(约0.3%),且小片段RNA更易降解,所以只有严格的保证总 RNA 完整性(即2100检测中的RIN值较高时),才能保证小RNA质量。

为什么small RNA不同的样品测序得到的reads 数量相差较大?为什么说不影响分析准确性?

答:Small RNA在不同物种,以及同一物种不同组织、不同发育阶段表达情况都有差异,而通常用作总 RNA 提取的材料的细胞数差异也很大(通常为10~100万个细胞),所以取材的时空性及细胞总数的多少决定了样品中表达的small RNA的总量不可能完全一致。分析时采用均一化后的数据,这样即使reads 数量相差较大,也不影响分析的准确性。

服务
RNA产品
动植物重测序
微生物产品
表观产品
疾病研究
蛋白组学研究
科学
发表文章
关于我们
公司简介
文化与价值观
联系我们
招贤纳士
招聘需求
在线求职
扫一扫,关注我们
 

地址:深圳市盐田区大百汇科技园9层B区   

电话:0755-66814606

©2018 @深圳市恒创基因科技有限公司 粤ICP备14082833号