转录组测序的研究对象为特定细胞在某一功能状态下所能转录出来的所有RNA的总和,主要包括 mRNA和非编码RNA 。由于获得总RNA的方法比较容易,传统的Bulk样本建库测序方法已非常成熟。而单细胞mRNA全长测序,需基于Smart-seq2的方法先进行扩增后再进行文库构建。
但是有些情况下,样本细胞数量相对较多,但又不足以用Bulk方法直接提取建库,而Smart-seq2的单细胞扩增体系也不适用于细胞数量过多的样本。如果减少细胞数量进行单细胞测序,一是成本增加、风险增大,二是不足以代表该群细胞的总体特征。因此,极客基因针对这一特殊样本研发出少量细胞RNA测序技术,该技术关键在于不需要进行扩增而直接构建文库,成本低、成功率高。
测序数据质量
基因表达PV-FC散点图(火山图),红色代表差异显著的基因
基因表达聚类图
上图为K=3时,K-means analysis,k均值聚类是一种矢量量化方法,起源于信号处理,是数据挖掘中常用的聚类分析方法。
k-means聚类的目的是将n个观测值划分为k个聚类,其中每个观测值都属于具有最接近均值的聚类,作为聚类的原型。
少量细胞转录组测序的数据量与bulk样本差别不大,因此,为保证数据分析结果的可靠性和准确性,极客基因推荐对有参考基因组的转录组采用最低6Gb clean data进行后续分析。
要求所用细胞活性和形态完整,不要有操作,如果所选细胞有降解可能会直接导致建库失败,或者构建的文库质量差,如出现接头污染率异常,数据duplication比例高,整体测序结果会出现随机性差,基因定量不准等;因此不建议使用此类型的样品。
正常细胞数量在1万-10万个左右,如果细胞个数太少可能会使后期文库浓度较低而影响测序质量;如细胞个数过多则会导致细胞裂解不充分,提取RNA不完全,同样会影响后期文库测序质量。
如果细胞特别小或者特别大,所需细胞数量酌情增加或减少,例如小鼠卵母细胞80-100个左右可以做;淋巴细胞的话最好106以上。