新发共识丨mNGS生物信息分析及报告质量控制专家共识发布!
文献信息

目前,复杂的生物信息分析和非标准化的报告审核依然是mNGS在向临床转化过程中面临的重要挑战。本共识首次将生物信息作为一个独立部分进行理论化、标准化,为临床实验室规范使用mNGS检测临床病原微生物提供支持。
共识可分为四大模块,分别为:专业术语、数据要求、分析流程与质量控制、报告解读。
术语与定义
共识对mNGS生物分析中常见的术语进行统一规范定义。术语包括:微生物宏基因组测序、低质量序列、标签跳跃、宿主基因组序列、参考菌株基因组、比对、唯一比对序列数、覆盖度、测序深度、均一性、序列相似度、组装、物种注释、人体定植微生物、责任致病微生物。
检测数据要求
碱基质量值是衡量碱基准确性的重要指标,mNGS检测数据包含数据质量和数据量两个维度,专家组共形成2条专家推荐共识。
数据质量
共识1:(证据等级A,推荐强度Ⅱ)
在分析测序数据之前,应首先逐一对单样本测序结果进行质量控制,去除序列过短和低质量的序列,获得的高质量序列再与人源基因组序列比对以去除干扰,剩余序列进入后续的微生物检测分析。
数据要求
欧洲临床病毒学学会下一代测序协作组推荐用于病毒诊断的每个标本中序列数要大于1000万条(10 M)。依据文献,血液标本游离DNA测序量≥2400万条序列时,灵敏度为48%,而上升至3300万条序列时,灵敏度升至71%。
共识2:(证据等级B,推荐强度Ⅱ)
为确保目标病原微生物的检出,单个样本的mNGS测序数据量与检测样本人源细胞数及背景微生物的比例分布有关。最低测序数据量设置可参考《病原宏基因组高通量测序性能确认方案》,推荐最低数据量评估方法。
生物信息分析流程&质量控制要求
生信分析流程及质量控制部分共包含4条专家推荐共识。
生物信息分析流程
测序后数据分析流程应包括数据清洗、数据库比对、物种注释、物种定量四大功能模块。
(一)数据清洗
数据清洗:
数据清洗应包括去接头序列、单碱基质量评价、去低测序质量序列、去除含N碱基序列、去低复杂度序列、去过短序列。
去宿主基因组序列:
将去除低质量后的测序数据与宿主基因组数据库序列比对,并将与宿主基因组序列匹配的序列去除。宿主DNA占测序数据量的比例可作为实验质量评价的参考因素。
评价去除效果方法:
(1)利用模拟对应测序长度(SE50,SE75等)的人基因组测序数据软件比对以去除。计算比对上的序列数与参考品中真实的序列数,并计算两者的差异。
(2)合并人基因组和常见80种病原微生物(应包含细菌、真菌、病毒、寄生虫等主要病原微生物)基因组数据,再对合并基因组数据进行测序数据模拟,并去除人类基因序列。计算去除宿主序列后微生物物种鉴定的敏感性和特异度。
共识3:(证据等级B,推荐强度Ⅱ)
mNGS去除宿主基因组宜采用bowtie2或者bwa‑mem算法去除比对到人参考基因组CHM13、GRCh38的人源序列。如采用第三方软件,需要采用模拟人基因组数据和微生物质控数据评估。
(二)微生物数据库构建
共识对微生物数据库的数据来源及完整性提出要求,并对数据库的质量作出指导。此外,微生物的物种基因组存在自发变异(尤其是RNA病毒),物种内的序列多样性随时间增加,变异后的物种耐药表型和毒力也不同,所以,微生物基因组数据库需要及时更新。
共识4:(证据等级A,推荐强度Ⅱ)
为充分满足微生物基因组数据库的完整性,应整合多个公共数据库中的微生物基因组信息,可加入自建微生物基因组数据库。
共识5:(证据等级B,推荐强度Ⅱ)
微生物数据库构建应全面考虑物种选择、基因组序列代表性、完整性以及序列注释的准确性。
(三)物种注释
宜采用不同的生物信息算法对测序结果综合分析,再对物种加以注释。
共识6:(证据等级A,推荐强度Ⅱ)
物种注释分析需要兼顾计算效率和物种分类准确度,宜采用组合的物种注释分析方法。物种注释结果应综合唯一比对序列数、基因组覆盖度、基因组覆盖深度、基因组均一性等多指标判断。
(四)物种定量
对于注释到的物种可用相对丰度、归一化序列数来进行物种定量。
为保证不同样本中同一物种的序列数可比性,可将每百万序列数中比对到某一微生物基因组的特异序列数(RPM)作为归一化序列数指标。
为比较同一样本文库中不同微生物的归一化序列数,可通过计算每百万序列每1000 bp的基因组长度下的归一化序列数,消除微生物基因组大小不同带来的序列数差异。
数据解读和结果报告要求
数据到报告的解读需要经过两个步骤,分别是判别检出微生物置信度以及区分检出微生物是否为真正的病原微生物。本共识针对数据解读及结果报告提出了3条专家推荐共识和5点解读原则。
共识7:(证据等级B,推荐强度Ⅰ)
对于原始微生物物种谱的解读应分为两步,第一步是对检出微生物置信度的判别,即判断该微生物是否在该生物标本中真实存在;第二步是从置信检出的微生物中判别与临床相符的责任致病微生物。
共识8:(证据等级B,推荐强度Ⅱ)
通过与阴性质控品中的微生物检出与否和相对丰度比较,构建背景微生物库,并进行每个样本的背景微生物过滤。背景微生物的序列需要经过验证并适时更新。
共识9:(证据等级A,推荐强度Ⅱ)
根据标本类型,首先确定特定标本中的绝对致病微生物;如果标本中存在定植微生物,按各类微生物相对丰度从高到低顺序排序,逐一结合已知病原微生物的致病性分析研判。在创伤、肿瘤、免疫抑制等特殊患者的标本中定植微生物也可成为责任致病微生物。正确鉴别定植微生物和病原微生物需要根据标本来源、检出的微生物的量以及患者的临床症状、炎症指标、病理、影像学等信息综合分析。
mNGS解读原则
1.结果判读中病原体因素:对不同分类的物种分别判读,同一种类的物种序列数越多或相对丰度越高,该物种为病原体的可能性越大(在有菌部位定植物种除外),应分别对细菌、真菌、病毒、寄生虫、特殊病原体(如分枝杆菌、奴卡菌、耶氏肺孢子菌、支原体、衣原体、立克次体等)进行分析。序列数应考虑不同物种基因组大小(病毒<细菌<真菌< 寄生虫)和核酸提取效率的难易程度(病毒<革兰阴性菌<革兰阳性菌<真菌<结核分枝杆菌)。
2.寄生虫检测结果的解读考量:现有的寄生虫数据库尚不完善,且寄生虫基因部分核酸序列与人类基因序列相似度较高,因此,寄生虫基因测序结果一定要查看比对序列是否为唯一比对序列以及基因组覆盖率,以降低假阳性率。
3.近源物种相似性的影响:分析时需高度重视近源物种间基因组相似性对结果的影响,特别是当鉴定出的革兰阴性杆菌数量多于细菌培养结果时,如大肠埃希菌和志贺菌、链球菌属、奈瑟菌属和芽孢菌属下的同属异种菌,须关注革兰阴性菌中可移动遗传元件(质粒、转座子、原噬菌体、基因岛等)的影响。
4.病毒基因组结果的解读处理:由于RNA病毒变异较快,对基因组覆盖度较高的病毒基因组,宜采用组装方法对病毒基因组组装。检出病毒株的组装结果与同种不同株的病毒基因组进行比对分析和进化分析,通过进化树对病毒溯源。
5.耐药基因结果的分析与报告原则:如检测到耐碳青霉烯类肠杆菌科、产超广谱β‑内酰胺酶肠杆菌科、耐万古霉素肠球菌和耐甲氧西林金黄色葡萄球菌等常见的多重耐药菌相关的耐药基因时,应在报告中注明。由于耐药基因与临床实际药敏结果并非一一对应,因此,应同时做药敏试验,最终结果以药敏结果为准。耐药基因检测还可结合结构域的检测,用于识别潜在的新型耐药基因。
参考文献:
[1]中华医学会检验医学分会. 病原微生物宏基因组测序生物信息分析及报告质量控制专家共识[J]. 中华检验医学杂志,2025,48(01):28-37.
