分级注意事项评价系统GRADE(分级降级研究证据因素)「分级评分法的步骤」

一、GRADE分级在系统评价和指南中的应用存在差异对于系统评价，GRADE仅用于对证据质量分级，而不给出推荐意见；对于指南，则需在对证据质量分级的基础上形成推荐意见，并对其推荐强度进行分级。
此外，对于同一升降级条目，在系统评价和指南中的含义和用法也可能完全不同，主要体现在一致性和精确性两个方面。
在一致性方面，需要综合考虑效应量的大小、方向、可信区间的重叠程度、P值和I2值，其中I2值起主要作用。
要注意的是，如果I2值很大(如超过80%)，在系统评价中被降两级，但在指南中可能不被降级。
因为对于系统评价制作者，一致性一般只需考虑研究的方向和大小，但对指南制定者而言，一致性只有在影响到推荐时才会被重点考虑。
在精确性方面，系统评价中主要看总样本量是否符合OIS标准，而对于指南，则看可信区间是否跨过推荐和不推荐治疗的临床决策阈值。
二、总的证据质量取决于至关重要结局中证据质量最低的结局在某些情况下，需要给出总的证据质量，但如果结局指标较多，首先应将其按临床重要性进行排序，并分为三个等级：至关重要的结局指标，如病死率、住院率等；重要的结局指标，如疼痛缓解等；一般的结局指标，如轻度恶心等。
在至关重要结局中，如果病死率的证据质量为中，住院率的证据质量为低，则总的证据质量取决于住院率的证据质量。
其原因主要考虑：①结局指标相对的重要程度；②下结论时应较为保守。
三、GRADE有可能只对一个研究进行质量分级GRADE是对证据体(evidence body)的分级，而非单个研究的分级，这一点是GRADE系统区别于以往所有证据分级标准的最大不同，而证据体的获得是通过系统评价的方式。
需强调的是，当且仅当系统评价仅纳入一个研究时，可对其使用GRADE分级。
但应注意，此时分级的对象仍然是证据体，只不过该证据体是以一个研究的形式来表现而已，降级的5个因素中，一致性此时不适用，因为只有1个研究，而其他4个降级因素均适用。
四、RCT和观察性研究升降级有所差异对于随机对照试验和观察性研究，均可以进行降级，因为其研究设计均可能存在缺陷，随机对照试验重点考虑降级，且在一般情况下，不考虑升级，因为如果设计无缺陷，本身就是最高级别，无需升级，如果设计有缺陷，则升级无意义；对于观察性研究，在无降级因素存在的情况下，如果有符合条件的升级因素，则可考虑升级。
五、分级条目权重问题的考虑对于使用GRADE分级的人员，较为关心的问题是不同分级条目间、同一分级条目内、以及不同研究间对升降级权重的影响(图1)。
GRADE工作组目前未对不同条目间的权重做出规定。
对同一条目内，我们以“偏倚风险”这条降级因素为例，其主要包括以下方面：随机方法、分配隐藏、盲法、试验早期终止和其他偏倚等。
分级人员可能会关心，是随机方法对最终结局的影响大还是分配隐藏？或是其他？GRADE工作组尚未对这些因素的权重做出规定。
但有研究发现，盲法对夸大疗效的影响最大。
这提示如果报道了该结局指标的若干个研究均未采用盲法，特别是当该结局指标为主观性时(如疼痛、症状改善程度)，相对于其他一些因素，可能对其考虑降级的程度更大。
但是，在某些情况下，如外科学研究中，盲法的实施较为困难，此时盲法的缺失可不作为主要降级因素。
另外，仍以偏倚风险这条降级因素中的分配隐藏为例，对于同一结局指标，有5个研究均予以报道，但彼此之间不一致时，应该如何取舍？如第1、3个研究实施得很好，第2、4个研究实施错误，第5个研究未报告，假设无其他偏倚风险,此时是否应该降级? GRADE工作组当前的解释是看这5个研究对结局指标的影响程度，假设分配隐藏实施很好的1、3个研究样本量很大，而其他几个研究样本量都很小，则可不考虑降级，反之亦然，若分配隐藏错误的研究权重很大，其他几个研究对结果的影响很小，则需降级。
六、升降级级数无需严格量化无论是升级还是降级，都不必拘泥于量化指标。
尽管GRADE规定有非常严重的偏倚风险可降低两级(-2)，有非常严重不精确性可降低两级(-2)，存在以上两方面缺陷的证据，理论上会被降到“极低”以下，但实际来说，最后的级别反倒可能是“低”而非“极低”。
因为要对5个降级因素整体考虑，综合给出最后的证据级别。
对于观察性研究升级也是一样，3个升级因素，每个都可升高2级，如果3个因素都存在，最高可升6级，但GRADE中规定观察性研究一开始的级别为 “低”，最多经过2级就可以升到“高”，所以无需拘泥于每个升降级因素的级数，而是应总体考虑后，充分描述升降级的原因。
七、可能影响GRADE分级结果的因素GRADE既可用来对作者自己撰写的系统评价进行分级，也可以为他人撰写的系统评价进行分级。
可能存在两个潜在因素，会造成分级结果的巨大差异，一是系统评价本身质量的低下，包括检索的不全面，纳入与排除标准不合理，无意义的合并以及系统评价制作者的利益冲突。
以有缺陷的检索为例，未检索灰色文献或限定了文种的系统评价，其遗漏的研究很可能会直接作用于升降级的各个因素，甚至会逆转分级的结果以及总的证据质量。
故在应用GRADE之前，分级人员应该对系统评价制作的报告质量和方法学质量予以评估，如果其有明显缺陷，则应放弃分级，否则分级结果将会产生严重误导。
第二个可能影响GRADE分级结果的因素是分级人员之间的不一致性，对于同一个结局指标，不同分级人员的结果可能存在差异，可能的解决办法为在分级前对人员进行统一培训，并就升降级因素的理解达成共识，在证据概要表和结果总结表备注中详细说明，以便取得分级结果的尽可能一致，并体现GRADE分级系统化、结构化、透明化和清晰明确的特点。