1、 1 附件医疗器械临床试验设计指导原则医疗器械临床试验是指在具备相应条件的临床试验机构中,对拟申请注册的医疗器械在正常使用条件下的安全有效性进行确认的过程。临床试验是以受试人群(样本)为观察对象,观察试验器械在正常使用条件下作用于人体的效应或对人体疾病、健康状态的评价能力,以推断试验器械在预期使用人群(总体)中的效应。由于医疗器械的固有特征,其试验设计有其自身特点。本指导原则适用于产品组成、设计和性能已定型的医疗器械,包括治疗类产品、诊断类产品,不包括体外诊断试剂。本指导原则是供申请人和审查人员使用的技术指导文件,不涉及注册审批等行政事项,亦不作为法规强制执行,如有能够满足法规要求的其他方法,
2、也可以采用,但应提供详细的研究资料和验证资料。应在遵循相关法规的前提下使用本指导原则。一、医疗器械临床试验目的临床试验需设定明确、具体的试验目的。申请人可综合分析试验器械特征、非临床研究情况、已在中国境内上市(下文简称已上市)同类产品的临床数据等因素,设定临床试验目的。临床 2 试验目的决定了临床试验各设计要素,包括主要评价指标、试验设计类型、对照试验的比较类型等,进而影响临床试验样本量。不同情形下的临床试验目的举例如下:(一)当 通 过 临 床 试 验 确 认 试 验 器 械 在 其 预 期 用 途 下 的 安 全 有效 性 时 ,若 更 关 注 试 验 器 械 的 疗 效 是 否 可 满
3、足 临 床 使 用 的 需 要 ,其临 床 试 验 目 的 可 设 定 为 确 认 试 验 器 械 的 有 效 性 是 否 优 于 /等 效 于 /非 劣 于 已 上 市 同 类 产 品 ,同 时 确 认 试 验 器 械 的 安 全 性 。此 时 ,临 床试 验 的 主 要 评 价 指 标 为 有 效 性 指 标 。(二)当 通 过 临 床 试 验 确 认 试 验 器 械 在 其 预 期 用 途 下 的 安 全有 效 性 时 ,若 更 关 注 试 验 器 械 的 安 全 性 是 否 可 满 足 临 床 使 用 的需 要 ,其 临 床 试 验 目 的 可 设 定 为 确 认 试 验 器 械 的
4、安 全 性 是 否 优于 /等 效 于 /非 劣 于 已 上 市 同 类 产 品 ,同 时 确 认 试 验 器 械 的 有 效性 。此 时 ,临 床 试 验 的 主 要 评 价 指 标 为 安 全 性 指 标 ,以 乳 房 植 入体 为 例 ,临 床 试 验 通 常 选 择 并 发 症 发 生 率 (如 包 膜 挛 缩 率 、植 入体 破 裂 率 )作 为 主 要 评 价 指 标 。(三)对于已上市产品增加适应症的情形,临床试验目的可设定为确认试验器械对新增适应症的安全有效性。例如,止血类产品在已批准适用范围(如普通外科、妇产科)的基础上,增加眼科、神经外科、泌尿外科使用的适应症。(四)当已上
5、市器械适用人群发生变化时,临床试验目的可设定为确认试验器械对新增适用人群的安全有效性。例如膜式 3 氧合器产品,在原批准适用范围的基础上新增体重10kg 的适用人群;又如治疗类呼吸机在已批准的适用于成人的基础上新增适用于儿童的适用范围。(五)当已上市器械发生重大设计变更时,可根据变更涉及的范围设定试验目的。例如冠状动脉药物洗脱支架平台花纹设计发生改变时,临床试验目的可设定为确认变化部分对于产品安全有效性的影响。(六)当已上市器械的使用环境或使用方法发生重大改变时,试验目的可设定为确认产品在特定使用环境和使用方法下的安全有效性。例如:已上市的植入式心脏起搏器通常不能兼容核磁共振检查,如申请兼容核
6、磁共振检查,其临床试验目的可设置为对兼容核磁共振检查相关的安全有效性进行确认。二、临床试验设计的基本类型和特点(一)平行对照设计随机、双盲、平行对照的临床试验设计可使临床试验影响因素在试验组和对照组间的分布趋于均衡,保证研究者、评价者和受试者均不知晓分组信息,避免了选择偏倚和评价偏倚,被认为可提供高等级的科学证据,通常被优先考虑。对于某些医疗器械,此种设计的可行性受到器械固有特征的挑战。1.随机化随机 化 是 平 行 对 照 、配 对 设 计 、交 叉 设 计 等 临 床 试 验 需 要 遵 4 循 的 基 本 原 则 ,指 临 床 试 验 中 每 位 受 试 者 均 有 同 等 机 会 (如
7、 试 验 组与 对 照 组 病 例 数 为 1:1)或 其 他 约 定 的 概 率 (如 试 验 组 与 对 照 组 病例 数 为 n:1)被 分 配 到 试 验 组 或 对 照 组 ,不 受 研 究 者 和 /或 受 试 者 主观 意 愿 的 影 响 。随 机 化 是 为 了 保 障 试 验 组 和 对 照 组 受 试 者 在 各 种已 知 和 未 知 的 可 能 影 响 试 验 结 果 的 基 线 变 量 上 具 有 可 比 性 。非随机设计可能造成各种影响因素在组间分布不均衡,降低试验结果的可信度。一方面,协变量分析可能难以完全校正已知因素对结果的影响;另一方面,未知因素对试验结果产生的
8、影响亦难以评价,因此,通常不推荐非随机设计。如果申请人有充分的理由认为必须采用非随机设计,需要详述必须采用该设计的理由和控制选择偏倚的具体措施。2.盲法如果分组信息被知晓,研究者可能在器械使用过程中选择性关注试验组,评价者在进行疗效与安全性评价时可能产生倾向性,受试者可能受到主观因素的影响。盲法是控制临床试验中因“ 知 晓分 组信息” 而 产生偏倚的重要措施之一,目的是达到 临床试验中的各方人员对分组信息的不可知。根据设盲程度的不同,盲法可分为完整设盲、不完整设盲和不设盲。在完整设盲的临床试验中,受试者、研究者和评价者对分组信息均处于盲态。在很多情形下,基于器械及相应治疗方式的固有特征,完整设
9、盲是不可行的。当试验器械与对照器械存在明显不同时,难以 5 对研究者设盲,例如膝关节假体,试验产品和对照产品的外观可能存在明显不同,且植入物上有肉眼可见的制造商激光标记;又如血管内金属支架,试验产品和对照产品的具体结构、花纹不同。此时,建议尽量对受试者设盲,即受试者不知晓其被分入试验组或对照组,并采用第三方盲法评价(如中心阅片室、中心实验室、评价委员会等)和盲态数据审核。当试验器械形态与对照器械存在明显不同且主要评价指标来自影像学数据时,难以对研究者、评价者设盲,例如生物可吸收支架,当对照产品为金属支架时,由于生物可吸收支架平台发生降解,评估晚期管腔丢失指标(该指标以影像学方式评价)时难以对评
10、价者设盲。此时,建议尽量对受试者设盲,并采用盲态数据审核。上述由于器械的固有特征而不对研究者设盲、不对研究者和评价者设盲的情形,均为不完整设盲的临床试验设计。当试验组治疗方式(含器械)与对照组存在明显差异时,难以对受试者、研究者、评价者设盲,只能采取不设盲的试验设计,如介入治疗和手术治疗进行比较时、器械治疗和药物治疗进行比较时。为最大程度地减少偏倚,可考虑采用以下方法:(1)在完成受试者筛选和入组前,受试者和研究者均不知晓分组信息(即分配隐藏);(2)在伦理许可的前提下,受试者在完成治疗前,不知晓分组信息;(3)采用盲态数据审核。申请人需要对采用不完整设盲或者不设盲试验设计的理由 6 进行论述
11、,详述控制偏倚的具体措施(如采用可客观判定的指标以避免评价偏倚,采用标准操作规范以减小实施偏倚等)。3.对照对照包括阳性对照和安慰对照(如假处理对照、假手术对照等)。阳性对照需采用在拟定的临床试验条件下疗效肯定的已上市器械或公认的标准治疗方法。对于治疗类产品,选择阳性对照时,优先采用疗效和安全性已得到临床公认的已上市同类产品。如因合理理由不能采用已上市同类产品,可选用尽可能相似的产品作为阳性对照,其次可考虑标准治疗方法。例如,人工颈椎间盘假体开展临床试验时,如因合理理由不能采用已上市同类产品,可选择临床广泛使用的、对相应适应症的疗效已得到证实并被公认的产品。又如,治疗良性前列腺增生的设备在没有
12、同类产品上市的情形下,可采用良性前列腺增生症的标准治疗方法(经尿道前列腺电汽化术)作为对照。标准治疗方法包括多种情形,例如,对于部分临床上尚无有效治疗方法的疾病,其标准治疗方法可为对症支持治疗。在试验器械尚无相同或相似的已上市产品或相应的标准治疗方法时,若试验器械的疗效存在安慰效应,试验设计需考虑安慰对照,此时,尚需综合考虑伦理学因素。若已上市产品的疗效尚未得到临床公认,试验设计可根据具体情形,考虑标准治疗方法对照或安慰对照,申请人需充分论证对照的选取理由。例如用于缓 7 解疼痛的物理治疗类设备。对于 诊 断 器 械 ,对 照 需 采 用 诊 断 金 标 准 方 法 或 已 上 市 同 类 产
13、品 。(二)配对设计对于治疗类产品,常见的配对设计为同一受试对象的两个对应部位同时接受试验器械和对照治疗,试验器械和对照治疗的分配需考虑随机设计。配对设计主要适用于器械的局部效应评价,具有一定的局限性。例如,对于面部注射用交联透明质酸钠凝胶的临床试验,配对设计在保证受试者基线一致性上比平行对照设计具有优势,但试验中一旦发生系统性不良反应则难以确认其与试验器械或对照器械的相关性,且需要排除面部左右侧局部反应的互相影响。因此,申请人考虑进行配对设计时,需根据产品特征,综合考虑该设计类型的优势和局限性,恰当进行选择,并论述其合理性。对于诊断器械,若试验目的是评价试验器械的诊断准确性,常见的配对设计为
14、同一受试者/受试样品同时采用试验器械和诊断金标准方法或已上市同类器械来进行诊断。(三)交叉设计在交叉设计的临床试验中,每位受试者按照随机分配的排列顺序,先后不同阶段分别接受两种或两种以上的治疗/诊断。此类设计要求前一阶段的治疗/诊断对后一阶段的另一种治疗/诊断 8 不产生残留效应,后一阶段开始前,受试者一般需回复到基线状态,可考虑在两个干预阶段之间安排合理的洗脱期。(四)单组设计单组试验的实质是将主要评价指标的试验结果与已有临床数据进行比较,以评价试验器械的有效性/安全性。与平行对照试验相比,单组试验的固有偏倚是非同期对照偏倚,由于时间上的不同步,可能引起选择偏倚、混杂偏倚、测量偏倚和评价偏倚
15、等,应审慎选择。在开展单组试验时,需要对可能存在的偏倚进行全面分析和有效控制。1.与目标值比较与目标值比较的单组设计需事先指定主要评价指标有临床意义的目标值,通过考察单组临床试验主要评价指标的结果是否在指定的目标值范围内,从而评价试验器械有效性/安全性。当试验器械技术比较成熟且对其适用疾病有较为深刻的了解时,或者当设置对照在客观上不可行时(例如试验器械与现有治疗方法的风险受益过于悬殊,设置对照在伦理上不可行;又如现有治疗方法因客观条件限制不具有可行性等),方可考虑采用单组目标值设计。考虑单组目标值设计时,还需关注试验器械的适用人群、主要评价指标(如观察方法、随访时间、判定标准等)是否可被充分定
16、义且相对稳定。为尽量弥补单组目标值设计的固有缺陷,需尽可能采用相对客观、可重复性强的评价指标作为主要评 9 价指标,如死亡、失败等;不建议选择容易受主观因素影响、可重复性差的指标作为主要评价指标,如疼痛评分等。目标值是专业领域内公认的某类医疗器械的有效性/安全性评价指标所应达到的最低标准,包括客观性能标准(Objective performance criteria,OPC)和性能目标(Performance goal,PG)两种。目标值通常为二分类(如有效/无效)指标,也可为定量指标,包括靶值和单侧置信区间界限(通常为 97.5%单侧置信区间界限)。目标值的构建通常需要全面收集具有一定质量水
17、平及相当数量病例的临床研究数据,并进行科学分析(如 Meta 分析)。对临床试验结果进行统计分析时,需计算主要评价指标的点估计值和单侧置信区间界限值,并将其与目标值进行比较。由于没有设置对照组,单组目标值设计的临床试验无法确证试验器械的优效、等效或非劣效,仅能确证试验器械的有效性/安全性达到专业领域内公认的最低标准。(1)与 OPC 比较OPC 是在既往临床研究数据的基础上分析得出,用于试验器械主要评价指标的比较和评价,经确认的 OPC 目前尚不多见。OPC 通常来源于权威医学组织、相关标准化组织、医疗器械审评机构发布的文件。例如一次性使用膜式氧合器,其临床试验可采用单组目标值设计,当主要评价
18、指标采用一次性使用膜式氧合器注册技术审查指导原则中提及的复合指标“达标率” 时, 10 试验产品达标率的目标值应至少为 90%,预期达标率为 95%。又如,根据髋关节假体系统注册技术审查指导原则,对于常规设计的髋关节假体,当临床试验采用单组目标值设计,主要评价指标采用术后 12 个月 Harris 评分“优良率”时,试验产品“ 优良率”的目标值应至少为 85%,预期优良率为 95%。随着器械技术和临床技能的提高,OPC 可能发生改变,需要对临床数据重新进行分析以确认。(2)与 PG 比较当有合理理由不能开展对照试验而必须考虑开展单组目标值设计时,若没有公开发表的 OPC,可考虑构建 PG。例如
19、脱细胞角膜植片,适用于药物治疗无效需要进行板层角膜移植的感染性角膜炎患者。由于开展临床试验时市场上无同类产品,且与异体角膜移植对比存在角膜来源困难的问题,故采用 PG 单组设计进行临床试验,PG 来源于异体角膜移植既往临床研究数据,由相关权威的专业医学组织认可。与 OPC 相比,采用 PG 的单组设计的临床证据水平更低。PG 的实现/未实现不能立即得出试验成功/ 失败的结论,如果 发现异常试验数据时,需要对试验结果进行进一步探讨和论证。2.与历史研究对照与历 史 研 究 对 照 的 临 床 试 验 证 据 强 度 弱 ,可 能 存 在 选 择 偏倚 、混 杂 偏 倚 等 问 题 ,应 审 慎 选 择 。当 采 用 某 一 历 史 研 究 作 为 对 照