發(fā)文日期2021年04月13日
時效性現(xiàn)行有效
發(fā)文字號國家藥品監(jiān)督管理局藥品審評中心通告2021年第27號
施行日期2021年04月13日
效力級別部門規(guī)范性文件
為進一步指導(dǎo)和規(guī)范申辦者利用真實世界數(shù)據(jù)生成真實世界證據(jù)支持藥物研發(fā),藥審中心組織制定了《用于產(chǎn)生真實世界證據(jù)的真實世界數(shù)據(jù)指導(dǎo)原則(試行)》(見附件)。根據(jù)《國家藥監(jiān)局綜合司關(guān)于印發(fā)藥品技術(shù)指導(dǎo)原則發(fā)布程序的通知》(藥監(jiān)綜藥管〔2020〕9號)要求,經(jīng)國家藥品監(jiān)督管理局審查同意,現(xiàn)予發(fā)布,自發(fā)布之日起施行。
特此通告。
國家藥品監(jiān)督管理局藥品審評中心
2021年4月13日
附件:
用于產(chǎn)生真實世界證據(jù)的真實世界數(shù)據(jù)指導(dǎo)原則
一、 概述
真實世界證據(jù)是藥物有效性和安全性評價證據(jù)鏈的重要組成部分,其相關(guān)概念和應(yīng)用參見《真實世界證據(jù)支持藥物研發(fā)與審評的指導(dǎo)原則(試行)》。而真實世界數(shù)據(jù)則是產(chǎn)生真實世界證據(jù)的基礎(chǔ),沒有高質(zhì)量的適用的真實世界數(shù)據(jù)支持,真實世界證據(jù)亦無從談起。
真實世界數(shù)據(jù)是指來源于日常所收集的各種與患者健康狀況和/或診療及保健有關(guān)的數(shù)據(jù)。并非所有的真實世界數(shù)據(jù)經(jīng)分析后就能產(chǎn)生真實世界證據(jù),只有滿足適用性的真實世界數(shù)據(jù)經(jīng)恰當(dāng)和充分地分析后才有可能形成真實世界證據(jù)。目前真實世界數(shù)據(jù)的數(shù)據(jù)記錄、采集、存儲等流程缺乏嚴(yán)格的質(zhì)量控制,可能存在數(shù)據(jù)不完整,數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)模型和描述方法不統(tǒng)一等問題,對真實世界數(shù)據(jù)的有效使用形成了障礙。因此,如何使收集的真實世界數(shù)據(jù)能夠成為或經(jīng)治理后能夠成為滿足臨床研究目的所需的分析數(shù)據(jù),以及如何評估真實世界數(shù)據(jù)是否適用于產(chǎn)生真實世界證據(jù),是使用真實世界數(shù)據(jù)形成真實世界證據(jù)支持藥物監(jiān)管決策的關(guān)鍵問題。
本指導(dǎo)原則作為《真實世界證據(jù)支持藥物研發(fā)與審評的指導(dǎo)原則(試行)》的補充,將從真實世界數(shù)據(jù)的定義、來源、評價、治理、標(biāo)準(zhǔn)、安全合規(guī)、質(zhì)量保障、適用性等方面,對真實世界數(shù)據(jù)給出具體要求和指導(dǎo)性建議,以幫助申辦者更好地進行數(shù)據(jù)治理,評估真實世界數(shù)據(jù)的適用性,為產(chǎn)生有效的真實世界證據(jù)做好充分準(zhǔn)備。
二、 真實世界數(shù)據(jù)來源及現(xiàn)狀
藥物研發(fā)有關(guān)的真實世界數(shù)據(jù)主要包括在真實醫(yī)療環(huán)境下診療過程的記錄數(shù)據(jù)(如電子病歷),以及各種觀察性研究數(shù)據(jù)等。此類數(shù)據(jù)可以是開展真實世界研究前已經(jīng)收集的數(shù)據(jù),也可以是為了開展真實世界研究而新收集的數(shù)據(jù)。
(一)真實世界數(shù)據(jù)常見的主要來源
我國真實世界數(shù)據(jù)的來源按功能類型主要可分為醫(yī)院信息系統(tǒng)數(shù)據(jù)、醫(yī)保支付數(shù)據(jù)、登記研究數(shù)據(jù)、藥品安全性主動監(jiān)測、自然人群隊列數(shù)據(jù)等,以下是根據(jù)數(shù)據(jù)功能類型分類的常見真實世界數(shù)據(jù)來源。
1.醫(yī)院信息系統(tǒng)數(shù)據(jù)
醫(yī)院信息系統(tǒng)數(shù)據(jù)包括結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)字化或非數(shù)字化患者記錄,如患者的人口學(xué)特征、臨床特征、診斷、治療、實驗室檢查、安全性和臨床結(jié)局等,通常分散存儲于醫(yī)療衛(wèi)生機構(gòu)的電子病歷/電子健康檔案、實驗室信息管理系統(tǒng)、醫(yī)學(xué)影像存檔與通訊系統(tǒng)、放射信息管理系統(tǒng)等不同信息系統(tǒng)中。有些醫(yī)療機構(gòu)在數(shù)據(jù)集成平臺或臨床數(shù)據(jù)中心的基礎(chǔ)上建立院級科研數(shù)據(jù)平臺,整合患者門診、住院、隨訪等各類信息,形成直接用于臨床研究的數(shù)據(jù)。有些區(qū)域性醫(yī)療數(shù)據(jù)庫,利用相對集中的物理環(huán)境進行跨醫(yī)療機構(gòu)的臨床數(shù)據(jù)的存儲和處理,具有存儲量大、類型多等特點,也可作為真實世界數(shù)據(jù)的潛在來源。
醫(yī)院信息系統(tǒng)數(shù)據(jù)基于臨床診療實踐過程的記錄,涵蓋臨床結(jié)局和藥物暴露范圍較廣,尤其電子病歷數(shù)據(jù)在真實世界研究中應(yīng)用較廣。
2.醫(yī)保支付數(shù)據(jù)
我國醫(yī)保支付數(shù)據(jù)的主要來源有兩類,一類是政府、醫(yī)療機構(gòu)建立的基本醫(yī)療保險體系,進行醫(yī)保支付數(shù)據(jù)庫的建立和統(tǒng)一管理,包含有關(guān)患者基本信息、醫(yī)療服務(wù)利用、處方、結(jié)算、醫(yī)療索賠等結(jié)構(gòu)化字段的數(shù)據(jù);另一類是商業(yè)健康保險數(shù)據(jù)庫,由保險機構(gòu)建立,數(shù)據(jù)以保險公司理賠給付與保險期限作為分類指標(biāo),數(shù)據(jù)維度相對簡單。醫(yī)保系統(tǒng)作為真實世界數(shù)據(jù)來源,較多用于開展衛(wèi)生技術(shù)評價和藥物經(jīng)濟學(xué)研究。
3.登記研究數(shù)據(jù)
登記研究數(shù)據(jù)是通過有組織的系統(tǒng),利用觀察性研究的方法搜集臨床和其它來源的數(shù)據(jù),可用于評價特定疾病、特定健康狀況和暴露人群的臨床結(jié)局。登記研究根據(jù)研究定義的人群特點主要包括醫(yī)療產(chǎn)品登記研究、疾病登記研究和健康服務(wù)登記研究三類,我國的登記研究主要是前兩類。其中,醫(yī)療機構(gòu)和企業(yè)支持開展的藥品登記研究,觀察對象是使用某種藥品的患者,重點觀察藥品用于不同適應(yīng)癥的臨床療效或監(jiān)測不良反應(yīng)。
登記研究數(shù)據(jù)庫的優(yōu)勢在于以特定患者為研究人群,整合臨床診療、醫(yī)保支付等多種數(shù)據(jù)來源,數(shù)據(jù)采集較為規(guī)范,一般包括患者自報數(shù)據(jù)和長期隨訪數(shù)據(jù),觀測結(jié)局指標(biāo)通常較為豐富,具有準(zhǔn)確性較高、結(jié)構(gòu)化強等優(yōu)點,對于評價藥物的有效性、安全性、經(jīng)濟性和依從性具有較好的適用性,還可用于疾病自然史及預(yù)后研究。
4.藥品安全性主動監(jiān)測數(shù)據(jù)
藥品安全性主動監(jiān)測數(shù)據(jù)主要用于開展藥物安全性研究及藥物流行病學(xué)研究,通過國家或區(qū)域藥品安全性監(jiān)測網(wǎng)絡(luò),從醫(yī)療機構(gòu)、制藥公司、醫(yī)學(xué)文獻、網(wǎng)絡(luò)媒體、患者報告結(jié)局等渠道,進行數(shù)據(jù)收集。此外,醫(yī)療機構(gòu)和企業(yè)自身建立的自有藥品的安全性監(jiān)測數(shù)據(jù)庫也可能成為此類數(shù)據(jù)來源的一部分。
5.自然人群隊列數(shù)據(jù)
自然人群隊列數(shù)據(jù)指對健康人群和/或患者人群通過長期前瞻性動態(tài)追蹤觀察,獲取的各種數(shù)據(jù)。自然人群隊列數(shù)據(jù)具有統(tǒng)一標(biāo)準(zhǔn)、信息化共享、時間跨度長和樣本量較大的特點,此類真實世界數(shù)據(jù)可以幫助構(gòu)建常見疾病風(fēng)險模型,可為藥物研發(fā)目標(biāo)人群的精準(zhǔn)定位提供支持。
6.組學(xué)數(shù)據(jù)
組學(xué)數(shù)據(jù)作為精準(zhǔn)醫(yī)學(xué)的重要支撐,主要包括基因組、表觀遺傳、轉(zhuǎn)錄組、蛋白質(zhì)組和代謝組等數(shù)據(jù),這些數(shù)據(jù)從系統(tǒng)生物學(xué)角度刻畫了患者在遺傳學(xué)、生理學(xué)、生物學(xué)等方面的特征。通常組學(xué)數(shù)據(jù)需要結(jié)合臨床數(shù)據(jù)才可能成為適用的真實世界數(shù)據(jù)。
7.死亡登記數(shù)據(jù)
人口死亡登記是一個國家對其國民的死亡信息持續(xù)完整的收集和記錄。目前我國有四個系統(tǒng)用于收集人口死亡信息,分別隸屬于國家疾控中心、國家衛(wèi)生健康委員會、公安部和民政部。人口死亡登記數(shù)據(jù)包含死亡醫(yī)學(xué)證明書中的所有信息,記錄了詳細的死亡原因和死亡時間,可以作為人群分死因死亡率、重大疾病臨床結(jié)局的數(shù)據(jù)來源。
8.患者報告結(jié)局數(shù)據(jù)
患者報告結(jié)局是一種來自患者自身測量與評價疾病結(jié)局的指標(biāo),包括癥狀、生理、心理、醫(yī)療服務(wù)滿意度等,患者報告結(jié)局在藥物評價體系發(fā)展中越來越重要。其記錄有紙質(zhì)和電子兩種方式,后者稱為電子患者報告結(jié)局,其興起與應(yīng)用,使得患者報告結(jié)局與電子病歷系統(tǒng)對接并形成患者層面的完整數(shù)據(jù)流成為可能。
9.來自移動設(shè)備的個體健康監(jiān)測數(shù)據(jù)
個人健康監(jiān)測數(shù)據(jù)可通過移動設(shè)備(如智能手機、可穿戴設(shè)備)實時采集個體生理體征指標(biāo)。這些數(shù)據(jù)常產(chǎn)生于普通人群的自我健康管理、醫(yī)療機構(gòu)對慢病患者的監(jiān)測、醫(yī)療保險公司對參保人群健康狀況評估的過程,通常存儲于可穿戴設(shè)備企業(yè)、醫(yī)療機構(gòu)數(shù)據(jù)庫以及商業(yè)保險公司數(shù)據(jù)系統(tǒng)等。由于可穿戴設(shè)備在收集生理和體征數(shù)據(jù)方面具有便利性和即時性等優(yōu)勢,與電子健康數(shù)據(jù)銜接可形成更完整的真實世界數(shù)據(jù)。
10.其它特定功能數(shù)據(jù)
(1)公共衛(wèi)生監(jiān)測數(shù)據(jù)
我國建立了一系列有關(guān)公共衛(wèi)生監(jiān)測的數(shù)據(jù)庫,如傳染病監(jiān)測、預(yù)防接種不良事件監(jiān)測等,所記錄的數(shù)據(jù)可用于分析傳染病的發(fā)病情況、疫苗的一般反應(yīng)和異常反應(yīng)發(fā)生率等。
(2)患者隨訪數(shù)據(jù)
在真實世界臨床診療環(huán)境中,院內(nèi)電子病歷數(shù)據(jù)往往無法涵蓋患者一些重要的臨床指標(biāo),如總生存期、五年生存率、不良反應(yīng)信息等,需要補充長期隨訪數(shù)據(jù),才能形成適用的真實世界數(shù)據(jù)。患者隨訪數(shù)據(jù)主要是指以臨床研究為目的,醫(yī)院隨訪部門或第三方授權(quán)服務(wù)商以信件、電話、門診、短信、網(wǎng)絡(luò)隨訪等方式對離院患者開展臨床終點、康復(fù)指導(dǎo)、用藥提醒、滿意度調(diào)查等服務(wù),服務(wù)中收集的院外數(shù)據(jù),通常存儲于醫(yī)院隨訪數(shù)據(jù)系統(tǒng)。通過與病歷數(shù)據(jù)的鏈接,實現(xiàn)多源臨床數(shù)據(jù)的融合,用以探索疾病發(fā)生機制、發(fā)展規(guī)律、治療方法、預(yù)后相關(guān)因素等臨床研究問題。
(3)患者用藥數(shù)據(jù)
患者診療過程藥品使用數(shù)據(jù)包括患者信息、藥品品規(guī)、藥品用法用量以及不良反應(yīng)等信息,通常存儲于醫(yī)院藥品管理信息系統(tǒng)、醫(yī)藥電子商務(wù)平臺、制藥企業(yè)產(chǎn)品追溯和藥品安全性信息數(shù)據(jù)庫,以及藥品使用監(jiān)測平臺等。伴隨遠程診療和互聯(lián)網(wǎng)+慢病管理模式的普及,存儲于處方流轉(zhuǎn)平臺或醫(yī)藥電商平臺的患者院外用藥數(shù)據(jù)逐漸增多,此類數(shù)據(jù)的有效利用或拼接,可作為患者維度診療過程記錄的真實世界數(shù)據(jù)來源。
隨著醫(yī)療信息技術(shù)的不斷發(fā)展,新的真實世界數(shù)據(jù)類型和來源會不斷出現(xiàn),但其具體應(yīng)用還有賴于所要解決的臨床研究問題,以及該數(shù)據(jù)所支持產(chǎn)生真實世界證據(jù)的適用性。
(二)真實世界數(shù)據(jù)應(yīng)用面臨的主要挑戰(zhàn)
從數(shù)據(jù)來源看,相較于隨機對照試驗(RandomizedControlledTrial,RCT)數(shù)據(jù),真實世界數(shù)據(jù)在大多數(shù)情況下缺乏其記錄、采集、存儲等流程的嚴(yán)格質(zhì)量控制,會造成數(shù)據(jù)不完整、關(guān)鍵變量缺失、記錄不準(zhǔn)確等問題,這些數(shù)據(jù)質(zhì)量上的缺陷,會極大地影響后續(xù)的數(shù)據(jù)治理和應(yīng)用,甚至?xí)绊憯?shù)據(jù)的可追溯性,研究者也難以發(fā)現(xiàn)其中的問題并進行核對和修正。由于患者病程、就診地點以及時間和空間等因素的變化,可能導(dǎo)致患者疾病狀態(tài)及相關(guān)因素等信息的缺失,為臨床研究疾病狀態(tài)及結(jié)局的系統(tǒng)性評價帶來挑戰(zhàn)。選擇性的數(shù)據(jù)收集,特別是登記研究數(shù)據(jù),是導(dǎo)致研究結(jié)果偏倚的潛在風(fēng)險。
由于各種真實世界數(shù)據(jù)來源之間相對獨立和封閉、數(shù)據(jù)管理系統(tǒng)種類繁多、數(shù)據(jù)存儲分散且數(shù)據(jù)標(biāo)準(zhǔn)不一致、數(shù)據(jù)橫向整合和交換存在困難,造成數(shù)據(jù)碎片化和信息孤島現(xiàn)象突出。對于電子病歷數(shù)據(jù),由于其高度敏感性,該系統(tǒng)一般封閉管理,對它們的利用可能會受到一定限制。電子病歷還可能因文字類型的主觀性描述和記錄人差異,而影響對臨床結(jié)局的客觀評價。此外,在缺乏統(tǒng)一標(biāo)準(zhǔn)的情況下,數(shù)據(jù)類型較為多樣,既有結(jié)構(gòu)化數(shù)據(jù),也有文本、圖片、視頻等非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),在數(shù)據(jù)記錄、采集、存儲的過程中,也會導(dǎo)致數(shù)據(jù)的冗余和重復(fù),進而造成數(shù)據(jù)處理難度加大。
三、 真實世界數(shù)據(jù)適用性評價
真實世界數(shù)據(jù)的適用性評價應(yīng)基于特定的研究目的和監(jiān)管決策用途。
(一)真實世界數(shù)據(jù)的數(shù)據(jù)治理和數(shù)據(jù)管理
真實世界數(shù)據(jù)可以根據(jù)研究開展的時間分為回顧性收集和前瞻性收集兩種方式獲取?;仡櫺允占臄?shù)據(jù)通常需要進行數(shù)據(jù)治理,數(shù)據(jù)主要來源于既往開展的回顧性觀察性研究、前瞻性觀察性研究、回顧前瞻性觀察性研究等。而前瞻性收集的數(shù)據(jù)則需進行數(shù)據(jù)管理,數(shù)據(jù)主要來源于將要開展的前瞻性觀察性研究,或?qū)嵱门R床試驗,由于此類數(shù)據(jù)類似于RCT的數(shù)據(jù)收集,即根據(jù)研究方案建立數(shù)據(jù)庫并通過電子數(shù)據(jù)采集系統(tǒng)采集數(shù)據(jù),是前瞻的、有計劃的、結(jié)構(gòu)化和標(biāo)準(zhǔn)化的數(shù)據(jù)。如果某項研究既利用了既往的數(shù)據(jù),又將采集將來的數(shù)據(jù),例如,從即時開始的回顧前瞻性研究,則對回顧性收集的數(shù)據(jù)需經(jīng)數(shù)據(jù)治理,而對前瞻收集的數(shù)據(jù)則采用數(shù)據(jù)管理的方法,這里需要注意的關(guān)鍵問題是既往數(shù)據(jù)經(jīng)治理后的數(shù)據(jù)庫應(yīng)與前瞻性設(shè)計的數(shù)據(jù)庫相匹配。對于以外部對照的單臂臨床試驗,若為歷史對照,外部數(shù)據(jù)需采用治理手段;若為平行對照,外部數(shù)據(jù)可采用數(shù)據(jù)管理手段。
真實世界數(shù)據(jù)的適用性評價主要針對的是回顧性收集的數(shù)據(jù),但對前瞻性收集的數(shù)據(jù)也有指導(dǎo)意義。
適用性評價可分為兩個階段,第一階段是從可及性、倫理、合規(guī)、代表性、關(guān)鍵變量完整性、樣本量和源數(shù)據(jù)活動狀態(tài)等維度,對源數(shù)據(jù)進行初步評價和選擇,判斷其是否滿足研究方案的基本分析要求;第二階段包括數(shù)據(jù)的相關(guān)性、可靠性,以及采用的或擬采用的數(shù)據(jù)治理機制(數(shù)據(jù)標(biāo)準(zhǔn)和通用數(shù)據(jù)模型)的評價分析,經(jīng)治理的數(shù)據(jù)是否適用于產(chǎn)生真實世界證據(jù)(見圖1)。如果是前瞻性收集的真實世界數(shù)據(jù),則無需進行第一階段的初步適用性評價。
圖1真實世界數(shù)據(jù)的適用性評價和數(shù)據(jù)治理過程示意圖
(二)源數(shù)據(jù)的適用性評價
滿足基本分析要求的源數(shù)據(jù)至少應(yīng)具備以下條件:
1.數(shù)據(jù)庫處于活動狀態(tài)且數(shù)據(jù)可及
在研究期限內(nèi)數(shù)據(jù)庫應(yīng)是連續(xù)的處于活動狀態(tài)的,所記錄的數(shù)據(jù)均是可及的,即具有數(shù)據(jù)的使用權(quán)限,并且可被第三方特別是監(jiān)管機構(gòu)評估。
2.數(shù)據(jù)使用符合倫理和安全性要求
源數(shù)據(jù)的使用應(yīng)符合倫理審查法規(guī)要求,應(yīng)符合相關(guān)的數(shù)據(jù)安全與隱私保護要求。
3.關(guān)鍵變量的覆蓋度
源數(shù)據(jù)通常是不完整的,但應(yīng)具有一定的覆蓋度,至少應(yīng)包括與研究目的相關(guān)的結(jié)局變量、暴露/干預(yù)變量、人口學(xué)變量和重要的協(xié)變量。
4.樣本量足夠
應(yīng)充分考慮和預(yù)判經(jīng)數(shù)據(jù)治理后源數(shù)據(jù)例數(shù)明顯減少的情況,以保證統(tǒng)計分析所需的樣本量。
(三)經(jīng)治理數(shù)據(jù)的適用性評價
經(jīng)治理的真實世界數(shù)據(jù)的適用性評價主要根據(jù)數(shù)據(jù)相關(guān)性和可靠性。
1.相關(guān)性評價
相關(guān)性評價旨在評估真實世界數(shù)據(jù)是否與所關(guān)注的臨床問題密切相關(guān),重點關(guān)注關(guān)鍵變量的覆蓋度、暴露/干預(yù)和臨床結(jié)局定義的準(zhǔn)確性、目標(biāo)人群的代表性和多源異構(gòu)數(shù)據(jù)的融合性。
(1)關(guān)鍵變量和信息的覆蓋度
真實世界數(shù)據(jù)應(yīng)包含與臨床結(jié)局相關(guān)的重要變量和信息,如藥物使用、患者人口學(xué)和臨床特征、協(xié)變量、結(jié)局變量、隨訪時間、潛在安全性信息等。如果上述變量存在部分缺失,需充分評估是否能夠使用可靠的統(tǒng)計學(xué)方法進行填補,以及對于因果推斷結(jié)果可能造成的影響。
(2)暴露/干預(yù)和臨床結(jié)局定義的準(zhǔn)確性
選擇并準(zhǔn)確定義具有臨床意義的結(jié)局以及準(zhǔn)確定義暴露/干預(yù)對于真實世界研究至關(guān)重要,應(yīng)與研究問題的臨床意義或理論依據(jù)相一致。臨床結(jié)局的定義應(yīng)包括所基于的診斷標(biāo)準(zhǔn)、測量方法及其質(zhì)量控制(如果有)、測量工具(如量表的使用)、計算方法、測量時點、變量類型、變量類型的轉(zhuǎn)換(如從定量轉(zhuǎn)換為定性)、終點事件評價機制(如終點事件判定委員會的運行機制)等。當(dāng)不同數(shù)據(jù)源對臨床結(jié)局的定義不一致時,應(yīng)定義統(tǒng)一的臨床結(jié)局,并采用可靠的轉(zhuǎn)換方法。暴露/干預(yù)的定義應(yīng)考慮其時間窗的合理性。
(3)目標(biāo)人群的代表性
真實世界研究較傳統(tǒng)RCT的優(yōu)勢之一是具有更廣泛的目標(biāo)人群的代表性。因此,在制定納入和排除標(biāo)準(zhǔn)時,應(yīng)盡可能地符合真實世界環(huán)境下目標(biāo)人群。
(4)多源異構(gòu)數(shù)據(jù)的融合性
由于真實世界數(shù)據(jù)的特性,很多情況下屬于多來源的異構(gòu)數(shù)據(jù),需要將不同來源數(shù)據(jù)在個體水平進行數(shù)據(jù)的鏈接、融合和同構(gòu)處理。因此,應(yīng)通過身份標(biāo)識符進行個體水平的準(zhǔn)確鏈接,以支持通用數(shù)據(jù)模型或數(shù)據(jù)標(biāo)準(zhǔn)對數(shù)據(jù)源中關(guān)鍵變量進行整合。
2.可靠性評價
真實世界數(shù)據(jù)的可靠性主要從數(shù)據(jù)的完整性、準(zhǔn)確性、透明性、質(zhì)量控制和質(zhì)量保證幾個方面進行評價。
(1)完整性
完整性是指數(shù)據(jù)信息的缺失程度,包括變量的缺失和變量值的缺失。對于不同研究,數(shù)據(jù)的缺失程度、缺失分布、缺失原因和變量值的缺失機制不盡相同,應(yīng)該予以詳盡描述。當(dāng)特定研究的數(shù)據(jù)缺失比例明顯超過同類研究的比例時,會加大研究結(jié)論的不確定性,此時需要慎重考慮該數(shù)據(jù)能否作為支持產(chǎn)生真實世界證據(jù)的數(shù)據(jù)。對缺失原因的詳細分析有助于對數(shù)據(jù)可靠性的綜合判斷。如果涉及缺失數(shù)據(jù)的填補問題,應(yīng)根據(jù)缺失機制的合理假設(shè)采用恰當(dāng)?shù)奶钛a方法。
(2)準(zhǔn)確性
準(zhǔn)確性是指數(shù)據(jù)與其描述的客觀特征是否一致,包括源數(shù)據(jù)是否準(zhǔn)確、數(shù)據(jù)值域是否在合理范圍、結(jié)局變量隨時間變化趨勢是否合理、編碼映射關(guān)系是否對應(yīng)且唯一等。數(shù)據(jù)的準(zhǔn)確性需要依據(jù)較權(quán)威的參照進行識別和驗證,例如,終點事件是否經(jīng)獨立的終點事件判定委員會做出判斷。
(3)透明性
真實世界數(shù)據(jù)的透明性是指真實世界數(shù)據(jù)的治理方案和治理過程清晰透明,應(yīng)確保分析數(shù)據(jù)中的關(guān)鍵暴露/干預(yù)變量、協(xié)變量和結(jié)局變量能夠追溯至源數(shù)據(jù),并反映數(shù)據(jù)的提取、清洗、轉(zhuǎn)換和標(biāo)準(zhǔn)化過程。無論采用人工數(shù)據(jù)處理還是自動化程序處理,數(shù)據(jù)治理標(biāo)準(zhǔn)化操作程序和驗證確認文件要清晰記錄和存檔,尤其反映數(shù)據(jù)可信性的問題,如數(shù)據(jù)缺失程度、變量值域、衍生變量計算方法和映射關(guān)系等。數(shù)據(jù)治理方案應(yīng)事先根據(jù)研究目的制定,應(yīng)確保數(shù)據(jù)治理過程與治理方案保持一致。數(shù)據(jù)的透明性還包括數(shù)據(jù)的可及性、數(shù)據(jù)庫之間的信息共享和對患者隱私的保護方法的透明。如果使用算法來定義研究隊列,則算法的開發(fā)及其驗證也應(yīng)該是透明的。
(4)質(zhì)量控制
質(zhì)量控制是指用以確證數(shù)據(jù)治理的各個環(huán)節(jié)符合質(zhì)量要求而實施的技術(shù)和活動。質(zhì)量控制評價包括但不限于:數(shù)據(jù)提取、安全處理、清洗、結(jié)構(gòu)化,以及后續(xù)的存儲、傳輸、分析和遞交等環(huán)節(jié)是否均有質(zhì)量控制,以保證所有數(shù)據(jù)是可靠的,數(shù)據(jù)處理過程是正確的;是否遵循完整、規(guī)范、可靠的數(shù)據(jù)治理方案和計劃,并依托于相應(yīng)的數(shù)據(jù)質(zhì)量核查和系統(tǒng)驗證規(guī)程,以保障數(shù)據(jù)治理系統(tǒng)在正常和穩(wěn)態(tài)下運行,確保真實世界數(shù)據(jù)的準(zhǔn)確性和可靠性。
(5)質(zhì)量保證
質(zhì)量保證是指預(yù)防、探測和糾正研究過程中出現(xiàn)的數(shù)據(jù)錯誤或問題的系統(tǒng)性措施。真實世界數(shù)據(jù)的質(zhì)量保證與監(jiān)管合規(guī)性密切相關(guān),應(yīng)貫穿于數(shù)據(jù)治理的每一個環(huán)節(jié),考慮的內(nèi)容包括但不限于:是否建立與真實世界數(shù)據(jù)有關(guān)的研究計劃、方案和統(tǒng)計分析計劃;是否有相應(yīng)的標(biāo)準(zhǔn)操作規(guī)程;數(shù)據(jù)收集是否有明確流程和合格人員;是否使用了共同的定義框架,即數(shù)據(jù)字典;是否遵守收集關(guān)鍵數(shù)據(jù)變量的共同時間框架;用于數(shù)據(jù)元素捕獲的技術(shù)方法是否符合事先指定的技術(shù)規(guī)范與操作程序,包括各種來源數(shù)據(jù)的集成、藥物使用和實驗室檢查數(shù)據(jù)的記錄、隨訪記錄、與其它數(shù)據(jù)庫的鏈接等;數(shù)據(jù)輸入是否及時、傳輸是否安全;是否滿足監(jiān)管機構(gòu)現(xiàn)場核查調(diào)閱源數(shù)據(jù)、源文件等相關(guān)要求。
四、 真實世界數(shù)據(jù)治理
數(shù)據(jù)治理是指針對特定臨床研究問題,為達到適用于統(tǒng)計分析而對原始數(shù)據(jù)所進行的治理,其內(nèi)容包括但不限于:數(shù)據(jù)安全性處理、數(shù)據(jù)提?。ê鄠€數(shù)據(jù)源)、數(shù)據(jù)清洗(邏輯核查及異常數(shù)據(jù)處理、數(shù)據(jù)缺失處理)、數(shù)據(jù)轉(zhuǎn)化(數(shù)據(jù)標(biāo)準(zhǔn)、通用數(shù)據(jù)模型、歸一化、自然語言處理、醫(yī)學(xué)編碼、衍生變量計算)、數(shù)據(jù)傳輸和存儲、數(shù)據(jù)質(zhì)量控制等若干環(huán)節(jié)。
(一)個人信息保護和數(shù)據(jù)安全性處理
真實世界研究涉及個人信息保護應(yīng)遵循國家信息安全技術(shù)規(guī)范、醫(yī)療大數(shù)據(jù)安全管理相關(guān)規(guī)定,對個人敏感信息應(yīng)進行去標(biāo)識化處理,確保根據(jù)數(shù)據(jù)無法進行個人敏感信息匹配還原,通過技術(shù)和管理方面的措施,防止個人信息的泄漏、損毀、丟失、篡改。
數(shù)據(jù)安全性處理應(yīng)基于研究所涉及的各種數(shù)據(jù)的類型、數(shù)量、性質(zhì)和內(nèi)容,尤其對于個人敏感信息,建立數(shù)據(jù)治理各環(huán)節(jié)的數(shù)據(jù)加密技術(shù)要求、風(fēng)險評估和應(yīng)急處置操作規(guī)程,并開展安全措施有效性審計。
(二)數(shù)據(jù)提取
根據(jù)源數(shù)據(jù)的存儲格式、是否為電子數(shù)據(jù)、是否包含非結(jié)構(gòu)化數(shù)據(jù)等因素選擇合適的方式進行數(shù)據(jù)提取,在數(shù)據(jù)提取時均應(yīng)遵守以下原則:
數(shù)據(jù)提取的方法應(yīng)通過驗證,以保障提取到的數(shù)據(jù)符合研究方案的要求。數(shù)據(jù)提取應(yīng)確保提取到的原始數(shù)據(jù)與源數(shù)據(jù)的一致性,應(yīng)對提取到的原始數(shù)據(jù)與源數(shù)據(jù)進行時間戳管理。
使用與源數(shù)據(jù)系統(tǒng)可互操作或集成的數(shù)據(jù)提取工具可以減少數(shù)據(jù)轉(zhuǎn)錄中的錯誤,從而提高數(shù)據(jù)準(zhǔn)確性以及臨床研究中數(shù)據(jù)采集的質(zhì)量和效率。
(三)數(shù)據(jù)清洗
數(shù)據(jù)清洗是指對提取的原始數(shù)據(jù)進行重復(fù)或冗余數(shù)據(jù)的去除、變量值邏輯核查和異常值的處理,以及數(shù)據(jù)缺失的處理。需要注意,在修正數(shù)據(jù)時如果無法追溯到主要研究者或源數(shù)據(jù)負責(zé)方簽字確認,數(shù)據(jù)不應(yīng)做修改,以保證數(shù)據(jù)的真實性。
首先在保證數(shù)據(jù)完整性的前提下去除重復(fù)數(shù)據(jù)及不相關(guān)數(shù)據(jù)。在不同數(shù)據(jù)源合并過程中,可能產(chǎn)生重復(fù)數(shù)據(jù),需要去除。同時由于數(shù)據(jù)源與通用數(shù)據(jù)模型映射關(guān)系的不準(zhǔn)確,可能會采集到與研究目標(biāo)不相關(guān)的數(shù)據(jù),從數(shù)據(jù)集中刪除不需要的觀測值可以減少不必要的工作。
然后進行邏輯核查和異常數(shù)據(jù)處理。通過邏輯核查可以發(fā)現(xiàn)原始數(shù)據(jù)或者提取數(shù)據(jù)時產(chǎn)生的錯誤,例如出院時間早于入院時間,出生年月按年齡推算不符,實驗室檢查結(jié)果不符合實際,定性判斷結(jié)果與方案中定義的判斷標(biāo)準(zhǔn)不一致等。對異常數(shù)據(jù)的處理要非常謹慎,避免由此產(chǎn)生的偏倚。對于發(fā)現(xiàn)的錯誤和異常數(shù)據(jù)應(yīng)通過進一步核實才能更改數(shù)據(jù),數(shù)據(jù)的更改應(yīng)保留記錄。
最后在統(tǒng)計分析時對數(shù)據(jù)缺失進行處理,對于不同研究,數(shù)據(jù)的缺失程度、缺失原因和變量值的缺失機制不盡相同。如果涉及缺失數(shù)據(jù)的填補問題,應(yīng)根據(jù)缺失機制的合理假設(shè)采用恰當(dāng)?shù)奶钛a方法。
(四)數(shù)據(jù)轉(zhuǎn)化
數(shù)據(jù)轉(zhuǎn)化是將經(jīng)過數(shù)據(jù)清洗后原始數(shù)據(jù)的數(shù)據(jù)格式標(biāo)準(zhǔn)、醫(yī)學(xué)術(shù)語、編碼標(biāo)準(zhǔn)、衍生變量計算,按照分析數(shù)據(jù)庫中對應(yīng)標(biāo)準(zhǔn)進行統(tǒng)一轉(zhuǎn)化為適用真實世界數(shù)據(jù)的過程。
對于自由文本數(shù)據(jù)的轉(zhuǎn)化可使用可靠的自然語言處理算法,在保障數(shù)據(jù)轉(zhuǎn)化準(zhǔn)確、可溯源的前提下,提高轉(zhuǎn)化效率。
在進行衍生變量計算時,應(yīng)明確用于計算的原始數(shù)據(jù)變量及變量值、計算方法及衍生變量的定義,并進行時間戳管理,以保障數(shù)據(jù)的準(zhǔn)確性和可追溯性。
(五)數(shù)據(jù)傳輸和存儲
真實世界數(shù)據(jù)的傳輸和存儲應(yīng)當(dāng)基于可信的網(wǎng)絡(luò)安全環(huán)境,在數(shù)據(jù)收集、處理、分析至銷毀的全生命周期予以控制。在數(shù)據(jù)傳輸和存儲過程中都應(yīng)有加密保護。此外,應(yīng)建立操作設(shè)置審批流程、角色權(quán)限控制和最小授權(quán)的訪問控制策略,鼓勵建立自動化審計系統(tǒng),監(jiān)測記錄數(shù)據(jù)的處理和訪問活動。
(六)數(shù)據(jù)質(zhì)量控制
數(shù)據(jù)質(zhì)量控制是確保研究數(shù)據(jù)完整性、準(zhǔn)確性和透明性的關(guān)鍵。數(shù)據(jù)質(zhì)量控制需要建立完善的真實世界數(shù)據(jù)質(zhì)量管理體系和標(biāo)準(zhǔn)操作規(guī)程,建議原則包括:
1.確保源數(shù)據(jù)的準(zhǔn)確性和真實性
如電子病歷作為關(guān)鍵數(shù)據(jù)源,應(yīng)有病歷質(zhì)控標(biāo)準(zhǔn)以滿足分析要求。來源于門診的疾病描述、診斷及其用藥信息需要有相關(guān)證據(jù)鏈佐證。對于錄入過程中的任何修改,需要有負責(zé)人的確認和簽名,并提供修改原因,確保留下完整的稽查軌跡。
2.在數(shù)據(jù)提取時充分考慮數(shù)據(jù)完整性問題
評估和確立提取字段,制定相應(yīng)的核查規(guī)則和數(shù)據(jù)庫架構(gòu)。
3.制定完善的數(shù)據(jù)質(zhì)量管理計劃
制定系統(tǒng)質(zhì)控和人工質(zhì)控計劃,確保數(shù)據(jù)的準(zhǔn)確性和完整性。對于關(guān)鍵變量,應(yīng)進行全面的核查和源文件調(diào)閱;其它變量可根據(jù)實際情況抽樣核查,例如,對于人口學(xué)信息、數(shù)值型變量閾值、編碼映射關(guān)系等,可按一定比例抽樣,核查其準(zhǔn)確性與合理性。
(七)通用數(shù)據(jù)模型
通用數(shù)據(jù)模型是多學(xué)科合作模式下對多源異構(gòu)數(shù)據(jù)進行快速集中和標(biāo)準(zhǔn)化處理的數(shù)據(jù)模型,其主要功能是將不同標(biāo)準(zhǔn)的源數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的結(jié)構(gòu)、格式和術(shù)語,以便跨數(shù)據(jù)庫/數(shù)據(jù)集進行數(shù)據(jù)整合。
由于多源數(shù)據(jù)的結(jié)構(gòu)和類型的復(fù)雜性、樣本規(guī)模和標(biāo)準(zhǔn)的差異性,在將源數(shù)據(jù)轉(zhuǎn)換為通用數(shù)據(jù)模型的整體過程中,需要對源數(shù)據(jù)進行提取、轉(zhuǎn)換、加載,應(yīng)確保源數(shù)據(jù)在語法和語義上與目標(biāo)分析數(shù)據(jù)庫的結(jié)構(gòu)和術(shù)語一致,見圖2。
圖2異源數(shù)據(jù)模型向通用數(shù)據(jù)模型轉(zhuǎn)化的示意圖
理想的通用數(shù)據(jù)模型應(yīng)遵循以下原則:
1.通用數(shù)據(jù)模型可以定義為一種數(shù)據(jù)治理機制,通過該機制可以將源數(shù)據(jù)標(biāo)準(zhǔn)化為通用結(jié)構(gòu)、格式和術(shù)語,從而允許跨多個數(shù)據(jù)庫/數(shù)據(jù)集進行數(shù)據(jù)整合。通用數(shù)據(jù)模型應(yīng)具有訪問源數(shù)據(jù)的能力,是可動態(tài)擴展和持續(xù)改進的數(shù)據(jù)模型,并有版本控制;
2.通用數(shù)據(jù)模型中變量的定義、測量、合并、記錄及其相應(yīng)的驗證應(yīng)保持透明,多個數(shù)據(jù)庫的數(shù)據(jù)轉(zhuǎn)換應(yīng)有清晰一致的規(guī)則;
3.安全性和有效性相關(guān)的常用變量或概念都應(yīng)映射到通用數(shù)據(jù)模型,以適用于不同臨床研究問題,并可通過公認或已知的研究結(jié)果進行比對。
(八)真實世界數(shù)據(jù)治理計劃書
真實世界數(shù)據(jù)治理計劃書應(yīng)事先制定,與整個項目研究計劃同步。如果治理計劃書在研究進行過程中需要修訂,應(yīng)與審評機構(gòu)溝通,同時遞交更新后的治理計劃書。計劃書中應(yīng)說明使用真實世界數(shù)據(jù)用于監(jiān)管決策的目的、使用真實世界數(shù)據(jù)的研究設(shè)計,還應(yīng)對真實世界數(shù)據(jù)源數(shù)據(jù)進行說明,包括但不限于:真實世界數(shù)據(jù)源數(shù)據(jù)/源文件的類型,例如衛(wèi)生信息系統(tǒng)數(shù)據(jù)、疾病登記研究數(shù)據(jù)、醫(yī)保數(shù)據(jù)等;真實世界數(shù)據(jù)的源數(shù)據(jù)/源文件,適當(dāng)評價其既往應(yīng)用情況,說明采用的理由;真實世界數(shù)據(jù)的治理,即由真實世界數(shù)據(jù)數(shù)據(jù)來源到分析數(shù)據(jù)庫的治理過程;采用的數(shù)據(jù)模型和數(shù)據(jù)標(biāo)準(zhǔn);缺失數(shù)據(jù)的處理方法;減少或控制使用真實世界數(shù)據(jù)帶來的潛在偏倚所采取的措施;質(zhì)量控制和質(zhì)量保證;真實世界數(shù)據(jù)的適用性評估。
五、 真實世界數(shù)據(jù)的合規(guī)性、安全性與質(zhì)量管理體系
(一)數(shù)據(jù)合規(guī)性
真實世界數(shù)據(jù)來源于患者個人診療等多種途徑的數(shù)據(jù),數(shù)據(jù)的收集、處理與使用等會涉及倫理及患者隱私問題。為充分保護患者的安全和權(quán)益,獲取和使用真實世界數(shù)據(jù)以開展真實世界研究,須通過倫理委員會的審查批準(zhǔn)。參與真實世界數(shù)據(jù)治理的相關(guān)人員需嚴(yán)格遵守相關(guān)法律、法規(guī)的要求,申辦者應(yīng)嚴(yán)格執(zhí)行,盡保護和管理義務(wù)。
(二)數(shù)據(jù)安全管理
應(yīng)依照國家法律法規(guī)、行業(yè)監(jiān)管要求等做好數(shù)據(jù)安全管理工作,對承載健康醫(yī)療數(shù)據(jù)的信息系統(tǒng)和網(wǎng)絡(luò)設(shè)施以及云平臺等進行必要的安全保護。數(shù)據(jù)安全保護范圍應(yīng)涵蓋包括數(shù)據(jù)收集、數(shù)據(jù)提取、數(shù)據(jù)傳輸、數(shù)據(jù)存儲、數(shù)據(jù)交換、數(shù)據(jù)銷毀等在內(nèi)的各個生命周期。采用加密技術(shù)保證數(shù)據(jù)在收集、提取、傳輸和存儲過程中的完整性、保密性、可追溯性,使用介質(zhì)傳輸?shù)?,?yīng)對介質(zhì)實施管控。對不同介質(zhì)的數(shù)據(jù)形式采用不同的保護措施,并建立相對應(yīng)的訪問控制機制,對訪問記錄進行審核、登記、歸檔和審計。
數(shù)據(jù)審計及相關(guān)操作規(guī)程為數(shù)據(jù)的收集、提取、傳輸、維護、存儲、共享、使用等提供記錄和依據(jù),應(yīng)包括人員審計、管理審計、技術(shù)審計,制定和部署醫(yī)療信息系統(tǒng)活動審計政策和適當(dāng)?shù)臉?biāo)準(zhǔn)操作流程。審計的內(nèi)容應(yīng)包括數(shù)據(jù)的任何狀態(tài)的任何操作,包括登錄、創(chuàng)建、修改和刪除記錄的行為,都應(yīng)自動生成帶有時間標(biāo)記的審計記錄,包括但不限于授權(quán)信息、操作時間、操作原因、操作內(nèi)容、操作人及簽名等信息,并可供審計。審計記錄應(yīng)被安全存儲并建立訪問控制策略。
(三)質(zhì)量管理體系
應(yīng)建立完整的質(zhì)量管理體系,以規(guī)范真實世界數(shù)據(jù)的處理流程,并在實際工作中持續(xù)優(yōu)化、完善?;举|(zhì)量要素應(yīng)覆蓋:確保真實世界數(shù)據(jù)的質(zhì)量,應(yīng)建立覆蓋真實世界數(shù)據(jù)全生命周期管理的操作流程;計算機化系統(tǒng)功能應(yīng)滿足真實世界數(shù)據(jù)的管理需求,符合相關(guān)法規(guī)對計算機化系統(tǒng)的相關(guān)要求;建立完善的人員管理制度,數(shù)據(jù)收集、治理、分析人員應(yīng)獲得相應(yīng)的培訓(xùn),符合職責(zé)能力要求,并對人員的權(quán)限進行標(biāo)準(zhǔn)化管理;建立從數(shù)據(jù)收集至數(shù)據(jù)遞交各環(huán)節(jié)的風(fēng)險管理流程;制定標(biāo)準(zhǔn)的信息與文檔管理規(guī)范(紙質(zhì)、電子介質(zhì)),確保真實世界數(shù)據(jù)處理流程記錄完整、準(zhǔn)確、透明,保護數(shù)據(jù)的安全性與合規(guī)性。
六、 與監(jiān)管機構(gòu)的溝通
為保證真實世界數(shù)據(jù)的質(zhì)量符合監(jiān)管要求,鼓勵申請人與監(jiān)管機構(gòu)及時溝通交流。在真實世界研究正式開始前,基于整體研發(fā)策略和具體研究方案等,就真實世界數(shù)據(jù)是否支持產(chǎn)生真實世界證據(jù)進行交流,包括真實世界數(shù)據(jù)的可及性、樣本量是否足夠大、數(shù)據(jù)治理計劃是否合理可行、數(shù)據(jù)質(zhì)量可否得到保障等。在研究進行中,如果根據(jù)研究實施中的變化情況對數(shù)據(jù)治理計劃進行調(diào)整,申辦者需衡量數(shù)據(jù)治理計劃調(diào)整對試驗?zāi)繕?biāo)的潛在影響,向監(jiān)管機構(gòu)說明調(diào)整的充分理由,并征得其同意,同時遞交更新的研究方案和數(shù)據(jù)治理計劃書。在研究完成后和遞交資料前,申辦者可與監(jiān)管機構(gòu)咨詢遞交資料和數(shù)據(jù)庫進行溝通。
參考文獻
[1]蔡婷,詹思延.加快我國疫苗安全主動監(jiān)測系統(tǒng)建設(shè)的思考[J].中華預(yù)防醫(yī)學(xué)雜志.2019,53(7):664-667.
[2]國家衛(wèi)生健康委,國家藥品監(jiān)督管理局.《藥物臨床試驗質(zhì)量管理規(guī)范》.2020.07.01.
[3]國家藥品監(jiān)督管理局藥品審評中心.《臨床試驗數(shù)據(jù)管理工作技術(shù)指南》.2016.07.27.
[4]國家藥品監(jiān)督管理局.《真實世界證據(jù)支持藥物研發(fā)與審評的指導(dǎo)原則(試行)》.2020.01.07.
[5]侯永芳,宋海波,劉紅亮,等.基于中國醫(yī)院藥物警戒系統(tǒng)開展主動監(jiān)測的實踐與探討[J].中國藥物警戒.2019,16(4):212-214.
[6]周莉,歐陽文偉,李庚,等.中國登記研究的現(xiàn)狀分析[J]中國循證醫(yī)學(xué)雜志.2019,19(6):702-707.
[7]Berger M,Daniel G,FrankK,et al.A framework for regulatory use of real world evidence.https://healthpolicy.duke.edu/sites/default/files/atoms/files/rwe_white_paper_2017.09.06.pdf.
[8]Booth CM,Karim S,Mackillop WJ.Real-world data:towards achieving the achievable in cancer care[J].Nat Rev Clin Oncol.2019,16(5):312-325.
[9]Duke-Margolis Center for Health Policy.Characterizing RWD Quality and Relevancy for Regulatory Purposes.https://healthpolicy.duke.edu/publications.
[10]Duke-Margolis Center for Health Policy.Determining Real-World Data’s Fitness for Use and the Role of Reliability.https://healthpolicy.duke.edu/publications.
[11]EMA.Reflection paper on expectations for electronic source data and data transcribed to electronic data collection tools in clinical trials .https://www.ema.europa.eu/en/documents/regulatory-procedural guideline/reflection-paper-expectations-electronic-source-data-data-transcribed-electronic-data-collection_en.pdf.
[12]EMA.ACommon Data Model for Europe–Why?Which?How?https://www.ema.europa.eu/en/documents/report/common-data-model-europe-why-which-how-workshop-report_en.pdf.
[13]Khozin S,Abernethy AP,Nussbaum NC,etal.Characteristics of real-world metastatic non-small cell lung cancer patients treated with nivolumab and pembrolizumab during the year following approval[J].Oncologist.2018,23:328–336.
[14]OHDSI–Observational Health Data Sciences and Informatics,https://www.ohdsi.org.
[15]Ong TC, Kahn MG,KwanBM,et al. Dynamic ETL:a hybrid approach for health data extraction transformation and loading[J].BMCMedical Informatics and Decision Making2017,17(1):134.
附錄1:
詞匯表
電子病歷(ElectronicMedicalRecord,EMR):由醫(yī)療機構(gòu)中授權(quán)的臨床專業(yè)人員創(chuàng)建、收集、管理和訪問的個體患者的健康相關(guān)信息電子記錄。
電子健康檔案(ElectronicHealthRecord,EHR):符合國家認可使用的互操作性標(biāo)準(zhǔn),并能夠由多個醫(yī)療機構(gòu)中授權(quán)的
臨床專業(yè)人員創(chuàng)建、管理和咨詢的針對個體患者的健康相關(guān)信息電子記錄。
觀察性研究(ObservationalStudy):根據(jù)特定研究問題,不施加主動干預(yù)的、以自然人群或臨床人群為對象的、探索暴露/治療與結(jié)局因果關(guān)系的研究。
患者報告結(jié)局(Patient-ReportedOutcome,PRO):是一種來自患者自身測量與評價疾病結(jié)局的指標(biāo),包括癥狀、生理、心理、醫(yī)療服務(wù)滿意度等。其記錄有紙質(zhì)和電子兩種方式,后者稱為電子患者報告結(jié)局(ePRO)。
邏輯核查(EditCheck):對輸入計算機系統(tǒng)的臨床研究數(shù)據(jù)的有效性的檢查,主要評價輸入數(shù)據(jù)與其預(yù)期的數(shù)值邏輯、數(shù)值范圍或數(shù)值屬性等方面是否存在邏輯性錯誤。
數(shù)據(jù)標(biāo)準(zhǔn)(DataStandard):是關(guān)于如何在計算機系統(tǒng)之間構(gòu)建、定義、格式化或交換特定類型數(shù)據(jù)的一系列規(guī)則。數(shù)據(jù)標(biāo)準(zhǔn)可使遞交的資料具有可預(yù)測性和一致性,且具有信息技術(shù)系統(tǒng)或科學(xué)工具可以使用的形式。
數(shù)據(jù)清洗(DataCleaning):數(shù)據(jù)清洗旨在識別和糾正數(shù)據(jù)中的噪聲,將噪聲對數(shù)據(jù)分析結(jié)果的影響降至最低。數(shù)據(jù)中的噪聲主要包括不完整的數(shù)據(jù)、冗余的數(shù)據(jù)、沖突的數(shù)據(jù)和錯誤的數(shù)據(jù)等。
數(shù)據(jù)融合(DataLinkage):將多來源的數(shù)據(jù)和信息加以合并、關(guān)聯(lián)及組合,形成統(tǒng)一的數(shù)據(jù)集。
數(shù)據(jù)元素(DataElement):臨床研究中記錄的受試者的單一觀察值,例如,出生日期、白細胞計數(shù)、疼痛嚴(yán)重程度,以及其它臨床觀察值。
數(shù)據(jù)治理(DataCuration):針對特定臨床研究問題,為達到適用于統(tǒng)計分析而對原始數(shù)據(jù)所進行的治理,其內(nèi)容至少包括數(shù)據(jù)提?。ê鄠€數(shù)據(jù)源)、數(shù)據(jù)安全性處理、數(shù)據(jù)清洗(邏輯核查及異常數(shù)據(jù)處理、數(shù)據(jù)完整性處理)、數(shù)據(jù)轉(zhuǎn)化(通用數(shù)據(jù)模型、歸一化、自然語言處理、醫(yī)學(xué)編碼、衍生變量計算)、數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)傳輸和存儲等若干環(huán)節(jié)。
通用數(shù)據(jù)模型(CommonDataModel,CDM):是多學(xué)科合作模式下對多源異構(gòu)數(shù)據(jù)進行快速集中和標(biāo)準(zhǔn)化處理的數(shù)據(jù)模型,其主要功能是將不同數(shù)據(jù)標(biāo)準(zhǔn)的源數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的結(jié)構(gòu)、格式和術(shù)語,以便跨數(shù)據(jù)庫/數(shù)據(jù)集進行數(shù)據(jù)整合。
源數(shù)據(jù)(SourceData):臨床研究中記錄的臨床癥狀、觀測值和用于重建和評估該研究的其它活動的原始記錄和核證副本上的所有信息。源數(shù)據(jù)包含在源文件中(包括原始記錄或其有效副本)。
真實世界數(shù)據(jù)(Real-WorldData,RWD):來源于日常所收集的各種與患者健康狀況和/或診療及保健有關(guān)的數(shù)據(jù)。并非所有的真實世界數(shù)據(jù)經(jīng)分析后就能成為真實世界證據(jù),只有滿足適用性的真實世界數(shù)據(jù)才有可能產(chǎn)生真實世界證據(jù)。
真實世界研究(Real-WorldResearch/Study,RWR/RWS):針對臨床研究問題,在真實世界環(huán)境下收集與研究對象健康狀況和/或診療及保健有關(guān)的數(shù)據(jù)(真實世界數(shù)據(jù))或基于這些數(shù)據(jù)衍生的匯總數(shù)據(jù),通過分析,獲得藥物的使用價值及潛在獲益-風(fēng)險的臨床證據(jù)(真實世界證據(jù))的研究過程。
真實世界證據(jù)(Real-WorldEvidence,RWE):通過對適用的真實世界數(shù)據(jù)進行恰當(dāng)和充分的分析所獲得的關(guān)于藥物的使用情況和潛在獲益-風(fēng)險的臨床證據(jù)。
附錄2:
中英文詞匯對照表
中文 | 英文 |
預(yù)防接種不良事件 | AdverseEventsFollowing |
通用數(shù)據(jù)模型 | CommonDataModel,CDM |
病例報告表 | CaseReportForm,CRF |
數(shù)據(jù)治理 | DataCuration |
病例登記 | PatientRegistry |
電子數(shù)據(jù)采集 | ElectronicDataCapture,EDC |
電子病歷 | ElectronicMedicalRecord,EMR |
電子健康檔案 | ElectronicHealthRecord,EHR |
電子患者報告結(jié)局 | electronicPatient-ReportedOutcome, |
觀察性研究 | ObservationalStudy |
患者報告結(jié)局 | PatientReportedOutcome,PRO |
結(jié)局變量 | OutcomeVariable |
可追溯性 | Traceability |
邏輯核查 | EditCheck |
數(shù)據(jù)標(biāo)準(zhǔn) | DataStandard |
數(shù)據(jù)清洗 | DataCleaning |
中文 | 英文 |
數(shù)據(jù)元素 | DataElement |
數(shù)據(jù)治理 | DataCuration |
通用數(shù)據(jù)模型 | CommonDataModel,CDM |
醫(yī)院信息系統(tǒng) | HospitalInformationSystem,HIS |
衍生變量 | DerivedVariable |
源數(shù)據(jù) | SourceData |
真實世界數(shù)據(jù) | RealWorldData,RWD |
真實世界研究 | RealWorldResearch/Study, |
真實世界證據(jù) | RealWorldEvidence,RWE |
附件:《用于產(chǎn)生真實世界證據(jù)的真實世界數(shù)據(jù)指導(dǎo)原則(試行)》.pdf