7 자료 처리

7.1 자료 정리 및 수정

실시간 자료 정리를 통해 임상 종료 시까지 집단 약동학 자료가 보관되면서 발생할 수 있는 일반적인 문제들을 방지할 수 있고 시험기관의 임상시험 계획서 준수 정도를 지 속적으로 확인할 수 있으며, 연구과정 및 원칙상의 문제점에 대해서는 교정할 수 있는

기회를 가질 수 있다. 약동학 자료의 평가는 안전성 자료 모니터링 위원회(safety data monitoring board)에서 약물의 노출에 따른 안전성을 평가할 수 있도록 하며 약물 간 상호작용에 대한 이해를 높일 수도 있다. 실시간 자료 정리는 임상시험의 약동학적 목적에 부합하도록 농도-시간 자료, 약물 투 약력, 공변량 자료를 수정할 수 있는 기회를 제공하고 모형을 만드는 과정을 용이하게 한다. 또한 실시간 자료 정리를 실시하면 실제적인 분석 및 최종 분석을 위한 소프트 웨어 사용 계획을 발전시켜, 전반적인 자료 분석 시간을 단축시킬 수도 있다. 추가 집단 약동학 시험을 위한 실시간 자료 분석이 시행될 경우, 눈가림이 유지될 수 있도록 적 절한 절차가 필요하다. 자료 편집은 자료의 오류를 찾고 이를 교정하는 일련의 과정을 의미한다. 이러한 과정은 연구 개시 전에 계획되고 연구 계획서에 기술되어야 한다. 일부 자료의 경우(예를 들면, 시료채취 시점의 누락, 약물농도와 관련 없는 투약정보, 투약정보가 없는 약물농도 등)는 분석에 포함되지 않을 수 있는데, 각 자료의 사용 여부에 대한 기준은 사전에 연구 계획 서에 기술되어야 한다. 7.2. 결측치(Missing data)의 처리 집단 분석을 위한 자료 정리 후에는, 누락된 공변량 자료와 관련된 쟁점이 기술되어야 한다. 성실하게 연구를 수행하였으나 결측치가 발생하였고 결측치가 발생한 사유에 대한 충 분한 기록을 남겼다면, 결측치가 발생했다는 자체만으로 결과가 무효화되는 것은 아니다. 그러나 결측치는 잠재적으로 편향(bias)의 가능성을 시사한다. 따라서 자료의 수집 및 관리에 있어서, 계획서가 요구하는 사항을 만족시키기 위해 항상 노력하여야 하며 결 측치 발생 빈도를 최소화시켜야 한다. 많은 대상자에서 공변량에 대한 자료가 풍부한 반면 몇몇에서 공변량 자료 중 일부가 누락되어 있을 수 있다. 이런 경우, 공변량 자료 누락이 있는 모든 대상자를 분석에서 제외하게 되면 표본의 크기가 크게 감소하게 된다. 상당한 주의가 필요하기는 하나, 특정 상황에서는 누락된 공변량을 적절한 값으로 대체(imputation)해 주는 것이 해당 대상자를 자료에서 제외하는 것보다 더 나을 수도 있다. 결측치를 중앙값, 평균, 최빈값 등을 사 용하여 대체하는 일부 단순한 방법은 예측치들이 서로 상관관계가 있는 경우, 편향 (bias)된 결과를 제시하고 비효율적일 수 있다. 이보다 나은 방법은 모든 다른 예측치 를 통하여 각각의 예측치를 추정하는 최대우도법을 사용하는 것이다. 고려할 수 있는 또 다른 방법은 다수 대체법(multiple imputation)으로서, 여러 세트의 대체된 자료를 마치 실제 관측된 자료인 것처럼 분석하여, 정밀도의 추정치로부터 낙

관적인 편향(bias)을 제거하는 방법이다. 그러나 이와 관련된 대체 기법의 수행에 대해 서는 아직 충분히 연구되거나 경험이 축적되어 있지 않다. 게다가, 누락된 공변량을 대 체하는 경우, 모형에 가정이 하나 더 추가되게 된다. 따라서 누락 자료를 대체하는 경 우에는 그 대체 방법, 근거 및 가정이 자세하게 기술되어야 한다. 그리고 특히 누락된 자료가 상당한 경우, 누락된 자료 대체 방법에 따른 분석 결과의 민감도에 대한 평가가 이루어져야 한다. 간혹, 장기간 수행하게 되는 장기 집단 약동학 연구(Longitudinal Population PK)에서 약물농도 자료가 누락되어 문제가 되는 경우가 있다. 자료 누락에 일정한 패턴이 있는 경우, 이를 해결하기 위한 적절한 통계 기법이 적용되어야 한다. 그리고 적용된 통계 기법은 집단 약동학 분석 보고서에 기술되어야 한다. 그러나 농도 자료가 무작위적으로 누락된 경우에는 누락된 자료를 단순히 생략하고 관측된 값만으로 분석을 진행할 수도 있다.

7.2 이상치(Outlier)

이상치(outlier)의 통계적 정의는 다소 임의적이다. 어떤 측정값이나 결과값을 이상치라고 하는 사유는 통계적으로 설명되어야 하며, 가능하다면 계획서에 미리 정의되어야 한다. 생리적 이유나 시험과 관련된 사례 발생으로 자료를 사용할 수 없는 경우에는 결과보 고서에 그 내용을 기술하여야 한다. 이상치는 개체간 변이에 의한 것인지 개체내 변이에 의한 것인지 구분되어야 한다. 집단 약동학은 일반적으로 탐색적인 성격을 가지기 때문에 연구 계획서에 이상치의 처리 방 법에 대해 모두 사전에 규정하지는 못했을 수도 있다. 이상치를 제외한 자료세트로 모형을 세워, 최종 모형으로 이상치를 포함한 전체 자료 세트를 재분석한다. 이상치를 제외한 자료와 전체 자료 분석 결과 차이를 비교해 볼 수 있다. 추정값에 불가피한 불균형의 영향을 주는 경우가 아니라면, 최소 자승법이나 정규분포에 근거했을 때 극단적인 이상치를 분석에 포함하는 것은 바람직하지 않다. 대부분의 생 물학적 현상에서 이상치는 정규 분포보다 훨씬 빈번히 발생한다는 것은 널리 알려져 있다. 예로서, 생물학적 분포는 두꺼운 꼬리 분포를 보인다(heavy tailed). 최근 고안된 몇몇의 완건한(robust) 집단 분석 방법을 이용하면, 이러한 과도한 가중치를 주지 않고 이상치를 분석에 포함시킬 수 있다. 모든 자료가 확인 가능하도록 이상치는 보고서의 부록에 따로 명시되어야 한다.

7.3 자료 형태

집단 약동학 분석에 사용되는 대부분의 자료는 실험자료와 관찰자료로 특징되는 두 가지 극단적인 자료 형태의 중간 형태를 갖게 된다. 실험자료는 약물투여와 광범위한 채혈 등이 통제되는 전형적인 약동학 연구에서 생성된 것이다. 관찰자료는 대부분의 경우, 약동학이 아닌 다른 목적으로 계획되고 수행된 연 구에서 추가적으로 얻어진 약동학 자료이다. 이러한 관찰자료는 최소한으로 통제되며 설계상 제한점들이 있게 된다. 예를 들어 대상자별로 약물의 투여가 다를 수 있으며, 수집되는 약동학 자료의 양이 대상자별로 다를 수 있다. 투약 후 각 대상자에서 시료채취 시점이 다르며, 각 대상자별 시료의 개수도 1~6개로 적은 편이다. 7.5. 자료 완결성(Data Integrity) 및 소프트웨어(Computer Software) 자료 관리는 사전에 수립되어 있는 표준작업지침에 따라 수행되어야 한다. 자료 분석 결과의 타당성은 자료 관리(입력, 보관, 검증 교정, 검색)에 사용된 소프트웨어와 분석 방법의 품질과 그 타당성, 그리고 통계절차에 의해 좌우된다. 자료 관리에 사용되는 컴 퓨터 소프트웨어의 이름과 버전, 실행환경과 평가 절차는 문서화되어야 한다. 집단 약 동학 분석에 사용되는 소프트웨어가 적절하게 제공되고 관리되는 것은 매우 중요하다.