최근 생성형 인공지능 기술의 비약적인 발전은 의료계 전반에 패러다임의 변화를 예고하고 있다. 특히 영상의학 분야에서는 단순히 병변을 검출하는 단계를 넘어, 판독 결과를 자연어 형태의 서술형 보고서로 자동 작성해 주는 기술이 주목받고 있다. 흉부 X선은 검사 건수가 압도적으로 많고 영상 데이터가 풍부하여 이러한 생성형 AI 모델의 일차적인 적용 대상이 되고 있다. 하지만 기술적 기대감에 비해 실제 임상 현장에서의 정확도와 안전성, 그리고 영상의학 전문의의 역할을 어떻게 설정할지에 대한 구체적인 가이드라인은 부족한 실정이다.
이에 대한흉부영상의학회는 20명의 흉부 영상의학 전문의들이 참여한 델파이 설문 조사를 바탕으로, AI 기반 흉부 X선 판독문 작성 도구의 임상적 활용에 대한 공식 입장문을 국제 학술지 KJR (Korean Journal of Radiology)에 발표하였다.1
이번 연구에서 20명의 전문가들은 'KARA-CXR(버전 1.0.0.3, 현 AIRead-CXR, KakaoBrain, 서울, 대한민국)' 모델을 활용하여 각자가 근무하는 의료 기관에 건강검진, 입원, 응급실, 중환자실, 호흡기 외래, 비호흡기 외래의 6개 임상 환경에서 추출된 60건의 흉부 X선 증례를 직접 평가하였다. 설문 답변은 전문가들의 주관적 평가를 바탕으로 작성되었다.
질문지는 다음의 세 가지 영역을 다루었다.
설문 조사 결과, AI 도구의 성능은 임상 맥락에 따라 매우 큰 차이를 보였다.
이러한 결과는 현재의 생성형 AI가 단순한 정상 소견 판별에는 유용할 수 있으나, 다발성 병변이나 정교한 감별 진단이 필요한 고난도 사례에서는 아직 독자적인 사용이 불가능함을 시사한다.
설문에 참여한 전문가들은 대부분의 항목에서 '중립적' 입장을 보였다. 학회가 제시한 주요 권고 사항은 다음과 같다.
| 주요 질문 | 권고문 |
|---|---|
| 1. AI 기반 흉부 X선 판독문 작성 도구의 현재 성능은 어떠한가? | 패널은 해당 도구가 건강검진 환경에서 신뢰할 수 있는 흉부 X선 해석을 생성한다는 점에 동의함 |
| 패널은 건강검진 이외의 임상 환경에서 주요 이상 소견을 탐지하는 도구의 신뢰성에 대해 중립적인 입장임 | |
| 패널은 건강검진 이외의 임상 환경에서 생성된 보고서의 가독성과 명확성에 대해 중립적인 입장임 | |
| 2. AI 기반 흉부 X선 판독문 작성 도구가 일상적인 임상 진료에 적합한가? | 패널은 영상의학과 의사가 없는 입원, 중환자실 또는 외래 환경에서의 단독 사용에 반대함 |
| 패널은 상주 영상의학과 의사가 없는 건강검진 및 비호흡기 외래 환경에서의 제한적 사용에 대해 중립적인 입장을 유지함 | |
| 패널은 영상의학과 의사가 각 AI 생성 초안을 확인하는 경우, 건강검진 환경에서의 사용을 지지함 | |
| 패널은 건강검진 환경이나 중환자실에서 검증되지 않은 AI 생성 보고서를 비영상의학과 의사와 공유하는 것에 대해 반대함 | |
| 3. AI 기반 흉부 X선 판독문 작성 도구가 영상의학과 의사에게 도움이 될 것인가? | 패널은 해당 도구가 영상의학과 의사의 판독 정확도, 업무 효율성 또는 업무량을 개선하는지 여부에 대해 중립적인 입장을 유지함 |
이 델파이 설문조사의 결과는 아래와 같은 점을 시사한다.
영상의학과 의사의 부족 현상과 업무 과부하를 해결하기 위해 생성형 AI의 도입은 매력적인 대안이 될 수 있다.4 하지만 이번 연구 결과가 보여주듯, AI는 아직 '완성된 도구'가 아닌 영상의학과 의사의 업무를 보조하는 '미완의 보조자' 단계에 있다.
향후 더 대규모의 객관적인 임상 데이터를 통한 검증과 기술적 고도화가 이루어져야 하며, 무엇보다 환자의 안전을 최우선으로 하는 신뢰할 수 있는 AI 활용 가이드라인의 정착이 중요하다. 마지막으로 이 공식 입장문은 현재의 상황을 대변하는 것이며 AI 성능과 관련 규제 또한 지속적으로 발전하고 있는 상황에서 향후 전문가들은 좀더 긍정적인 의견을 표출할 가능성도 높다. 대한흉부영상의학회는 기술 발전에 발맞추어 이러한 가이드라인을 지속적으로 업데이트하며 책임감 있는 AI 도입을 선도할 것이다.