Skip Navigation
Skip to contents

대한폐암학회 웹진
Vol.41 January 2026

대한폐암학회 지난 호 웹진 보기

메뉴 닫기

특집

인공 지능 기반 흉부 X선 판독문 생성:
전문가 설문 조사를 통한 대한흉부영상의학회의 2025년 공식 입장문

정원기 (국립암센터 영상의학과)

최근 생성형 인공지능 기술의 비약적인 발전은 의료계 전반에 패러다임의 변화를 예고하고 있다. 특히 영상의학 분야에서는 단순히 병변을 검출하는 단계를 넘어, 판독 결과를 자연어 형태의 서술형 보고서로 자동 작성해 주는 기술이 주목받고 있다. 흉부 X선은 검사 건수가 압도적으로 많고 영상 데이터가 풍부하여 이러한 생성형 AI 모델의 일차적인 적용 대상이 되고 있다. 하지만 기술적 기대감에 비해 실제 임상 현장에서의 정확도와 안전성, 그리고 영상의학 전문의의 역할을 어떻게 설정할지에 대한 구체적인 가이드라인은 부족한 실정이다.

이에 대한흉부영상의학회는 20명의 흉부 영상의학 전문의들이 참여한 델파이 설문 조사를 바탕으로, AI 기반 흉부 X선 판독문 작성 도구의 임상적 활용에 대한 공식 입장문을 국제 학술지 KJR (Korean Journal of Radiology)에 발표하였다.1

AI 판독 도구의 현재: 임상 환경에 따른 성능의 차이

이번 연구에서 20명의 전문가들은 'KARA-CXR(버전 1.0.0.3, 현 AIRead-CXR, KakaoBrain, 서울, 대한민국)' 모델을 활용하여 각자가 근무하는 의료 기관에 건강검진, 입원, 응급실, 중환자실, 호흡기 외래, 비호흡기 외래의 6개 임상 환경에서 추출된 60건의 흉부 X선 증례를 직접 평가하였다. 설문 답변은 전문가들의 주관적 평가를 바탕으로 작성되었다.

질문지는 다음의 세 가지 영역을 다루었다.

  • 현재 성능: 신뢰도, 정확도, 환각(Hallucination) 발생 빈도, 가독성 및 명확성
  • 임상적 적용 가능성: 영상의학과 의사의 상주 여부, 판독문 검증, 외부 판독 대체 등을 포함한 다양한 조건하에서의 사용 편의성
  • 영상의학과 의사의 이점: 진단 정확도 및 업무 흐름 효율성에 미치는 잠재적 기대 효과

설문 조사 결과, AI 도구의 성능은 임상 맥락에 따라 매우 큰 차이를 보였다.

  • 건강검진 환경: 정상 증례 비중이 높은 건강검진 설정에서는 86.0%라는 가장 높은 정확도를 기록했다.
  • 건강검진 외 임상 환경: 반면, 중환자실에서의 정확도는 60.0%로 가장 낮았으며, 입원 및 응급실 등 복합적인 병변이 많은 환경에서도 62.5–69.0% 수준에 머물렀다.
  • 환각 현상: 건강검진에서는 낮은 비율의 ‘환각(Hallucination)’ 현상이 관찰되었으나(3.5%), 그 외 임상 환경에서는 상대적으로 높은 비율의 환각 현상이 관찰되었다(7.0–11.0%).

이러한 결과는 현재의 생성형 AI가 단순한 정상 소견 판별에는 유용할 수 있으나, 다발성 병변이나 정교한 감별 진단이 필요한 고난도 사례에서는 아직 독자적인 사용이 불가능함을 시사한다.

대한흉부영상의학회의 권고: '영상의학과 의사가 중심이 되는(Human-in-the-loop)' 활용

설문에 참여한 전문가들은 대부분의 항목에서 '중립적' 입장을 보였다. 학회가 제시한 주요 권고 사항은 다음과 같다.

주요 질문 권고문
1. AI 기반 흉부 X선 판독문 작성 도구의 현재 성능은 어떠한가? 패널은 해당 도구가 건강검진 환경에서 신뢰할 수 있는 흉부 X선 해석을 생성한다는 점에 동의함
패널은 건강검진 이외의 임상 환경에서 주요 이상 소견을 탐지하는 도구의 신뢰성에 대해 중립적인 입장임
패널은 건강검진 이외의 임상 환경에서 생성된 보고서의 가독성과 명확성에 대해 중립적인 입장임
2. AI 기반 흉부 X선 판독문 작성 도구가 일상적인 임상 진료에 적합한가? 패널은 영상의학과 의사가 없는 입원, 중환자실 또는 외래 환경에서의 단독 사용에 반대함
패널은 상주 영상의학과 의사가 없는 건강검진 및 비호흡기 외래 환경에서의 제한적 사용에 대해 중립적인 입장을 유지함
패널은 영상의학과 의사가 각 AI 생성 초안을 확인하는 경우, 건강검진 환경에서의 사용을 지지함
패널은 건강검진 환경이나 중환자실에서 검증되지 않은 AI 생성 보고서를 비영상의학과 의사와 공유하는 것에 대해 반대함
3. AI 기반 흉부 X선 판독문 작성 도구가 영상의학과 의사에게 도움이 될 것인가? 패널은 해당 도구가 영상의학과 의사의 판독 정확도, 업무 효율성 또는 업무량을 개선하는지 여부에 대해 중립적인 입장을 유지함

시사점 및 향후 과제

이 델파이 설문조사의 결과는 아래와 같은 점을 시사한다.

1 과도한 의존(Over-reliance) 경계
AI가 시각적인 근거 제시 없이 텍스트만 생성하는 경우, 경험이 적은 의료진이 AI의 오류를 무비판적으로 수용할 위험(자동화 편향, Automation bias)이 크므로 이에 대한 철저한 주의와 교육이 필요하다.2
2 영상의학과 의사의 역할
AI는 판독의 ‘보조 도구’일 뿐이며, 최종적인 임상적 판단과 책임은 여전히 의사에게 있다. 특히 영상의학과 의사의 부족 문제를 해결하기 위한 대안으로 논의되나, 그 과정에서 안전성 검증이 선행되어야 한다.3

결론 및 향후 과제

영상의학과 의사의 부족 현상과 업무 과부하를 해결하기 위해 생성형 AI의 도입은 매력적인 대안이 될 수 있다.4 하지만 이번 연구 결과가 보여주듯, AI는 아직 '완성된 도구'가 아닌 영상의학과 의사의 업무를 보조하는 '미완의 보조자' 단계에 있다.

향후 더 대규모의 객관적인 임상 데이터를 통한 검증과 기술적 고도화가 이루어져야 하며, 무엇보다 환자의 안전을 최우선으로 하는 신뢰할 수 있는 AI 활용 가이드라인의 정착이 중요하다. 마지막으로 이 공식 입장문은 현재의 상황을 대변하는 것이며 AI 성능과 관련 규제 또한 지속적으로 발전하고 있는 상황에서 향후 전문가들은 좀더 긍정적인 의견을 표출할 가능성도 높다. 대한흉부영상의학회는 기술 발전에 발맞추어 이러한 가이드라인을 지속적으로 업데이트하며 책임감 있는 AI 도입을 선도할 것이다.

참고문헌
  • Jeong WG, Hwang EJ, Jin GY et al. Artificial Intelligence-Driven Drafting of Chest X-Ray Reports: 2025 Position Statement From the Korean Society of Thoracic Radiology Based on an Expert Survey. Korean J Radiol. 2025;26(11):1100-1108.
  • Dratsch T, Chen X, Rezazade Mehrizi M, et al. Automation Bias in Mammography: The Impact of Artificial Intelligence BI-RADS Suggestions on Reader Performance. Radiology. 2023;307(4):e222176.
  • Duffourc M, Gerke S. Generative AI in Health Care and Liability Risks for Physicians and Safety Concerns for Patients. JAMA. 2023;330(4):313-314.
  • Do KH, Beck KS, Lee JM. The Growing Problem of Radiologist Shortages: Korean Perspective. Korean J Radiol. 2023;24(12):1173-1175.

TOP