top of page
검색

본 연구는, 수술 전 brain MRI에 통상적으로 포함되는 conventional structure MRI에 CNN (convolutional neural network)을 적용하여, glioma 의 예후 / 치료반응에 중요한 종양의 IDH 상태를 예측한 연구이다. Conventional MRI 로 IDH 상태를 예측하는 딥러닝 연구는 과거 몇 편 발표된 바 있으나, 1) 예측 과정이 완전 자동화가 되지 않았거나, 2) 딥러닝 모델의 예측 정확도가 다른 병원 혹은 국가의 환자에서 어느정도 유지되는지 generalizability에 대한 external testing 이 되지 않았다는 점에서 한계가 있었으며, 인력 및 딥러닝 모델 개발 여건의 부족을 고려하여, “완전 자동화된 IDH 상태 예측모델을 큰 규모의 단일병원에서 개발하고, 이 모델을 다른 병원에서 도입해 쓴다.” 는 현실적 시나리오를 가정하고 디자인한 연구이다. 이를 위해 본 연구에서는, 3개 데이터셋 (세브란스병원, 서울대병원, The Cancer Imaging Archive [TCIA])의 1,166명glioma 환자를 대상으로, 세브란스병원 데이터를 기반으로 완전 자동화된 IDH 상태 예측 모델을 트레이닝 한 후, 이를 세브란스병원 데이터 및 다른 두 데이터 셋에서 각각 internal, external testing을 하였다.

(Figure 1. Fully automated hybrid model for IDH status prediction)

완전 자동화된 IDH 상태 예측은, automatic tumor segmentation 을 위한 Model 1, 그리고 IDH status classification 을 위한 Model 2, Model 1과 2사이를 연결해주는 완전 자동 프로세싱 부분으로 구성되어 있다 (Figure 1). 기존의 CNN이 이미지 픽셀값만을 이용하는 것과 달리, MRI상의 2차원 종양 부위 픽셀값 및 3차원적인 종양 위치 및 모양 정보를 모두 이용한 hybrid approach 로 예측 정확도를 높인 것이 본 연구의 장점이다. 또한, Gradient-weighted Class Activation Mapping (grad-CAM) 기법으로, 딥러닝 모델이 IDH 상태 예측을 하는데 있어 종양 이미지의 어느 부분이 중요한지 해석하였다.



(Figure 2. Performance of the hybrid model in the prediction of IDH status. ROC, receiver operating characteristics; PR, precision-recall)


Model testing 결과를 보면, development set과 같은 세브란스 병원에서 나온 internal test set > 서울대병원 데이터 (SNUH set) >TCIA set 순으로 IDH 상태 예측 정확도가 높았으며, 각각93.8%, 87.9%, 78.8% 의 정확도,그리고 0.96, 0.94, 0.86의 AUC값을 얻었다 (Figure 2).


서울대병원과 세브란스 병원은 다른 회사의 MR scanner 를 사용하지만 (Siemens vs. Philips), 환자 대부분이 한국인이고 imaging protocol 이 비슷하며, TCIA set은 MR scanner 도 heterogeneous 하고, 환자군이 북미 다인종으로 이루어져 있고, imaging protocol 또한 세브란스병원과 다르고 heterogeneous 하다. 따라서 본 연구 결과는, 타 기관에서 개발된 딥러닝 모델을 도입할 때, 개발한 기관과 도입하고자 하는 기관 사이의 환자군 특성 및 imaging protocol의 차이를 고려해야함을 시사하며, MR scanner가 다른 것은 어느정도 극복될 수 있다는 것을 시사한다.



참고 url: https://academic.oup.com/neuro-oncology/advance-article-abstract/doi/10.1093/neuonc/noaa177/5876011

https://www.ibric.org/myboard/read.php?Board=tr_interview&id=214687&Page=1&qinterview=Y

조회수 186회댓글 0개

본 연구에서는 Isocitrate dehydrogenase (IDH)-야생형 저등급교종 환자에서 자기공명영상 소견으로 환자의 예후를 예측할 수 있는지 보고자 하였고, 임상적으로 잘 알려진 예후 예측 인자와 자기공명영상 소견을 결합하였을 때 더욱 잘 예측할 수 있는지를 알아보고자 하였다. WHO grade II 또는 III의 병리적으로 확인된 IDH-야생형 저등급교좋이 진단된 총 158명 (본원: 112명, TCGA 데이터셋: 46명) 환자의 자기공명영상을 분석하였다. Visually Accessible Rembrandt Images가 제공하는 표준화된 항목 총 26개의 영상소견 중 환자의 예후와 통계학적으로 유의미한 연관성이 있는 소견을 LASSO, elastic net의 통계학적 방법을 통해 추출하였고, 이렇게 선택된 영상소견들로 이루어진 Radiologic risk score를 각 환자마다 계산하였다. 환자의 예후에 영향을 미치는 것으로 알려진 임상인자 (나이, WHO grade, 수술 범위 및 Karnofsky Performance Score)만으로 예후 예측 모델을 만들고, 여기에 Radiologic risk score를 추가한 예후 예측 모델을 만들어서 각 모델의 예측력을 time-dependent receiver operating characteristic curve를 계산하여 비교하였다. 이렇게 만들어진 모델은 별도의 TCGA 데이터셋에서 재평가하였다.


그 결과, 영상 소견 중 물혹의 존재, 연질막 침범, 피질의 침범은 더 좋은 예후와 연관이 있는 것으로 밝혀졌으며, 반면 뇌실막침범, 다심성 종양, 뇌엽이 아닌 다른 곳에 위치, 괴사가 종양의 1/3 이상, 위성종양의 존재 및 주요기능을 하는 피질침범이 확인된 경우에는 좋지 않은 예후와 연관이 있는 것으로 밝혀졌다. 또한, Radiologic risk score 자체가 독립적인 예후 예측 인자임이 밝혀졌으며, 임상인자에 추가하여 예후 예측 모델을 구축하였을 때 iAUC가 0.737에서 0.773 – 0.777로 통계학적으로 유의하게 증가하는 것을 확인하였다. 이는 별도의 데이터셋에서 재평가되었는데, 역시 여기에서도 임상인자에 radiologic risk score를 추가하였을 때 모델의 예측력이 iAUC 0.735에서 0.805 – 0.830으로 증가하는 것을 확인하였다.


아래의 그래프는 본원 환자를 대상으로 만들어진 radiologic risk score의 컷오프가 되는 수치를 기준으로 별도의 데이터셋인 TCGA 환자의 예후가 잘 나뉘어지는지를 확인한 것으로, (a, b) 그 수치를 기준으로 전체 생존율이 확연하게 다르게 나뉠 뿐 아니라 (c, d) 무진행 생존율 또한 확연하게 다르게 나뉘어지는 것을 확인하였다. 이를 통해 radiologic risk score가 예후가 좋지 않은 고위험군과 상대적으로 좋은 저위험군을 계층화할 수 있음을 확인하였다.



결론으로, IDH-야생형 저등급교좋 환자에서 자기공명영상 소견은 독립적으로 예후를 예측할 수 있는 인자이며 임상인자와 더해졌을 때 더욱 예후를 잘 예측할 수 있는 것이 확인되었다. 따라서 본 연구에서는 자기공명영상이 예후 예측을 위한 영상 바이오마커로서 기능할 수 있는 잠재력을 확인하였다.

참고 url: https://www.ncbi.nlm.nih.gov/pubmed/32060714

조회수 167회댓글 0개

뇌수막종의 등급을 수술전에 비침습적으로 결정하는 것은 수술적 절제 범위를 정하고 치료 계획을 수립하는 데 중요하다. 본 연구에서는 조직학적으로 진단된 140명의 뇌수막종 (108개의 저등급, 28개의 고등급 뇌수막종)이 훈련셋에 포함되었다. T1C와 확산강조영상, 확산텐서영상에서 뇌수막종을 분할하여 라디오믹스 특징을 추출하였다. 다양한 머신학습 분류기들이 훈련되어 뇌수막종 등급을 예측하고자 하였다. 테스트셋에서 모델의 성능을 측정하였다 (58명의 환자; 46 저등급, 12 고등급).


[라디오믹스의 파이프라인]

추출된 라디오믹스로 머신러닝을 시행하였을 때, 가장 좋은 분류기는 테스트셋에서 AUC 0.86의 성능을 보였고, 이러한 결과는 no-information rate보다 유의하게 높은 성능을 보였다 (p = 0.030). 분류기의 정확도, 민감도 및 특이도는 검증 테스트셋에서 각각 89.7%, 75.0% 및 93.5 %였다.


[훈련셋과 테스트셋의 곡선아래영역의 히트맵]

결론적으로 T1C와 DTI의 라디오믹스 특징에 기반한 머신 러닝 분류기들은 뇌수막종 등급을 구분하는 데 유용하였다.

참고 url: https://www.ncbi.nlm.nih.gov/pubmed/30443758

조회수 107회댓글 0개
bottom of page