- 새로운 뉴스를 올려주세요.
Date | 17/09/12 20:54:49 |
Name | 유리소년 |
Subject | 명의로 거듭난 AI.."30초만에 폐암·유방암 진단" |
http://v.media.daum.net/v/20170912075205220?f=m 원문 기사는 http://www.scmp.com/news/hong-kong/health-environment/article/2110098/chinese-university-researchers-build-speedy-new 로 보입니다. 의료계에서의 딥러닝 영상처리활용에 대해서는 전혀 알지 못합니다만, 일반적으로 딥러닝 관련 기사에서 말하는 이미지 내 객체 분류 모델의 [식별 정확도]에 대해서는 조금 걸러서 볼 필요가 있습니다. 저 기사에서 나오는 정확도 91%라는 것은, 해당 연구팀이 준비한 검증용 CT 이미지 데이터셋으로 자가테스트한 결과가 91%라는 뜻이지, 저 모델로 직접 현업에서 환자들의 CT 이미지를 진단했을 때의 예상 진단율이 91%라는 뜻은 아니기 때문입니다. 아마도 더 낮을 것입니다. 만약 데이터 이미지들이 촬영 세팅에 따라 크게 달라지지 않는 유형의 문제이며 (TV나 냉장고 같은) 검증용 자가테스트 데이터를 대표성 있게 잘 설정했다면 기사로 써낸 정확도와 실제 산업에서 써먹을 때의 예측성공률이 큰 차이가 없지만, 그렇지 못한 경우에는 [연구팀이 모은 오로지 그 데이터들을 식별하는 용도 외에는 별로 성능이 안 나오는] 모델이 과대포장되기도 합니다. 의료계 말고 이미지 데이터를 확보하기 쉬운 다른 분야에서는 일반적으로 알고리즘 성능을 비교할 때 그 업계 내에서 가장 유명한 수만~수십장짜리 공용 DB를 연구자들 사이의 암묵적 합의에 의해 정해놓은 뒤, 그 DB로 학습시켜 테스트한 결과만을 비교합니다. ImageNet 평균인식률 78% vs ImageNet 평균인식률 82%.. 이런 식으로 말이죠. 왜냐하면 그런 [성능비교용 공통DB]의 존재가 없다면, 사람들이 죄다 자기만의 DB로 인식률 90%를 찍었다면서 '이미지 기반 음식 종류 식별률 90% 달성' 운운하며 허풍을 치기 때문입니다. 의료계 딥러닝 영상처리에서 그런 성능비교용 공통DB가 존재하는지는 잘 모르겠습니다. 결국 DB 수집/확보 문제라는 간단한 이야기를 너무 길게 말한 것 같군요. 0
이 게시판에 등록된 유리소년님의 최근 게시물
|