한국MS, 웨인 서강대 교수 ‘문’ 프로젝트 개발 박차
상태바
한국MS, 웨인 서강대 교수 ‘문’ 프로젝트 개발 박차
  • 이근우 기자
  • 승인 2017.03.28 13:59
  • 댓글 0
이 기사를 공유합니다
고서 및 근현대 문학을 디지털로 복원
한국MS가 ‘문’ 프로젝트를 클라우드 애저 상에서 구축했다. 사진=크리에이션 제공

[매일일보 이근우 기자] 한국마이크로소프트(MS)는 기존 한국 고서 및 근현대 문학 자료를 클라우드 상에서 데이터화 해 자유롭게 연구할 수 있는 공유 플랫폼인 ‘문’ 프로젝트가 MS 클라우드 애저 상에서 성공적으로 구축됐다고 28일 밝혔다.

문 프로젝트는 MS 애저 클라우드 및 머신러닝 기술을 기반으로 한다. 기존 한국 고서 및 근현대 문학 자료를 텍스트 검색이 가능한 디지털 문서로 변환해 보다 쉽고 정확하게 한국학 연구가 가능하도록 지원하는 플랫폼이다.

기존에 검색이 불가능하던 스캔 이미지 형태의 PDF가 가진 한계를 극복해 한글은 물론 20세기 이전의 근대 국어, 한문에 이르기까지 서체에 상관없이 모든 텍스트를 손쉽게 검색할 수 있다.

불필요한 시간을 대폭 줄여 연구에 더욱 집중할 수 있게 됨은 물론이고 한국 근현대 문학, 더 나아가 고문서 연구의 범위가 크게 확장될 것으로 기대된다.     

예를 들어, 김소월 시인의 시 ‘진달래꽃’엔 ‘사뿐히 즈려 밟고 가시옵소서’라는 문구가 나오는데, 여기서 ‘즈려 밟고’에 대한 해석은 아직도 분분하다.

현대 국어엔 없는 표현이기 때문에 정확한 뜻을 이해하기 위해선 당시에 이 문장이 어떻게 쓰여졌는지를 다른 작품이나 동시대 문서들에 나온 표현을 찾아 비교 분석해 봐야 한다.

하지만 현재의 스캔 이미지 형태의 PDF는 검색이 불가능해 연구자가 일일이 수만페이지 분량을 눈으로 읽고 확인해봐야 하는 어려움이 있었다.

문 프로젝트엔 널리 사랑 받는 시 구절을 유니코드 값으로 분석해 다양한 형태의 3D 모델링을 제작하는 기능도 함께 포함됐다.

이렇게 제작된 3D 모델은 3D 프린터 출력으로 목걸이나 반지처럼 실제로 만질 수 있는 형태의 디지털 문학으로 다시 탄생할 수 있다. 더불어 홀로렌즈와 같은 MR 기기로 학생들이 직접 문학의 세계를 체험할 수 있는 3D 교육 공간의 구성도 가능해질 전망이다.

웨인 드 프레메리 서강대학교 국제한국학과 교수는 “현재 세계적으로 보존이 어려운 고문서 및 옛 문학을 디지털화 해 보존하는 추세지만 이를 실질적으로 활용하기 어렵다는 한계점이 있어 이러한 상황을 해결하고 한국학 연구 토대를 마련하고자 문 프로젝트를 시작하게 됐다”고 말했다.

그는 이어 “향후 애저 머신러닝과 인공지능(AI) 기술을 접목시켜 한국학과 한국문학에 특화된 검색엔진으로 발전시키는 동시에 한국 문학의 아름다움을 새롭게 느낄 수 있도록 하는 것이 목표”라고 덧붙였다.

한편, 문 프로젝트는 20여년간 한국 문학을 연구해온 웨인 교수를 주축으로 하는 비영리단체인 CISK와 김상훈 개발자가 함께 연구하고 있다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.