ChatGPT가 변화시키는 문서관리의 새로운 양상

문서관리와 지식 공유에 불어닥친 ChatGPT의 바람은 바야흐로 이제야 그 변화의 서막에 불과하다.

그간 마이크로소프트는 자사의 직원들 마저 Bing을 사용하지 않고 구글 검색을 사용해야하는 자조섞인 패배자의 위치였음을 부인하지 않았었는데 이제 마이크로소프트 직원들이 드디어 엣지 브라우저에 Bing 검색 엔진을 '시도'해보기 시작했다 한다.  이번 주에 있었던 마이크로소프트의 생산성 향상이란 테마의 ChatGPT4 연동 발표는 과연 마이크로소프트가 구글을 제치고 과거의 영광을 재현할 수도 있을 것이란 희망의 단초를 제공해주기에 충분했다.

마이크로소프트는 그간 소위 VaporWare를 발표하며 희망고문을 주고 경쟁자들을 따라 잡아오던 터라 OpenAI와 협력으로 자사 제품에 최신의 인공지능 서비스를 연동시킨다고 예고했을 때 반신반의했던 것이 사실이다. 그러나 세계의 모든 IT인들은 워드, 엑셀, 파워포인트가 ChatGPT4와 훌륭하게 연동되어 아웃풋을 내어놓는 결과에 아연 놀라지 않을 수 없었다.

이제 ChatGPT는 어쩌면 IT 마케팅의 새로운 면모를 보여준 것인 지도 모른다. 이미 인더스트리가 개발해 놓았던 초거대 언어처리 모델들을 천문학적인 서버 운영비를 감안하여 타 경쟁자보다 빠르게 시장에 선을 보인 것이다.   이같은 결정은 아마 영원히 구글같은 공룡들이 흉내내지 못할 것이라는 생각이 든다. 일반 대중이 환호하고 미디어들이 열을 내어 보도했던 이유는 '트랜스포머' 며 '다빈치'며 '파인튜닝'이며 심지어 GPU가 무엇인지 모르는 일반인들도 무료로 웹에 접속해서 '프롬프트'에 입력만 하면 요술방망이 처럼 답을 써내려가는 신기한 인공지능의 파워를 직접 실시간으로  '체험'하였기에 입소문에 가담하였던 것이다. 이러이러한 거대기술을 가지고 가까운 미래, 아니 한 달 후에 발표할 것이라는 계획 가지고는 이제 시장의 반응을 기대하기 어렵게 되었다.

한국어 언어에 관한 한 글로벌 기업들이 연구가 진행되지 않았기 때문에 우리나라 AI 기업들이 앞서 갈 수 있고 곧 가을 쯤에는 발표할 것이라고 호언장담하던 국내 대표적인 AI 기업들은 ChatGPT의 반칙과 같은 빠른 출시에 망연자실했을 것이다. 한글 처리가 상상하던 수준을 넘어섰기 때문이다.

이제 ChatGPT의 등장으로 문서관리 /처리 분야에서 새롭게 대응해야할 과제는 어떤 것이 있을 까?

첫째, 우선 보관된 문서에 대한 보다 정교한 처리가 다시 이뤄지게 될 것이다. 손으로 쓰여진 글씨들, 흐릿한 활자체, 세로쓰기된 고문서들이 컴퓨팅 파워의 한계로 그간 방치되어 있어왔는데 이제는 변명을 할 수가 없게 되었다. 전통적인 OCR은 몇 주 사이에 ChatGPT 기반의 OCR로 시급히 대체될 것이다. 따라서 검색조차 되지 않고 수장되어 있는 공공 문서, 도서들이 이제 쉽게 추출되어 디지탈 문서로 재단장 될 것이고 이는 제 2의 디지탈트랜스포메이션의 기초가 될 것이다.

둘째, 디지탈 문서로의 변환에 따라 부가적으로 민감 정보의 가리기, 문서 요약, 문서 비교, 문서 검색등 연관 분야가 급속히 필요하고 발전할 것이다. 이제 80~90% 정도의 정확성이 아닌 98~99%의 정확성으로 문서 처리 능력을 보여주어야 하게 된 것이다. 관련 툴, 서비스들이 ChatGPT4로 재무장하여 서비스를 강화하느라 바쁜 시기를 보낼 것이다.

셋째, 클라우드 문서 처리의 사각지대에 놓인 폐쇄망의 문서들은 어찌 할 것인가? 미국 주도의 AI 회사들은 글로벌 데이타자산들을 모두 통제하도록 설계되어 있고, Train 이라는 이름으로 데이타의 제공을 요구할 것이다. 제한적인 환경의 문서들을 분석하고 내부적으로 활용하기 위해서는 초거대 언어모델을 작동시킬 거대 클라우드 인프라가 필요하지 않을 수도 있다. 이미 이 같은 On-premise 환경에서의 문서분석이 가능한 소형원자로 같은 솔루션을 찾는 사례가 늘어나고 있다.

마지막으로 문서 생성분야에서는 마이크로소프트의 독주가 이뤄질 것 처럼 보이지만 사실은 그렇지가 않다.  ChatGPT의 경쟁 제품들이 마지막 스퍼트에서는 시간을 놓쳤지만 경쟁사들이 ChatGPT에 상응하는 기술을 보유하고 있고 이미 오픈소스화된 코드가 넘쳐나고 있기 때문에 마이크로소프트의 생산성향상 툴과 연동하는 부분은 순식간에 따라잡는데 문제가 없을 것으로 보여진다.  
     

 
위로 스크롤