연구자는 왜 NotebookLM 대신 로컬독스를 선택했을까요? 원서 출처를 정확히 찾아주는 지식검색 AI
문서를 학습시켜서 AI와 대화하는 사람은 많습니다. 하지만 연구자에게 정말 중요한 것은 “대답을 그럴듯하게 잘하느냐”보다, “그 문장이 정확히 어느 문서 몇 페이지에 있었는지 바로 검증할 수 있느냐”예요.
이번 글은 로컬독스 유저의 실제 인터뷰를 바탕으로 정리했습니다. 유저 분은 연구원으로, 해외 박사 과정 진학을 준비하고 있어요. 연구원님이 다루는 자료는 1950년대부터 1955년까지의 유럽, 미국, 독일 등 의회 관련 자료들이며, 파일당 20~250페이지 분량의 원문 사료를 65~70개까지 올려가며 주제별·의원별 발언을 스크리닝해야 하는 상황이었습니다.
연구자에게 필요한 것은 “좋은 요약”보다 “정확한 근거”입니다
로컬독스를 사용하게 된 계기는 웹 검색이 아니라, 내가 가진 내부 문서와 사료만으로 답을 찾을 수 있다는 점, 그리고 데이터가 뒤섞이지 않을 것이라는 신뢰감이었습니다.
연구자는 자료를 “읽는 사람”이기도 하지만, 동시에 “근거를 검증하는 사람”이기도 합니다. 특히 역사 연구나 인문학 연구에서는, 비슷한 표현이 반복되는 긴 연설문 속에서 특정 발언이 정말 어디에 있었는지를 다시 확인하는 과정이 핵심이죠. 요약이 맞는 것처럼 보여도, 출처가 조금만 어긋나면 다시 원문을 처음부터 뒤져야 합니다.
이 문제가 비단 연구자만의 일은 아니에요. McKinsey는 지식 노동자가 근무 시간의 4분의 1 이상을 정보를 찾는 데 쓴다고 설명합니다. 연구실이든 기업이든, 필요한 내용을 찾는 시간이 길어질수록 본업은 뒤로 밀리게 됩니다.
그래서 로컬독스를 높게 평가한 포인트도 “답을 해준다”가 아니라, 원하는 발언의 정확한 페이지와 발화자를 찾아주고, 출처를 누르면 실제 PDF 원문에 해당 부분이 하이라이트로 이어진다는 경험이었습니다. 연구 생산성은 답변의 유창함이 아니라, 검증 속도에서 갈린다는 뜻이에요.
ChatGPT·Gemini·NotebookLM으로도 아쉬웠던 이유
많은 연구자와 실무자가 먼저 떠올리는 첫번째 AI는 역시 ChatGPT, Gemini, NotebookLM입니다. 실제로 NotebookLM을 같은 목적으로 써봤다고 했어요. 하지만 인터뷰에서 분명히 짚은 문제는, 답변이 얼추 맞아도 출처로 연결되는 원문이 실제 근거와 어긋나거나, 너무 넓은 범위를 보여줘 다시 사람이 스크리닝해야 했다는 점이었습니다.
여기에 공식 서비스 제한을 겹쳐 보면, 왜 연구 현장에서 아쉬움이 생기는지 더 분명해집니다. ChatGPT는 GPT나 대화 기준 파일 업로드 제한과 크기 제한이 있고, Gemini Apps는 한 프롬프트에 최대 10개 파일, 일반 파일은 최대 100MB까지 지원합니다. NotebookLM은 기본적으로 노트북당 최대 50개 소스, 소스당 50만 단어 또는 200MB 제한을 안내하고 있습니다. Plus·Pro 등 상위 플랜에서는 소스 수가 더 늘어나지만, 결국 중요한 건 “많이 넣을 수 있는가”보다 “문장 단위로 근거를 빨리 확인할 수 있는가”예요.
또 하나 놓치기 쉬운 지점이 있습니다. OpenAI도 직접 “언어 모델은 여전히 환각, 즉 사실이 아닌 내용을 그럴듯하게 생성하는 문제를 완전히 벗어나지 못했다”고 설명합니다. 연구자 입장에서는 이 문제가 단순한 불편이 아니라, 잘못된 인용과 해석으로 이어질 수 있는 리스크예요. 그래서 문서 AI는 말을 잘하는 것보다, 없으면 없다고 말하고 근거를 바로 보여주는 정직함이 더 중요합니다.
비교 기준 | 일반 검색 | ChatGPT / Gemini | NotebookLM | 로컬독스 |
|---|---|---|---|---|
원하는 발언 찾기 | PDF를 여러 개 열고 Ctrl+F 반복 | 업로드 후 질의 가능 | 소스 기반 질의 가능 | 특정 발언의 페이지와 발화자를 더 정확히 찾기 쉬움 |
출처 검증 | 사람이 직접 문맥 재확인 | 답변은 빨라도 검증 재작업 필요 가능 | 출처 연결은 되지만 범위가 넓을 수 있음 | 실제 PDF 원문 렌더링 + 해당 부분 하이라이트 |
다국어 문서 처리 | 사람이 일일이 읽어야 함 | 가능하지만 검증 부담 존재 | 가능 | 독일어·영어 혼재 문서도 실사용 만족도 높음 |
연구 흐름 적합성 | 느리고 반복적 | 빠르지만 근거 재검토 필요 | 초벌 정리에 유용 | 스크리닝과 근거 확인을 한 화면 흐름으로 연결 |
위 표의 서비스 제한 정보는 각 서비스 공식 도움말과 제품 페이지를 바탕으로 정리했습니다.
로컬독스에 높은 점수를 준 이유
로컬독스의 만족도는 10점 만점에 8.5점이었습니다. 점수가 꽤 높았던 이유는, 연구자가 실제로 시간을 잃는 구간을 정확히 줄여줬기 때문이에요.
1. “여기 있습니다”라고 답해주는 경험
연구자가 원하는 건 긴 요약문이 아닐 때가 많습니다. 어떤 개념이 나오는 장면, 특정 의원의 발언, 어떤 주장의 원문 위치가 더 중요하죠. 로컬독스는 원하는 발언의 정확한 페이지와 발화자를 찾아주는 정확도가 뛰어나서 그 점을 특히 높게 평가했습니다.
2. 출처 버튼을 누르면 실제 PDF 원문으로 이어지는 점
이 부분이 NotebookLM과 가장 크게 갈렸다고 볼 수 있어요. 인터뷰에 따르면 NotebookLM은 답 자체는 맞더라도 출처로 연결되는 원문이 실제 근거와 어긋나는 경우가 있었고, 텍스트만 보여주는 방식이라 다시 맥락을 읽어야 했습니다. 반면 로컬독스는 PDF를 실제로 렌더링해 스크리닝된 부분을 즉시 확인할 수 있어, 연구자가 검증에 드는 시간을 크게 줄여줬습니다.
3. 다국어 문서도 “실무에 사용 가능하다”는 확신
연구자가 다루는 자료는 독일어, 영어 등 다양한 언어가 섞여 있습니다. 이런 자료는 단순 번역보다 맥락 유지가 더 어렵습니다. 그럼에도 인터뷰에서는 Gemini 무료 버전이나 Perplexity 수준과 견줘도 언어 이해 성능이 충분히 좋았다는 평가가 나왔어요. 즉, 로컬독스는 단순한 PDF 요약 AI가 아니라, 연구 맥락을 따라가며 문서를 읽는 지식검색 AI로 받아들여진 것입니다.
4. 연구자의 기존 AI 습관과도 잘 맞는 도구
AI를 잘 쓰는 분들은 공통 규칙, 프로젝트 규칙, 채팅별 세부 지침을 나눠 운용하고 있어요. 로컬독스에서도 스크리닝 규칙을 시스템 프롬프트처럼 적용하고 있었고, 앞으로 OpenAI나 Gemini에 세팅한 프롬프트와 연동되는 기능까지 기대하고 있었습니다. 이 말은 곧, 로컬독스가 연구자의 기존 워크플로우를 깨지 않고 자연스럽게 들어간다는 뜻이에요.
연구 노트, Zotero, ChatGPT 사이에서 로컬독스가 맡는 역할
이 인터뷰가 더 흥미로운 이유는, 이미 다양한 툴을 조합해 사용하고 계셨기 때문입니다. 연구 노트는 구글 독스, 워드에 분산되어 있었고, 사료 기반 초안을 로컬독스에서 만든 뒤 포맷을 바꿔 구글 독스로 보내고, 이후 ChatGPT나 Zotero와 연결하는 흐름을 구상하고 있었어요.
이런 맥락에서 보면 로컬독스의 역할은 “모든 걸 다 해주는 만능 AI”가 아닙니다. 오히려 더 현실적이에요. 연구의 가장 앞단에서, 수십 개 PDF 속에서 근거를 찾아내고 확인하는 역할에 집중합니다. 그 다음 정리, 글쓰기, 서지 관리, 포맷 변환은 기존 툴과 연결하면 됩니다. 도구가 많아질수록 더 중요한 것은 기능 개수가 아니라, 각 도구가 어디에서 시간을 줄여주느냐예요.
결국 연구 생산성을 바꾸는 건 “답변”이 아니라 “검증 시간”입니다
문서 AI를 고를 때 많은 분이 먼저 묻는 질문은 이것입니다.
“이 AI, 똑똑한가요?”
하지만 인터뷰를 따라가 보면 질문이 조금 달라집니다.
“이 AI, 내가 다시 확인하는 시간을 줄여주나요?”
연구자는 정답을 듣고 끝나는 사람이 아니라, 근거를 붙잡고 논리를 세우는 사람입니다. 그래서 문서 AI도 단순한 요약기보다, 출처를 정확히 짚고 원문까지 바로 확인하게 해주는 지식검색 AI가 훨씬 실용적이에요.
로컬독스는 바로 그 지점에서 힘을 발휘합니다. ChatGPT처럼 바로 질문할 수 있는 편의성은 가져가되, 문서에 없으면 없다고 말하고, 클릭 한 번으로 원문 하이라이트까지 이어지는 검증 흐름을 제공하니까요. 공식 페이지 역시 “같은 질문이라도 더 정확한 답과 인용을 주고, 문서에 없으면 없다고 말하며, 100페이지가 넘는 문서나 표·이미지도 다룰 수 있다”는 방향을 분명히 제시합니다.
연구자든, 사내 문서 검색이 필요한 실무자든, 기업용 AI 챗봇이나 사내 규정 검색 도구를 검토하는 팀이든 결국 기준은 비슷합니다. 찾는 시간을 줄이고, 틀릴 가능성을 낮추고, 다시 확인하는 수고를 없애는가. 그 기준으로 본다면 로컬독스는 꽤 분명한 대안을 보여줍니다.
여러분의 연구와 업무 흐름에 맞는 현명한 도구 선택으로, 더 적게 찾고 더 많이 생각하는 시간을 되찾으시길 바랍니다.