NotebookLM은 HWP 파일을 인식할까?
한글 문서를 자주 다루는 분이라면 한 번쯤 이런 질문을 하게 됩니다.
"NotebookLM은 HWP 파일을 인식하나?"
결론부터 말씀드리면, NotebookLM은 현재 HWP·HWPX를 공식 지원 형식으로 명시하고 있지 않습니다. Google의 공식 도움말 어디에도 HWP나 HWPX는 업로드 가능한 소스 형식으로 등재되어 있지 않아요.
그렇다면 HWP 파일을 주로 다루는 법조계 실무자, 법무팀, 공공기관 담당자 입장에서는 어떤 도구를 써야 할까요? NotebookLM을 못 쓰는 상황에서 어떤 AI 도구들이 HWP를 읽을 수 있는지, 그리고 그 도구들의 한계는 무엇인지를 지금부터 차근차근 살펴보겠습니다.
NotebookLM이 지원하는 파일 형식은 무엇인가요?
먼저 지금 시점 기준으로 NotebookLM이 공식 지원하는 소스 형식을 정리해드릴게요.
파일 형식 | 지원 여부 |
|---|---|
✅ 지원 (이미지 전용 PDF 포함) | |
Google Docs / Slides | ✅ 지원 |
텍스트 파일 (.txt) | ✅ 지원 |
마크다운 (.md) | ✅ 지원 |
Microsoft Word (.docx) | ✅ 지원 (2026년 1월 공식 추가) |
CSV / PowerPoint (.pptx) | ✅ 지원 |
EPUB | ✅ 지원 (2026년 3월 공식 추가) |
웹 URL / YouTube 링크 | ✅ 지원 |
오디오 파일 (MP3, WAV 등) | ✅ 지원 |
HWP / HWPX | ❌ 미지원 |
NotebookLM은 지속적으로 지원 형식을 확대해왔습니다. 2026년 들어서만 Word(.docx)와 EPUB가 새로 추가됐어요. 하지만 HWP·HWPX는 여전히 목록에 없습니다. 국내 교육·공공·법조 실무자들이 "HWP 파일은 변환 없이는 NotebookLM에 올릴 수 없다"고 공통적으로 확인하는 이유가 여기 있어요.
HWP를 그냥 변환해서 쓰면 되지 않나요?
물론 PDF나 .txt로 변환해서 올리는 우회 방법은 있습니다. 그런데 이 방법을 실제로 써보면 두 가지 문제가 생깁니다.
매번 변환 작업이 필요합니다. 법률 문서, 계약서, 행정 서류처럼 HWP 파일이 수시로 오가는 실무 환경에서 파일마다 일일이 변환하는 것은 생각보다 큰 부담이에요.
변환 과정에서 정보가 손실됩니다. 특히 법조계 문서에 자주 등장하는 복잡한 표 구조, 각주, 주석, 별첨, 스캔 이미지 페이지 등은 PDF로 변환할 때 레이아웃이 틀어지거나 내용이 누락되는 경우가 생겨요. "파일은 변환했다"고 해도 그게 원본 내용을 온전히 담은 파일이라고 보장할 수 없다는 이야기입니다.
그렇다면 처음부터 HWP를 직접 인식하는 AI 도구를 쓰는 편이 훨씬 합리적입니다. 지금부터 HWP를 지원하는 도구들을 하나씩 살펴볼게요.
HWP를 인식하는 AI 도구에는 무엇이 있나요?
현재 HWP·HWPX를 직접 지원하거나 인식하는 AI 도구는 크게 세 가지로 나눠볼 수 있습니다.
① ChatGPT — 2026년 4월 공식 지원 시작
OpenAI는 2026년 4월 17일, ChatGPT가 HWP와 HWPX 파일 형식을 공식적으로 지원하기 시작했다고 발표했습니다. 이전까지 ChatGPT는 PDF, DOCX, TXT 등은 지원했지만 HWP는 공식 목록에 없었어요. 이번 업데이트로 한국 사용자들은 파일 변환 없이 HWP 문서를 바로 업로드해 요약을 받거나 정보를 추출할 수 있게 됐습니다.
장점:
즉시 쓸 수 있고, 별도 설치가 없으며, 자연어 질문으로 문서 내 정보를 바로 찾아볼 수 있어요.
주의할 점:
ChatGPT가 HWP를 "올릴 수 있다"는 것과 "꼼꼼하게 읽는다"는 것은 다른 이야기입니다. ChatGPT는 문서를 처리할 때 주로 텍스트 추출 방식으로 동작합니다. 표가 촘촘히 들어간 계약서, 각주와 주석이 복잡하게 얽힌 법률 문서, 스캔 페이지가 섞인 HWP처럼 서식이 까다로운 파일에서는 인식 품질이 들쭉날쭉해질 수 있어요. 특히 법조계에서 다루는 문서는 단 한 줄, 단 하나의 수치가 틀려도 큰 문제가 생기기 때문에 이 부분이 중요합니다.
무엇보다 원문 뷰어가 없습니다. ChatGPT에서 HWP 관련 답변을 받아도, "이 답변이 문서 몇 페이지 어느 문장에서 나온 것인지"를 앱 안에서 즉시 확인하는 방법이 없어요. 답변을 받은 뒤 원본 파일을 따로 열고 직접 대조해야 합니다.
보안도 고려해야 합니다. 업로드된 HWP 파일은 OpenAI 클라우드 서버로 전송됩니다. 기밀이 담긴 법률 문서나 계약서를 외부 서버로 보내는 것이 조직의 보안 정책과 충돌하지 않는지 반드시 확인하셔야 해요.
비교 항목 | 내용 |
|---|---|
HWP/HWPX 공식 지원 | ✅ 2026년 4월부터 공식 지원 |
복잡한 서식 처리 | ⚠️ 표·이미지·각주 누락 가능 |
원문 뷰어 | ❌ 없음 |
보안 | ❌ OpenAI 클라우드로 전송 |
파일당 업로드 용량 | 최대 512MB |
동시 업로드 문서 수 | 메시지당 최대 10개 |
② Gemini — 이전부터 공식 지원, 하지만 실제 인식 품질은 편차가 있어요
Gemini는 ChatGPT보다 앞서 HWP·HWPX를 공식 지원 형식으로 명시하고 있습니다. 한 번에 최대 10개 파일, 최대 100MB까지 업로드할 수 있어요.
장점:
공식 지원이 명시되어 있고, 구글 계정만 있으면 즉시 쓸 수 있습니다.
주의할 점:
Google 공식 도움말에서도 "파일 분석이 실패하면 다시 업로드해보라", "너무 큰 파일은 세부 내용을 놓칠 수 있다"고 직접 안내하고 있어요. 특히 서식이 복잡하거나, 표·스캔·별첨이 섞인 HWP에서는 인식 품질 편차가 크게 느껴집니다. "공식 지원"이 "항상 완벽하게 읽힌다"는 보장은 아닌 것이죠.
원문 뷰어와 보안 문제는 ChatGPT와 동일합니다. 답변이 나와도 원문 어느 부분에서 가져온 것인지 앱 안에서 즉시 눈으로 확인하기 어렵고, 파일이 Google 클라우드 서버로 전송된다는 점은 변하지 않습니다.
비교 항목 | 내용 |
|---|---|
HWP/HWPX 공식 지원 | ✅ 이전부터 공식 명시 |
복잡한 서식 처리 | ⚠️ 파일에 따라 인식 품질 편차 있음 |
원문 뷰어 | ❌ 없음 |
보안 | ❌ Google 클라우드로 전송 |
파일당 업로드 용량 | 최대 100MB |
동시 업로드 문서 수 | 프롬프트당 최대 10개 |
③ 로컬독스(LocalDocs) — HWP 전용 뷰어까지 갖춘 문서 AI
이 지점에서 이야기가 달라집니다.
지금까지 살펴본 ChatGPT와 Gemini는 HWP를 "업로드해서 읽을 수는 있는" 수준이었습니다. 그런데 법조계나 공공기관 실무에서 진짜로 필요한 건 단순히 파일이 올라가는 것 이상이에요. 어디에서 가져온 말인지 원문으로 확인하고, 기밀 문서가 외부 서버로 나가지 않아야 하고, 수십 개의 문서를 한꺼번에 다룰 수 있어야 합니다.
로컬독스는 스스로를 "문서 기반으로 대화하는 지식검색 AI"라고 소개하며, 처음부터 이 사용 맥락에 맞게 설계된 제품입니다. 지금부터 로컬독스의 특징을 하나씩 설명드릴게요.
로컬독스는 무엇이 다른가요?
강점 1: HWP/HWPX를 공식 지원합니다
로컬독스는 공식 사이트에서 PDF, 한글(HWP/HWPX), DOCX/DOC 지원을 명확하게 내세우고 있습니다. "혹시 읽힐 수도 있다"는 수준이 아니라, 처음부터 HWP 인식을 핵심 기능으로 설계한 제품이에요.
변환 과정이 필요 없습니다. HWP 파일 그대로 올리고 바로 대화를 시작할 수 있어요. 법률 문서, 계약서, 행정 서류처럼 HWP가 기본인 실무 환경에서 "변환 → 업로드 → 재확인" 과정이 통째로 사라지는 겁니다.
강점 2: 한글 포맷 전용 뷰어를 제공합니다
이 부분이 ChatGPT·Gemini·NotebookLM 모두와 로컬독스가 갈리는 핵심 차이입니다.
로컬독스는 원문 뷰어를 내장하고 있습니다. 질문에 대한 답변을 받으면, 그 답변의 근거가 된 문장이 원문 HWP 문서 어디에 있는지를 뷰어 화면 안에서 바로 확인할 수 있어요.
실무에서 이게 왜 중요한지 생각해보세요. 계약서의 특정 조항을 검토하거나, 판례 문서에서 핵심 근거를 찾을 때, "AI가 그렇게 답했다"는 것만으로는 충분하지 않습니다. 원문 몇 페이지, 어느 문단에 근거한 말인지를 직접 눈으로 보고 확인한 뒤에야 실무에 쓸 수 있어요. 로컬독스는 이 '확인하는 과정'을 별도의 작업 없이 앱 안에서 바로 해결해줍니다.
ChatGPT나 Gemini에서는 답변을 받고 나서도 원본 파일을 따로 열고 직접 찾아봐야 합니다. 이 차이는 문서 수가 많아질수록, 분량이 길어질수록 더욱 크게 느껴집니다.
강점 3: 문장별 출처 표시와 원문 하이라이트
로컬독스는 단순히 "몇 번 소스에서 왔습니다"는 링크 수준이 아닙니다. 어떤 문장에서 해당 정보를 가져왔는지 원문에 하이라이트로 표시해줍니다.
이건 특히 여러 문서를 교차해서 볼 때 위력을 발휘합니다. 예를 들어 A 계약서 15페이지 3항과 B 관련 판례 문서의 특정 문단이 서로 어떻게 연결되는지, 로컬독스는 각각의 출처를 하이라이트로 짚어주며 답변을 구성합니다. 이를 통해 답변의 신뢰도를 눈으로 직접 검증할 수 있어요.
법조계나 법무팀에서 "AI 답변을 그냥 믿을 수 없다"는 불안감의 핵심은 사실 여기 있습니다. 근거를 확인할 수 없어서 못 믿는 것이지, AI 자체를 못 믿는 게 아닌 경우가 많아요. 로컬독스는 이 불안감을 원문 하이라이트로 해소합니다.
강점 4: 문서 100개, 2~3GB 대용량도 거뜬합니다
ChatGPT와 Gemini는 메시지당·프롬프트당 최대 10개 파일만 참조할 수 있습니다. 실무에서 수십 건의 계약서, 소송 관련 문서 묶음, 각종 행정 서류를 한꺼번에 다뤄야 한다면 이 제한이 바로 벽이 됩니다.
로컬독스는 100개 이상의 문서, 총 2~3GB 용량도 한 번에 처리할 수 있는 방향성을 제품의 핵심 강점으로 내세우고 있습니다. 수백 페이지짜리 매뉴얼이나 수십 개의 계약서 묶음을 통째로 올려두고, 거기서 필요한 정보를 질문으로 찾아낼 수 있어요.
하나씩 열어가며 Ctrl+F를 누르거나, 메신저로 고연차 동료에게 "혹시 이 조항 아세요?"라고 물어보는 상황이 사라지는 겁니다.
강점 5: 문서 원본이 내 PC 밖으로 나가지 않습니다
기밀 법률 문서나 내부 계약서를 다루는 분들에게 가장 결정적인 부분입니다.
로컬독스는 하이브리드 구조를 택하고 있습니다. 문서를 읽고 검색하는 핵심 과정은 내 PC(로컬) 안에서 처리합니다. 기밀 문서 원본이 OpenAI나 Google 같은 외부 클라우드 서버로 통째로 전송되는 일이 없어요. 답변을 완성할 때만 AI의 추론 능력을 클라우드 API로 가볍게 빌려오는 방식입니다.
이 구조 덕분에 사내 보안 가이드라인을 준수하면서도 AI 기능을 쓸 수 있습니다. ChatGPT나 Gemini에서 "기밀 문서를 올려도 되나요?"라는 질문이 항상 따라다닌다면, 로컬독스는 그 걱정을 구조적으로 해소한 제품이에요.
강점 6: 모호한 질문도 알아서 좁혀갑니다
일반 검색 도구는 질문이 애매하면 "검색 결과 없음"을 띄우거나 엉뚱한 결과를 줍니다. 로컬독스는 다르게 동작해요.
질문이 불명확할 때 스스로 되물으며 정답을 좁혀갑니다. "작년 기준인가요, 올해 개정안 기준인가요?", "A사와 B사 중 어느 쪽 계약을 말씀하시나요?" 같은 식으로요. 이건 일반 검색 도구가 아니라 업무를 이해하는 에이전트에 가깝습니다. 특히 동일한 주제의 문서가 여러 버전으로 존재하는 법조·공공 업무 환경에서 이 기능의 가치가 크게 느껴집니다.
로컬독스의 아쉬운 점도 있습니다
로컬독스의 강력한 보안성과 문서 처리 능력 이면에는 실무 환경에 따라 한계로 다가올 수 있는 뚜렷한 단점들도 존재합니다.
데스크탑 환경에 종속됩니다 (웹/모바일 미지원): 로컬독스는 현재 데스크탑 설치형 앱으로만 제공되며, 웹 브라우저나 모바일 앱을 통한 접근을 지원하지 않습니다. 기밀 문서를 내 PC 안에서만 안전하게 처리하기 위해 선택한 구조적 특징이지만, 이로 인해 '이동성'과 '접근성'에서 큰 제약이 발생합니다. 외근 중 스마트폰이나 태블릿으로 급하게 계약서 조항을 확인해야 하거나, 집과 사무실 PC를 오가며 작업해야 하는 유연한 스마트 워크 환경에는 적합하지 않습니다.
PC 사양을 타고, 초기 로딩이 다소 무겁습니다: 문서를 외부 서버로 보내지 않고 내 PC의 자원(CPU, RAM 등)을 활용해 자체적으로 분석하고 색인하는 과정을 거칩니다. 따라서 처음 앱을 실행하거나 수십 개의 대용량 문서를 한 번에 불러올 때, 클라우드 기반 AI들보다 로딩 시간이 길게 느껴질 수 있습니다. 즉각적이고 가벼운 반응 속도를 기대하셨다면 다소 무겁고 답답하다는 인상을 받을 수 있으며, 사용 중인 데스크탑의 하드웨어 성능에 따라 쾌적함의 편차가 발생하게 됩니다.
도구별 핵심 비교 한눈에 보기
비교 항목 | ChatGPT | Gemini | NotebookLM | 로컬독스 |
|---|---|---|---|---|
HWP/HWPX 지원 | ✅ 2026년 4월 공식 지원 | ✅ 이전부터 지원 | ❌ 미지원 (변환 필요) | ✅ 공식 지원 |
원문 뷰어 제공 | ❌ 없음 | ❌ 없음 | ❌ 없음 | ✅ 전용 뷰어 내장 |
문장별 출처 하이라이트 | ⚠️ 불안정 | ⚠️ 불안정 | ⚠️ 소스 링크 제공 (원문 하이라이트 없음) | ✅ 원문 하이라이트 |
복잡한 서식 처리 | ⚠️ 표·각주 누락 가능 | ⚠️ 파일에 따라 편차 | ⚠️ 긴 문서 후반부 불완전 가능 | ✅ HWP 전용 처리 |
대용량·다수 문서 | ❌ 메시지당 최대 10개 | ❌ 프롬프트당 최대 10개 | ⚠️ 노트북당 최대 50개 (Plus 300개) | ✅ 100개 이상, 2~3GB |
보안 (문서 외부 전송) | ❌ OpenAI 클라우드 전송 | ❌ Google 클라우드 전송 | ❌ Google 클라우드 전송 | ✅ 로컬 처리, 원본 미전송 |
즉시 사용 편의성 | ✅ 즉시 | ✅ 즉시 | ✅ 즉시 | ⚠️ 설치 필요, 초기 로딩 있음 |
정리하면, "NotebookLM은 HWP를 인식하나?"에 대한 현실적인 답은 이렇습니다
NotebookLM은 현재 HWP·HWPX를 공식 지원하지 않습니다. PDF 변환 우회는 가능하지만, 서식 손실과 매번 반복되는 변환 작업은 실무 부담이 됩니다.
HWP를 직접 지원하는 AI 도구를 원한다면 ChatGPT(2026년 4월~)와 Gemini가 선택지에 오릅니다. 두 도구 모두 즉시 쓸 수 있다는 장점이 있지만, 원문 뷰어가 없어 검증이 불편하고, 파일이 외부 클라우드로 전송되며, 복잡한 서식의 HWP는 인식 품질이 들쭉날쭉할 수 있다는 공통적인 한계가 있어요.
그 한계를 넘어서야 하는 상황, 즉 단 하나의 조항도 놓칠 수 없는 법률 문서 검토, 기밀 계약서를 외부로 보낼 수 없는 보안 요건, 수십 건의 문서를 한꺼번에 교차 분석해야 하는 업무라면, 로컬독스가 현재 시점에서 가장 직접적인 대안입니다.
HWP를 변환 없이 올리고, 원문 뷰어에서 출처 문장을 눈으로 확인하고, 기밀 문서가 내 PC 밖으로 나가지 않는 구조. 이 세 가지가 동시에 필요하다면, 로컬독스가 답입니다.
여러분의 필요에 맞는 현명한 도구 선택으로 업무 생산성을 높이시길 바랍니다.
참고자료
Add or discover new sources for your notebook - NotebookLM Help
NotebookLM adds Deep Research and support for more source types - Google Blog
New ways to customize and interact with your content in NotebookLM - Google Workspace Updates
OpenAI Adds Support for HWP, HWPX Document Formats in ChatGPT - THE ELEC
ChatGPT can now read Korea's HWP documents - The Korea Herald