의뢰인 문서를 AI에 학습시키지 않고 챗GPT를 쓰고 싶으신가요?기밀 유지에 특화된 법률 증거검색 AI, 로컬독스
밤 11시, 마감 전날 밤의 흔한 풍경
내일 오전 10시가 기일입니다.
수백 페이지짜리 계약서 더미 속 어딘가에 위약금 조항이 있는데, 벌써 두 시간째 찾고 있습니다. 눈은 충혈되고, 커피는 식었습니다.
결국 손이 챗GPT로 향합니다.
PDF를 올리고 "위약금 관련 조항 찾아줘"라고 입력하면, 5초 만에 원하는 내용이 나옵니다. 잠깐의 죄책감이 들지만, 어차피 한 번만이니까, 내일 기일이 끝나면 다시는 안 쓰겠다고, 그렇게 넘어갑니다.
그런데 그 문서, 정말 안전하게 처리되고 있을까요?
챗GPT 개인 계정에 업로드한 문서는 AI 학습에 사용됩니다.
챗GPT에 파일을 올리는 순간 무슨 일이 일어나는지, 정확하게 짚어드릴게요.
챗GPT 무료(Free) 계정과 유료(Plus) 계정은 기본 설정 상태에서 사용자가 입력한 대화와 업로드한 파일이 OpenAI의 미래 모델 학습에 활용될 수 있습니다. OpenAI의 이용약관은 이를 명시하고 있으며, 설정 메뉴에서 '대화 기록 및 학습' 옵션을 직접 꺼야만 학습 활용을 막을 수 있습니다.
문제는, 이 설정을 끄는 사람이 거의 없다는 것입니다. 밤 11시에 마감을 앞두고 그 메뉴를 찾아 들어갈 여유가 있는 변호사는 많지 않습니다.
Google Gemini 개인 계정도 마찬가지입니다. 개인 Google 계정으로 Gemini를 사용할 경우, 입력한 프롬프트와 대화 내용이 Google의 서비스 품질 개선 및 AI 모델 학습에 활용될 수 있다고 정책에 명시되어 있습니다.
정리하면 이렇습니다.
계정 유형 | AI 학습에 사용되나요? | 의뢰인 기밀 안전한가요? |
|---|---|---|
챗GPT 무료(Free) | ✅ 사용됨 (기본값) | ❌ 위험 |
챗GPT 유료(Plus) | ✅ 사용됨 (기본값, 설정 변경 가능) | ⚠️ 설정 끄면 학습 제외, 그러나 서버 전송은 여전히 발생 |
Gemini 개인 계정 | ✅ 사용됨 | ❌ 위험 |
의뢰인이 맡긴 계약서, 소장, 내부 이메일이 미래의 챗GPT를 학습시키는 데이터로 쓰일 수 있다는 것입니다. 이것이 단순한 '서버에 저장된다'는 문제를 넘어서는 이유입니다.
"그럼 엔터프라이즈 플랜으로 업그레이드하면 되지 않나요?"
이 사실을 알게 된 분들이 가장 먼저 찾는 해결책이 있습니다. 바로 챗GPT Enterprise 또는 Gemini Workspace 기업용 플랜으로 업그레이드하는 것입니다.
맞습니다. 엔터프라이즈 플랜은 학습에 데이터를 사용하지 않겠다고 약속합니다. 보안 정책도 훨씬 강화되어 있습니다.
그런데 현실을 보면 이야기가 달라집니다.
항목 | 현실 |
|---|---|
챗GPT Enterprise 비용 | 공식 공개 가격 없음, 기업 규모에 따라 협의. 업계 추정 1인당 월 $30~$60 이상, 최소 계약 인원 조건 있음 |
Google Workspace (Gemini 포함) | Business Starter 기준 1인당 월 $7~, Gemini 고급 기능은 별도 Add-on 구독 필요 |
도입 절차 | IT팀 검토 → 법무 계약 검토 → 경영진 승인 → 구매팀 발주 → 계정 셋업까지 수 주~수개월 소요 |
문서가 외부 서버에 전송되는 것 | 학습에는 사용 안 되지만, 여전히 해당 회사의 클라우드 인프라를 경유함 |
로펌 소속 변호사 개인이나 사내 법무팀 담당자가 혼자서 결정하고 즉시 쓸 수 있는 선택지가 아닙니다. 회사 차원의 계약이 필요하고, 비용도 만만치 않습니다.
그리고 결정적으로 엔터프라이즈 플랜을 써도, 의뢰인 문서는 여전히 외부 서버를 경유합니다. 학습에 쓰이지 않는다는 것과, 외부로 전혀 나가지 않는다는 것은 전혀 다른 이야기입니다.
"그럼 API를 직접 사용하면 되지 않나요?"
조금 더 기술에 익숙한 분들이 두 번째로 찾는 방법이 있습니다. 바로 ChatGPT API 또는 Gemini API를 직접 사용하는 것입니다.
API 방식은 실제로 학습에 활용되지 않습니다. 데이터 처리 정책도 훨씬 명확하고, 보안 측면에서도 일반 계정보다 낫습니다.
그런데 'API를 쓴다'는 것이 실제로 어떤 의미인지 생각해보면 이야기가 달라집니다.
OpenAI 개발자 계정 생성 및 API 키 발급
PDF 파싱 라이브러리 설치 (PyMuPDF, pdfplumber 등)
텍스트 추출 코드 작성
API 호출 코드 작성 및 토큰 관리
로컬 환경 구축 및 테스트
결과를 볼 수 있는 인터페이스 구성
실제로 요즘은 '바이브 코딩'처럼 AI의 도움으로 코드를 거의 몰라도 간단한 도구를 만들 수 있다는 이야기도 많이 들리죠. 인터넷에는 "10분 만에 나만의 문서 검색 도구 만들기" 같은 콘텐츠도 넘쳐납니다.
그런데 실제로 해보면 이야기가 다릅니다.
API 키 발급과 환경 설정에서부터 막히고, 법률 사무소 내부 보안 정책과 충돌하는 지점이 생기고, 막상 돌아가는 것처럼 보여도 PDF 파싱이 제대로 안 되거나, 한글 문서에서 글자가 깨지거나, 특정 파일 형식에서 오류가 납니다. 버그를 하나 잡으면 다른 버그가 나오고, 결국 "10분짜리"가 몇 개월짜리 사이드 프로젝트가 됩니다.
그리고 근본적인 질문 하나를 드리고 싶습니다. 내일 기일이 있는 변호사가, 법률 업무를 하면서 언제 이걸 직접 만들고 있어야 하나요?
도구를 만드는 것 자체가 목적이 아니라면, 지금 당장 쓸 수 있는 도구가 훨씬 현실적인 선택입니다.
선택지 | 학습 사용 | 즉시 사용 가능 | 비용 합리적 | 문서 외부 미전송 |
|---|---|---|---|---|
챗GPT / Gemini 개인 계정 | ✅ | ✅ | ✅ | ❌ |
엔터프라이즈 플랜 | ❌ | ❌ (도입 수개월) | ❌ (고비용) | ❌ (경유는 함) |
API 직접 사용 | ❌ | ❌ (개발자 필요) | ⚠️ | ❌ (서버 전송됨) |
로컬독스 | ❌ | ✅ | ✅ | ✅ |
로컬독스: 문서가 내 컴퓨터 밖으로 나가지 않는 법률 특화 증거검색 AI
로컬독스는 이 막힌 길들 사이에서 만들어진 증거검색 AI입니다.
구조 자체가 위의 선택지들과 다릅니다. 챗GPT처럼 문서를 외부 서버로 보내지 않습니다. API처럼 개발자가 세팅해야 쓸 수 있는 도구도 아닙니다. 엔터프라이즈 플랜처럼 회사 차원의 계약이 필요하지도 않습니다.
문서를 읽고, 관련 내용을 찾고, 답변을 준비하는 모든 과정이 내 컴퓨터 안에서 이루어집니다. 마지막에 답변을 자연스럽게 다듬을 때만, 의뢰인 정보가 포함되지 않은 상태로 AI의 언어 처리 능력을 잠깐 빌려올 뿐입니다.
결과적으로 OpenAI도, Google도, 그 어떤 외부 서버도 의뢰인 문서의 내용을 볼 수 없습니다.
법률 업무에 꼭 맞는 로컬독스만의 3가지 경험
① 출처가 명확한 답변만 합니다
"계약서 8페이지 제3조 2항에 따르면 위약금 기준은 계약 금액의 10%입니다."
로컬독스는 답변과 함께 반드시 어느 문서의 몇 페이지에서 찾은 내용인지를 제시합니다. 클릭 한 번으로 원문을 직접 눈으로 확인할 수 있습니다. 문서에 없는 내용은 꾸며내지 않습니다. "해당 문서에서는 관련 내용을 찾을 수 없습니다"라고 명확히 선을 긋습니다.
법원에 존재하지 않는 판례를 인용한 준비서면을 제출하는 일, 로컬독스에서는 일어나지 않습니다.
② 표, 수식, 이미지까지 수치 하나 놓치지 않습니다
손해배상 내역이 담긴 표, 지분 구조 도식, 스캔본 안에 적힌 금액. 로컬독스는 복잡한 형식의 자료도 완벽하게 인식하고 수치를 정확하게 추출합니다. 여러 문서에 흩어진 금액 항목들을 종합해 합계를 계산하는 것도 단숨에 해냅니다.
③ 수백 페이지, 수십 개 파일도 한 번에 검색합니다
계약서 10개, 진술서 30개, 판결문 5개를 동시에 던져주세요. 사람이 며칠 걸릴 분량을 단숨에 훑어보고, 여러 문서에 걸쳐 흩어진 맥락을 종합해 핵심만 짚어냅니다. 100개 이상, 2~3GB 대용량도 거뜬합니다.
정리: 법률 전문가에게 현실적인 선택지는 하나입니다
다시 밤 11시로 돌아가 보겠습니다.
내일 기일이 있고, 마감 전날 밤 의뢰인 계약서를 분석해야 합니다. 이제 어떤 선택을 하실 건가요?
❌ 챗GPT 개인 계정 — 빠르고 편하지만, 의뢰인 문서가 AI 학습 데이터로 쓰일 수 있습니다.
❌ 엔터프라이즈 플랜 — 학습에는 안 쓰이지만, 비싸고 도입에 수개월이 걸립니다. 그리고 문서는 여전히 외부 서버를 경유합니다.
❌ API 직접 사용 — 기술적으로는 안전하지만, 개발자 없이는 쓸 수 없습니다.
✅ 로컬독스 — 지금 즉시, 저비용으로, 문서는 단 한 글자도 PC 밖으로 나가지 않습니다.
기밀을 지키면서도 AI를 쓸 수 있는 방법, 로컬독스가 그 자리에 있습니다.