
한국에서 받는 문서의 절반은 HWP다. AI는 그걸 못 읽는다. kordoc은 그 격차를 메운다. HWP 3.x/5.x, HWPX, HWPML, PDF, XLS(BIFF8), XLSX, DOCX — 관공서에서 쏟아지는 모든 형식을 Markdown으로 변환한다. AI가 가장 잘 읽는 형태로.
▍왜 만들었나
공공·법무·세무·교육, 한국에서 일하는 거의 모든 사람은 HWP에 갇혀 있다. 외산 도구는 HWP를 안 다루고, 한국산 도구는 AI 통합이 없다. kordoc은 그 둘 사이를 잇는다. 광진구청 7년차 주무관이 매일 쓰던 노가다를 라이브러리로 만들었다.
▍핵심 기능
• 어떤 문서든 Markdown — HWP3(1996~2002 구버전)·HWP5·HWPX·HWPML· PDF·XLS·XLSX·DOCX 모두 지원 • 복잡한 표 완벽 복원 — 선이 없는 PDF 표, 병합된 HWP 표도 정확한 마크다운 테이블로 • 신구대조표 자동 생성 — 두 문서의 차이를 한눈에. HWP↔HWPX 교차 비교 가능 • Markdown → HWPX 역변환 — AI가 작성한 보고서를 다시 한컴 양식으로 • 공문서 양식 자동 채우기 — 신청서·보고서 빈칸에 값을 넣으면 원본 서식 100% 보존 • AI 에이전트 연동 (MCP) — Claude, Cursor에서 kordoc 직접 호출
▍보안과 품질
XXE·SSRF·decompression bomb 등 7건 일괄 차단. macOS 한컴오피스 호환 HWPX 생성. 1996년 HWP 3.0까지 텍스트 추출 — 오래된 판결문·공문서도 검색 인덱싱 가능.
▍사용
대화형 30초 설치: npx -y kordoc setup → AI 클라이언트 자동 감지·
설정 패치. CLI도 즉시 가능: npx kordoc 보고서.hwp
오픈소스 MIT · GitHub chrisryugj/kordoc · npm kordoc
토론 · 0