문서 분산 관리
항공·호텔·여행 부서의 IRREGULAR 손실비용 문서가 그룹웨어 전자결재에 산재하여 통합 현황 파악 불가
수동 취합 비효율
월별 손실 현황 파악을 위해 담당자가 직접 문서를 하나씩 열어 금액과 사유를 수동으로 집계 (3~4시간 소요)
비정형 문서 구조
호텔·ADM·ACM·여행 4가지 보고서 양식이 각기 달라 단순 파싱으로는 손실 여부 판별 불가
호텔 IRREGULAR
→ 상품 유형: 호텔
■ 손실비용 체크박스 확인 + 손실비용 행의 KRW 금액 추출
ADM/미수 IRREGULAR
→ 상품 유형: 항공
비용처리 항목에서 회사 부담 금액 > 0 여부 판별
ACM IRREGULAR
→ 상품 유형: 항공
ADM과 동일 구조. 발생금액 및 회사 부담 비율 확인. PG 재인증 복구건은 손실 X
여행 IRREGULAR
→ 상품 유형: 투어&티켓
■ 손실비용 또는 "손실 발생" 문구. "손실 x" 명시 시 제외
🔐 로그인 확인
- Playwright로 그룹웨어 접속
- 다이얼로그(alert) 자동 처리
- 미로그인 시 사용자에게 안내 후 대기
📋 목록 수집
- Title.asp에서 총 페이지 수 확인
- List.asp 순회 (browser_evaluate)
- 2026년 필터 + 중복제거(docNum Set)
🤖 AI 문서 분석
- View.asp 개별 접근
- body.innerText 추출
- Claude AI 손실 여부·금액·사유 판별
💾 결과 저장
- 손실 건만 필터링
- CSV 저장 (UTF-8-BOM)
- 상품유형·금액·사유 정리
Windows Task Scheduler
매월 1일 09:00 자동 트리거
Playwright Headless
저장된 쿠키로 그룹웨어 자동 로그인 → 141건 목록 수집
Claude API (Haiku)
각 문서 텍스트 전달 → 손실 여부·금액·사유 JSON 응답
Google Sheets 저장
상품유형별 시트 자동 업데이트, 월별 손실 추이 차트 갱신
담당자 알림
이메일 / Slack으로 수집 완료 + 손실 현황 요약 발송
업무 시간 대폭 절감
월별 손실 현황 취합에 소요되던 수동 작업 시간을 자동화로 대체
정확도 향상
AI가 비정형 문서의 맥락을 이해하여 수동 취합 시 발생하는 누락·오류 방지
손실 추이 분석
월별 데이터 누적으로 상품 유형별·담당자별 손실 패턴 파악 및 원인 분석 가능
즉시 현황 파악
수집 즉시 항공/호텔/투어&티켓 상품 유형별 손실 현황을 관계자에게 자동 공유
Phase A — Claude 스킬 구현 (/collect-irr)
Playwright MCP 기반 수집·AI 판별·CSV 저장. 수동 실행으로 즉시 사용 가능
Phase B — 첫 번째 수집 실행 및 검증
141건 문서 AI 판별 완료, CSV 결과 수동 검증, 판별 정확도 확인
Phase C — Python 스크립트 분리
Claude 스킬 의존성 제거, standalone Python 스크립트로 포팅, 단위 테스트 작성
Phase D — Claude API 통합 + 서버 자동화
anthropic SDK 연동, 쿠키 자동 로그인, Google Sheets 저장, Task Scheduler 등록