📋 기획서 v1.0 · 2026년 4월

IRR 손실비용
수집 자동화 시스템

그룹웨어 IRREGULAR 보고서에서 손실비용 처리 건을 자동으로 수집·분석하여 월별 손실 현황을 즉시 파악

141건
2026년 수집 대상 문서
4종
비정형 문서 유형
95%↓
처리 시간 절감 목표
AI
비정형 문서 자동 판별
⚠️ 문제 정의
🗂️

문서 분산 관리

항공·호텔·여행 부서의 IRREGULAR 손실비용 문서가 그룹웨어 전자결재에 산재하여 통합 현황 파악 불가

⏱️

수동 취합 비효율

월별 손실 현황 파악을 위해 담당자가 직접 문서를 하나씩 열어 금액과 사유를 수동으로 집계 (3~4시간 소요)

📄

비정형 문서 구조

호텔·ADM·ACM·여행 4가지 보고서 양식이 각기 달라 단순 파싱으로는 손실 여부 판별 불가

📊 수집 대상 현황
141
2026년 IRR 문서 (중복제거)
2
검색 결과 페이지 (100건/페이지)
4
문서 유형 (호텔/ADM/ACM/여행)
3
상품 분류 (항공/호텔/투어&티켓)
📁 문서 유형별 손실 판별 기준
🏨

호텔 IRREGULAR

→ 상품 유형: 호텔

■ 손실비용 체크박스 확인 + 손실비용 행의 KRW 금액 추출

✈️

ADM/미수 IRREGULAR

→ 상품 유형: 항공

비용처리 항목에서 회사 부담 금액 > 0 여부 판별

✈️

ACM IRREGULAR

→ 상품 유형: 항공

ADM과 동일 구조. 발생금액 및 회사 부담 비율 확인. PG 재인증 복구건은 손실 X

🗺️

여행 IRREGULAR

→ 상품 유형: 투어&티켓

■ 손실비용 또는 "손실 발생" 문구. "손실 x" 명시 시 제외

⚙️ 현재 구현: Claude 스킬 수집 프로세스
Phase 0

🔐 로그인 확인

  • Playwright로 그룹웨어 접속
  • 다이얼로그(alert) 자동 처리
  • 미로그인 시 사용자에게 안내 후 대기
Phase 1

📋 목록 수집

  • Title.asp에서 총 페이지 수 확인
  • List.asp 순회 (browser_evaluate)
  • 2026년 필터 + 중복제거(docNum Set)
Phase 2

🤖 AI 문서 분석

  • View.asp 개별 접근
  • body.innerText 추출
  • Claude AI 손실 여부·금액·사유 판별
Phase 3

💾 결과 저장

  • 손실 건만 필터링
  • CSV 저장 (UTF-8-BOM)
  • 상품유형·금액·사유 정리
🔄 현재 vs 미래 아키텍처 비교
🎯 현재 — Claude 스킬 방식
AI 판별
Claude 자신이 직접 분석
브라우저
Playwright MCP (headed, 가시적)
로그인
사용자 수동 로그인
트리거
/collect-irr 수동 실행
결과
로컬 CSV 파일 저장
✅ 별도 서버 불필요
✅ 비정형 문서 직접 이해
✅ 즉시 사용 가능
⚠️ 수동 로그인 필요
⚠️ 완전 자동화 한계
⚠️ 세션 종료 시 중단
🚀 미래 — 서버 자동화
AI 판별
Claude API (Haiku) 호출
브라우저
Playwright headless
로그인
쿠키 저장 자동 로그인
트리거
Windows Task Scheduler
결과
Google Sheets + 이메일 알림
✅ 완전 자동화
✅ 월 정기 실행
✅ 담당자 알림 발송
⚠️ Claude API 비용 발생
⚠️ 쿠키 만료 시 재발급 필요
🏗️ 미래 아키텍처 상세 플로우

Windows Task Scheduler

매월 1일 09:00 자동 트리거

스케줄러
🎭

Playwright Headless

저장된 쿠키로 그룹웨어 자동 로그인 → 141건 목록 수집

브라우저 자동화
🤖

Claude API (Haiku)

각 문서 텍스트 전달 → 손실 여부·금액·사유 JSON 응답

AI 판별
📊

Google Sheets 저장

상품유형별 시트 자동 업데이트, 월별 손실 추이 차트 갱신

데이터 저장
📬

담당자 알림

이메일 / Slack으로 수집 완료 + 손실 현황 요약 발송

알림
기대 효과
⏱️

업무 시간 대폭 절감

월별 손실 현황 취합에 소요되던 수동 작업 시간을 자동화로 대체

3~4시간/월 5분/월
🎯

정확도 향상

AI가 비정형 문서의 맥락을 이해하여 수동 취합 시 발생하는 누락·오류 방지

수동 오류 위험 AI 일관 판별
📈

손실 추이 분석

월별 데이터 누적으로 상품 유형별·담당자별 손실 패턴 파악 및 원인 분석 가능

단발 집계 추이 데이터 축적
🔔

즉시 현황 파악

수집 즉시 항공/호텔/투어&티켓 상품 유형별 손실 현황을 관계자에게 자동 공유

요청 시 수동 취합 자동 알림 수신
🛠️ 기술 스택
🎭
Playwright
브라우저 자동화
🤖
Claude API
Haiku · AI 문서 판별
🐍
Python 3.13
수집 스크립트
📊
Google Sheets
결과 저장·시각화
Task Scheduler
Windows 정기 실행
🗓️ 구현 로드맵
완료

Phase A — Claude 스킬 구현 (/collect-irr)

Playwright MCP 기반 수집·AI 판별·CSV 저장. 수동 실행으로 즉시 사용 가능

진행 중

Phase B — 첫 번째 수집 실행 및 검증

141건 문서 AI 판별 완료, CSV 결과 수동 검증, 판별 정확도 확인

예정

Phase C — Python 스크립트 분리

Claude 스킬 의존성 제거, standalone Python 스크립트로 포팅, 단위 테스트 작성

예정

Phase D — Claude API 통합 + 서버 자동화

anthropic SDK 연동, 쿠키 자동 로그인, Google Sheets 저장, Task Scheduler 등록