Portfolio

AI 에이전트 하네스 / OPS

2025 ~ 현재

'AI로 코딩한다'를 측정·증거 기반의, 가드레일이 강제된 재현 가능한 엔지니어링으로 바꾼 자체 운영 체계. 1인 다수 SaaS 병렬 출하의 기반.

Claude CodeBash/Python 훅FastAPIDockerNAS

외부 플러그인 생태계는 도입·통합한 서드파티이며, 자체 저작물은 프로토콜·도메인 문서·훅·재발추적 엔진·메모리·운영 콘솔입니다.

문제 · 맥락

AI 코딩 에이전트는 강력하지만, 방치하면 추측으로 같은 실수를 반복하고, 컨텍스트를 낭비하며, 프로젝트마다 아키텍처가 흔들립니다. '한 명이 여러 프로덕션 서비스를 안정적으로 운영'하려면 AI의 행동을 규칙으로 명문화하고, 위반을 코드로 차단하는 운영 체계가 필요했습니다.

핵심 설계 결정

행동 프로토콜 + 도메인 라우팅

글로벌 'AI Command Protocol'
분석 우선·추측 금지, 기획 1회 승인 후 자동 진행, grep 먼저, 증상 역행 진단(Step 0) 등 18개 강제 규칙.
요청 유형별 9개 도메인 문서 라우팅(진단·기획·실행·검증·데이터·프론트·성능·배포·하네스감사)
필요한 문서만 로드해 컨텍스트 예산 관리.

규칙을 코드로 강제하는 훅 시스템

fix-failure-counter(UserPromptSubmit)
실패 신호를 감지하되 직전 turn의 실제 편집/배포를 transcript로 교차 검증한 경우만 카운트(false positive 방지).
check-fix-mode(PreToolUse)
카운터가 2 이상이면 Edit/Write를 물리적으로 deny → 측정 모드 강제(추측 fix 3회 차단).
pre-edit-gate
scope 감사가 '구조적 수정 필요'로 판정하고 미승인이면 편집 차단, 계획 등록 시 해제.
모든 훅은 fail-open(실패 시 작업을 막지 않음).

프로젝트 교차 재발 추적 · 에스컬레이션 엔진

lessons-learned(과거 사건 누적) + 재발 카운터 + scope-audit 패턴 레지스트리.
1회=기록 / 2회=기획 재발 경고+전수조사 확대 / 3회+=편집 물리 차단의 자동 에스컬레이션 → 회귀 결함 사전 차단.

세션 간 영속 메모리 + 운영 콘솔

사용자 피드백·인프라 좌표·프로젝트 패턴을 메모리 파일 + 인덱스로 규칙화 → 반복 요청 시 재분석 없이 재활용.
FastAPI + Tailwind + Docker로 gate/인시던트/요청 로그를 /api/bootstrap·SSE 대시보드로 시각화, NAS 배포.
v1/v2 동시 운영 + 60초 롤백을 보장하는 cutover 플랜까지 문서화 → 자체 도구를 프로덕트처럼 운영.

성과 · 지표

AI Agent OPS / Agentic Workflow 설계
라우팅·승인·에스컬레이션을 가진 에이전트 운영체계를 설계·운영.
Guardrail / Eval 엔지니어링
정량 임계값 기반 가드레일을 훅으로 강제, 인시던트 누적·전수조사는 곧 eval/regression 사고방식.
프로덕션 조직 적용
같은 사고방식을 위밋 루티팀에서 Roouty Ops Assistant로 실제 적용.

한 줄 요약

Claude Code 위에 자체 AI 운영 하네스를 구축 — 'fix 2회 실패 시 편집 차단', '3회 재발 시 구조적 수정 강제' 등 가드레일을 훅으로 강제하고, 재발 추적 엔진·영속 메모리·FastAPI 운영 콘솔까지 갖춰 1인이 다수 프로덕션 SaaS를 일관 아키텍처로 출하.

← 다른 프로젝트 보기