AgentTrace는 AI Agent의 자율 행동 과정에서 발생하는 프롬프트, 도구 호출, 데이터 접근, 외부 전송 시도를 포렌식 로그로 기록하고, SHA-256 Hash Chain과 책임 추적 그래프를 통해 사고 원인을 분석하는 시스템입니다.
AI Agent의 자율 행동에 대해 디지털 포렌식 관점의 감사 추적과 책임 소재 분석을 제공하는 시스템을 구현했습니다.
FastAPI 기반 Agent Runtime에서 발생하는 Tool Call 이벤트를 수집하고, SHA-256 Hash Chain, Risk Classification, Responsibility Classification, Causal Graph를 통해 AI Agent 행동의 무결성 검증과 사고 원인 추적을 구현했습니다.
AgentTrace는 AI Agent의 프롬프트, 도구 호출, 데이터 접근, 외부 전송 시도를 포렌식 로그로 기록하고, SHA-256 기반 증거 해시와 책임 추적 그래프를 통해 사고 원인을 분석하는 시스템입니다.
- AI Agent는 사용자를 대신해 파일, 웹, 명령 실행 도구를 호출할 수 있습니다.
- 사고 발생 시 사용자가 직접 지시한 행동인지, 문서 내부 악성 지시 때문인지, Agent가 자율적으로 수행한 행동인지 구분하기 어렵습니다.
- 따라서 Agent 행동을 감사 가능한 이벤트 단위로 기록하고, 원인 흐름을 추적하는 포렌식 시스템이 필요합니다.
- Agent 행동 로그
- Tool Call 추적
- 위험 행동 분류
- 책임 유형 분류
- Hash Chain 기반 로그 무결성 검증
- Causal Graph 생성
- Incident Report 자동 생성
User Prompt
↓
Agent Simulator
↓
Tool Wrapper
↓
Forensic Event Logger
↓
Hash Chain
↓
Risk Classifier
↓
Causal Graph Builder
↓
Incident Report Generator
- backend/app/main.py
- backend/app/agent/simulator.py
- backend/app/forensic/event_logger.py
- backend/app/reports/report_generator.py
- docs/architecture.md
- docs/threat_model.md
- docs/forensic_log_format.md
- docs/evaluation.md
pip install -r requirements.txt
uvicorn backend.app.main:app --reload --host 127.0.0.1 --port 8000docker compose up --build기본적으로 API는 http://127.0.0.1:8000에서 실행되며, 생성 리포트는 ./reports 볼륨에 유지됩니다.
pytest backend/tests -v검증 결과:
pytest backend/tests -v기준45 passed in 1.82s/health경로 응답 확인 완료/agent/run외부 전송 시나리오에서BLOCK / CRITICAL / incident report generated확인 완료
curl -X POST http://127.0.0.1:8000/agent/run \
-H "Content-Type: application/json" \
-d @examples/scenario_03_external_transfer.json- Safe Prompt
- Prompt Injection File Read
- External Transfer Attempt
- Command Execution Attempt
{
"session_id": "sess-exfil-001",
"final_response": "외부 전송 시도가 감지되어 차단되었습니다. 사고 리포트가 생성되었습니다.",
"action": "BLOCK",
"risk_level": "CRITICAL",
"incident_report_path": "reports/incident_sess-exfil-001.md"
}- 현재 Agent는 실제 LLM이 아닌 deterministic Agent Simulator 기반입니다.
- 탐지 로직은 rule/keyword 기반이며, 향후 LLM 기반 판단 보조 또는 LangGraph/LangChain Agent 연동으로 확장할 수 있습니다.
- 현재 리포트는 Markdown 기반이며, 향후 PDF 자동 생성과 React Flow 기반 책임 추적 그래프 대시보드를 추가할 수 있습니다.
- 본 프로젝트는 실제 외부 전송, 실제 명령 실행, 실제 민감 파일 접근을 수행하지 않고 Mock Tool 기반으로 안전하게 동작합니다.
AgentTrace는 AI Agent의 자율 행동 과정에서 발생하는 프롬프트, 도구 호출, 데이터 접근, 외부 전송 시도를 포렌식 로그로 기록하고, SHA-256 Hash Chain과 책임 추적 그래프를 통해 사고 원인을 분석하는 시스템입니다.