Skip to content

treasonking/AI_Agent_Behavioral_Forensics_Accountability_Tracking_System

Repository files navigation

CI

AgentTrace

AgentTrace는 AI Agent의 자율 행동 과정에서 발생하는 프롬프트, 도구 호출, 데이터 접근, 외부 전송 시도를 포렌식 로그로 기록하고, SHA-256 Hash Chain과 책임 추적 그래프를 통해 사고 원인을 분석하는 시스템입니다.

AI Agent의 자율 행동에 대해 디지털 포렌식 관점의 감사 추적과 책임 소재 분석을 제공하는 시스템을 구현했습니다.

FastAPI 기반 Agent Runtime에서 발생하는 Tool Call 이벤트를 수집하고, SHA-256 Hash Chain, Risk Classification, Responsibility Classification, Causal Graph를 통해 AI Agent 행동의 무결성 검증과 사고 원인 추적을 구현했습니다.

프로젝트 소개

AgentTrace는 AI Agent의 프롬프트, 도구 호출, 데이터 접근, 외부 전송 시도를 포렌식 로그로 기록하고, SHA-256 기반 증거 해시와 책임 추적 그래프를 통해 사고 원인을 분석하는 시스템입니다.

문제 배경

  • AI Agent는 사용자를 대신해 파일, 웹, 명령 실행 도구를 호출할 수 있습니다.
  • 사고 발생 시 사용자가 직접 지시한 행동인지, 문서 내부 악성 지시 때문인지, Agent가 자율적으로 수행한 행동인지 구분하기 어렵습니다.
  • 따라서 Agent 행동을 감사 가능한 이벤트 단위로 기록하고, 원인 흐름을 추적하는 포렌식 시스템이 필요합니다.

주요 기능

  • Agent 행동 로그
  • Tool Call 추적
  • 위험 행동 분류
  • 책임 유형 분류
  • Hash Chain 기반 로그 무결성 검증
  • Causal Graph 생성
  • Incident Report 자동 생성

아키텍처

User Prompt
↓
Agent Simulator
↓
Tool Wrapper
↓
Forensic Event Logger
↓
Hash Chain
↓
Risk Classifier
↓
Causal Graph Builder
↓
Incident Report Generator

디렉터리 개요

실행 방법

pip install -r requirements.txt
uvicorn backend.app.main:app --reload --host 127.0.0.1 --port 8000

Docker 실행

docker compose up --build

기본적으로 API는 http://127.0.0.1:8000에서 실행되며, 생성 리포트는 ./reports 볼륨에 유지됩니다.

테스트 방법

pytest backend/tests -v

검증 결과:

  • pytest backend/tests -v 기준 45 passed in 1.82s
  • /health 경로 응답 확인 완료
  • /agent/run 외부 전송 시나리오에서 BLOCK / CRITICAL / incident report generated 확인 완료

API 사용 예시

curl -X POST http://127.0.0.1:8000/agent/run \
  -H "Content-Type: application/json" \
  -d @examples/scenario_03_external_transfer.json

데모 시나리오

  • Safe Prompt
  • Prompt Injection File Read
  • External Transfer Attempt
  • Command Execution Attempt

샘플 결과물

실행 결과 예시

{
  "session_id": "sess-exfil-001",
  "final_response": "외부 전송 시도가 감지되어 차단되었습니다. 사고 리포트가 생성되었습니다.",
  "action": "BLOCK",
  "risk_level": "CRITICAL",
  "incident_report_path": "reports/incident_sess-exfil-001.md"
}

문서

현재 한계와 향후 개선

  • 현재 Agent는 실제 LLM이 아닌 deterministic Agent Simulator 기반입니다.
  • 탐지 로직은 rule/keyword 기반이며, 향후 LLM 기반 판단 보조 또는 LangGraph/LangChain Agent 연동으로 확장할 수 있습니다.
  • 현재 리포트는 Markdown 기반이며, 향후 PDF 자동 생성과 React Flow 기반 책임 추적 그래프 대시보드를 추가할 수 있습니다.
  • 본 프로젝트는 실제 외부 전송, 실제 명령 실행, 실제 민감 파일 접근을 수행하지 않고 Mock Tool 기반으로 안전하게 동작합니다.

포트폴리오 어필 문장

AgentTrace는 AI Agent의 자율 행동 과정에서 발생하는 프롬프트, 도구 호출, 데이터 접근, 외부 전송 시도를 포렌식 로그로 기록하고, SHA-256 Hash Chain과 책임 추적 그래프를 통해 사고 원인을 분석하는 시스템입니다.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors