AI Agent Architecture¶

This document describes the technical architecture of the PyFIA AI Agent system.

System Overview¶

The AI Agent provides a natural language interface to the FIA database through a modern LangGraph-based architecture.

graph TB
    subgraph "User Interface"
        CLI[AI CLI<br/>ai_interface.py]
        API[Python API]
    end

    subgraph "AI Agent Layer"
        Agent[FIAAgent<br/>agent.py<br/>~1163 lines]
        Tools[Tool Functions<br/>6 specialized tools]
        Memory[Conversation Memory<br/>SQLite checkpointer]
    end

    subgraph "Supporting Components"
        DK[Domain Knowledge<br/>domain_knowledge.py<br/>~547 lines]
        RF[Result Formatter<br/>result_formatter.py<br/>~1205 lines]
        QI[Query Interface<br/>query_interface.py<br/>~250 lines]
    end

    subgraph "External Services"
        LLM[OpenAI GPT-4o]
        DB[(DuckDB Database)]
    end

    CLI --> Agent
    API --> Agent
    Agent --> Tools
    Agent --> Memory
    Agent --> LLM
    Tools --> DK
    Tools --> QI
    Tools --> RF
    QI --> DB

    style Agent fill:#9b59b6,stroke:#fff,stroke-width:2px,color:#fff
    style LLM fill:#4a90e2,stroke:#fff,stroke-width:2px,color:#fff
    style DB fill:#34495e,stroke:#fff,stroke-width:2px,color:#fff

Core Components¶

1. FIAAgent (agent.py)¶

The main agent class using LangGraph's ReAct pattern:

class FIAAgent:
    """
    Modern AI agent for FIA natural language queries.
    - Uses create_react_agent from LangGraph
    - Automatic tool selection
    - Built-in conversation memory
    - Human-in-the-loop support
    """

Key Features: - ReAct Pattern: Reasoning and Acting in interleaved steps - Tool Selection: LLM automatically chooses appropriate tools - Memory Management: Persistent conversation history - Error Recovery: Graceful handling of failures

2. Tool Functions¶

Six specialized tools provide the agent's capabilities:

Tool	Purpose	Returns
`execute_fia_query`	Run SQL queries safely	Query results as formatted string
`get_database_schema`	Retrieve table schemas	Schema information
`get_evalid_info`	Get evaluation metadata	EVALID details and stats
`find_species_codes`	Resolve species names	Species codes and names
`get_state_codes`	State code lookups	State names and codes
`count_trees_by_criteria`	Optimized tree counting	Tree count with filters

3. Domain Knowledge (domain_knowledge.py)¶

Provides FIA expertise to the agent:

# Core knowledge functions
get_fia_concepts()          # FIA terminology
get_common_species()        # Species mappings
get_measurement_units()     # Unit definitions
validate_domain_term()      # Term validation

4. Result Formatter (result_formatter.py)¶

Rich terminal output with statistical context:

class FIAResultFormatter:
    """
    Formats query results with:
    - Statistical precision (SE, CI)
    - Reliability ratings
    - Rich tables and panels
    - Export capabilities
    """

5. Query Interface (query_interface.py)¶

Direct SQL execution with safety:

class DuckDBQueryInterface:
    """
    Safe database interaction:
    - Read-only access
    - Query validation
    - Result limiting
    - Performance monitoring
    """

Data Flow¶

Query Processing Pipeline¶

sequenceDiagram
    participant User
    participant CLI
    participant Agent
    participant LLM
    participant Tools
    participant DB
    participant Formatter

    User->>CLI: Natural language query
    CLI->>Agent: Process query
    Agent->>LLM: Analyze with system prompt
    LLM->>Agent: Tool selection + parameters
    Agent->>Tools: Execute tool(s)
    Tools->>DB: Database query
    DB-->>Tools: Raw results
    Tools-->>Agent: Processed data
    Agent->>Formatter: Format results
    Formatter-->>Agent: Rich output
    Agent-->>CLI: Final response
    CLI-->>User: Display results

Memory Flow¶

graph LR
    subgraph "Conversation Memory"
        Input[User Input] --> Memory[(SQLite DB)]
        Memory --> Context[Conversation Context]
        Context --> Agent[AI Agent]
        Agent --> Memory
    end

    subgraph "Persistence"
        Memory --> Checkpoint[Checkpoint Files]
        Checkpoint --> Resume[Resume Session]
    end

LangGraph Integration¶

ReAct Agent Pattern¶

The agent uses LangGraph's modern ReAct implementation:

from langgraph.prebuilt import create_react_agent

agent_executor = create_react_agent(
    model=llm,
    tools=tools,
    state_modifier=system_message,
    checkpointer=checkpointer
)

State Management¶

LangGraph manages agent state automatically:

Messages: Full conversation history
Tool Calls: Track what tools were used
Intermediate Steps: Reasoning process
Final Answer: Formatted response

Tool Execution¶

Tools are automatically executed by the framework:

graph TD
    A[User Query] --> B{Agent Decision}
    B -->|Need Schema| C[get_database_schema]
    B -->|Need Species| D[find_species_codes]
    B -->|Need Query| E[execute_fia_query]
    B -->|Need EVALID| F[get_evalid_info]

    C --> G[Combine Results]
    D --> G
    E --> G
    F --> G

    G --> H[Final Answer]

Performance Characteristics¶

Response Times¶

Operation	Typical Time	Notes
Simple query	2-5 seconds	Single tool call
Complex query	5-15 seconds	Multiple tools
Large results	10-30 seconds	Formatting overhead
First query	+2 seconds	Model loading

Resource Usage¶

Memory: ~500MB base + query results
CPU: Minimal (mostly waiting for API)
Network: OpenAI API calls only
Disk: SQLite checkpoints (~10KB/conversation)

Optimization Strategies¶

Query Caching: LRU cache for repeated queries
Tool Batching: Execute independent tools in parallel
Result Limiting: Automatic truncation of large results
Connection Pooling: Reuse database connections

Security Model¶

Access Control¶

graph TB
    subgraph "Security Layers"
        A[Input Validation] --> B[Query Sanitization]
        B --> C[Read-Only DB Access]
        C --> D[Result Filtering]
        D --> E[Output Sanitization]
    end

    subgraph "Protections"
        F[SQL Injection Prevention]
        G[Rate Limiting]
        H[API Key Management]
        I[Audit Logging]
    end

Safety Features¶

Read-Only Access: Database opened in read-only mode
Query Validation: All SQL validated before execution
Input Sanitization: Remove dangerous patterns
Result Limits: Prevent overwhelming outputs
No System Access: Tools cannot execute system commands

Extensibility¶

Adding New Tools¶

Tools are simple Python functions:

def my_custom_tool(param1: str, param2: int) -> str:
    """
    Tool description for the LLM.

    Args:
        param1: First parameter
        param2: Second parameter

    Returns:
        String result for the agent
    """
    # Implementation
    return formatted_result

# Add to tools list
tools = [...existing_tools, my_custom_tool]

Custom Formatters¶

Extend result formatting:

class CustomFormatter(FIAResultFormatter):
    def format_special_results(self, data):
        # Custom formatting logic
        return formatted_output

Integration Points¶

Custom LLMs: Swap OpenAI for other providers
Alternative Storage: Replace SQLite checkpointer
External Tools: Add web search, calculations, etc.
Custom Prompts: Modify system prompts for behavior

Deployment Architecture¶

Container Deployment¶

services:
  fia-agent:
    image: pyfia-agent:latest
    environment:
      - OPENAI_API_KEY=${OPENAI_API_KEY}
    volumes:
      - ./data:/data
      - ./checkpoints:/checkpoints
    ports:
      - "8000:8000"

Scaling Considerations¶

Horizontal Scaling: Each agent instance is independent
Load Balancing: Route queries to available instances
Shared Storage: Centralized checkpoint storage
Rate Limiting: Implement at API gateway level

Monitoring¶

Key metrics to track:

Query volume and patterns
Response times by query type
Tool usage statistics
Error rates and types
Token usage (API costs)

Future Architecture¶

Planned Enhancements¶

Streaming Responses: Real-time output as processing occurs
Multi-Modal Input: Support for images/charts
Async Processing: Non-blocking query execution
Plugin System: Dynamic tool loading
Federation: Query multiple databases

Research Directions¶

Local LLMs: On-premise deployment options
Fine-Tuning: Domain-specific model training
Query Planning: Multi-step query optimization
Caching Layer: Intelligent result caching

Summary¶

The PyFIA AI Agent architecture provides:

Modern AI Stack: Latest LangGraph patterns
Clean Separation: Tools, knowledge, and formatting
Extensible Design: Easy to add capabilities
Production Ready: Security, monitoring, scaling
User Friendly: Natural language with rich output

The architecture balances sophistication with simplicity, making forest data analysis accessible while maintaining scientific rigor.