Argus

O Argus é uma plataforma de análise documental inteligente para a Defensoria Pública do Distrito Federal (DPDF), integrando o sistema Solar DPDF com serviços cognitivos da Azure para análise automatizada de documentos processuais via OCR e IA. O sistema também suporta observabilidade (Langfuse), automação de workflows (N8N) e fluxos conversacionais (FlowiseAI).

Argus OCR - README

Descrição Geral
O Argus é uma plataforma de análise documental inteligente para a Defensoria Pública do Distrito Federal (DPDF), integrando o sistema Solar DPDF com serviços cognitivos da Azure para análise automatizada de documentos processuais via OCR e IA. O sistema também suporta observabilidade (Langfuse), automação de workflows (N8N) e fluxos conversacionais (FlowiseAI).

Funcionalidades Principais
- Processamento e análise de documentos processuais (PDF, DOCX, etc.)
- Integração com Solar DPDF para busca e recuperação de processos e documentos
- OCR avançado com Azure Document Intelligence
- Análise inteligente de conteúdo com Azure OpenAI (GPT-4)
- Indexação e busca semântica com Azure Cognitive Search
- Observabilidade e rastreamento de operações de LLM com Langfuse
- Automação de workflows com N8N
- Construção de fluxos conversacionais com FlowiseAI
- Armazenamento seguro em Azure Storage

Módulos e Endpoints Principais

Integração com Solar DPDF
- GET /api/v1/solar/processos — Buscar processos disponíveis
- GET /api/v1/solar/processos/{processo_id} — Detalhes completos do processo
- GET /api/v1/solar/processos/{processo_id}/documentos — Listar documentos do processo
- GET /api/v1/solar/processos/{processo_id}/eventos — Histórico de eventos
- GET /api/v1/solar/processos/{processo_id}/partes — Identificar partes do processo

Processamento de Documentos
- POST /api/v1/documents/upload — Upload ou download de documentos
- POST /api/v1/ocr/analyze — Extração de texto com OCR
- POST /api/v1/ai/documents/analyze — Análise inteligente de documentos (resumo, pontos-chave, etc.)
- POST /api/v1/search/index — Indexação para busca semântica
- GET /api/v1/documents/{document_id}/export — Exportação de resultados (PDF, DOCX, JSON)

Integração com Langfuse
- Rastreamento de operações de LLM
- POST /api/v1/feedback — Avaliação de qualidade das análises

Integração com FlowiseAI
- Configuração de fluxos conversacionais
- POST /api/v1/chat/query — Chatbot de consulta processual
- POST /api/v1/drafts/generate — Geração de minutas com IA

Integração com N8N
- Automação de workflow de análise
- Notificações automáticas
- Integração com sistemas externos via webhooks

Processamento Assíncrono
- Processamento em background com Celery
- Status de tarefas: GET /api/v1/tasks/{task_id}/status

Estrutura do Projeto

argus-backend/
├── main.py
├── api/
│   └── v1/
│       ├── routes_ocr.py
│       ├── routes_user.py
│       └── ...
├── services/
│   ├── ocr_service.py
│   ├── document_service.py
│   └── ...
├── repositories/
│   ├── document_repository.py
│   └── ...
├── models/
│   ├── document_model.py
│   └── ...
├── schemas/
│   ├── document_schema.py
│   └── ...
├── core/
│   ├── config.py
│   ├── database.py
│   └── security.py
└── workers/
    └── ocr_worker.py

Tecnologias Utilizadas
- FastAPI — Backend web
- SQLAlchemy — ORM
- PostgreSQL — Banco de dados
- Pydantic — Validação de dados
- Celery — Processamento assíncrono
- Azure Document Intelligence — OCR
- Azure OpenAI — IA para análise
- Azure Cognitive Search — Busca semântica
- Langfuse — Observabilidade de LLM
- N8N — Automação de workflows
- FlowiseAI — Fluxos conversacionais
- Azure Storage — Armazenamento seguro

Arquitetura de Integração

Frontend (React) → Argus Backend (FastAPI) → Solar DPDF, Azure Document Intelligence, Azure OpenAI, Azure Cognitive Search, PostgreSQL, Azure Storage, Langfuse, FlowiseAI, N8N

Como Executar

Subir tudo:
chmod +x ./run.sh
./run.sh

Parar e limpar:
chmod +x ./stop.sh
./stop.sh

Acessar endpoints de teste:
http://localhost:8000/docs
http://localhost:8000/api/v1/health

Observações
- Sempre utilize paginação e filtros ao consumir endpoints do Solar DPDF devido ao grande volume de dados.
- O sistema é extensível para novas integrações e fluxos de automação.
- Consulte o documento de requisitos funcionais para detalhes completos de cada módulo.

Argus Requisitos - OCR

Documento de Requisitos - Sistema Argus
Análise Documental Inteligente para Defensoria Pública

Versão: 1.0
Projeto: Argus + Solar DPDF + Azure + Integrações

1. VISÃO GERAL DO SISTEMA

Objetivo:
O sistema Argus é uma plataforma de análise documental inteligente desenvolvida para a Defensoria Pública do Distrito Federal (DPDF), que integra o sistema Solar DPDF com serviços cognitivos da Azure para proporcionar análise automatizada de documentos processuais através de OCR e IA, com suporte a observabilidade (Langfuse), automação de workflows (N8N) e construção de fluxos conversacionais (FlowiseAI).

Escopo:
- Processamento e análise de documentos processuais (PDF, DOCX, etc.)
- Integração com Solar DPDF para busca e recuperação de processos e documentos
- OCR avançado utilizando Azure Document Intelligence
- Análise inteligente de conteúdo com Azure OpenAI (GPT-4)
- Indexação e busca com Azure Cognitive Search
- Observabilidade e rastreamento de operações de LLM com Langfuse
- Automação de workflows com N8N
- Construção de fluxos conversacionais com FlowiseAI
- Armazenamento seguro em Azure Storage

2. REQUISITOS FUNCIONAIS (Principais)

Módulo de Integração com Solar DPDF
- Buscar processos disponíveis: GET /api/v1/solar/processos
- Obter detalhes completos do processo: GET /api/v1/solar/processos/{processo_id}
- Listar documentos do processo: GET /api/v1/solar/processos/{processo_id}/documentos
- Obter histórico de eventos do processo: GET /api/v1/solar/processos/{processo_id}/eventos
- Identificar partes do processo: GET /api/v1/solar/processos/{processo_id}/partes

Módulo de Processamento de Documentos
- Download de documentos: POST /api/v1/documents/upload
- Extração de texto com OCR: POST /api/v1/ocr/analyze
- Análise inteligente de documentos: POST /api/v1/ai/documents/analyze
- Armazenamento de resultados: Azure Storage + PostgreSQL
- Indexação para busca: POST /api/v1/search/index
- Exportação de resultados: GET /api/v1/documents/{document_id}/export

Módulo de Integração com Langfuse
- Rastreamento de operações de LLM
- Avaliação de qualidade de respostas: POST /api/v1/feedback
- Análise de custos de IA

Módulo de Integração com FlowiseAI
- Configuração de fluxos conversacionais
- Chatbot de consulta processual: POST /api/v1/chat/query
- Geração de minutas com IA: POST /api/v1/drafts/generate

Módulo de Integração com N8N
- Automação de workflow de análise
- Notificações automáticas
- Integração com sistemas externos via webhooks: POST /api/v1/webhooks/{webhook_id}

Módulo de Processamento Assíncrono
- Processamento em background com Celery
- Status de tarefas: GET /api/v1/tasks/{task_id}/status

3. ARQUITETURA DE INTEGRAÇÃO

Frontend (React) → Argus Backend (FastAPI) → Solar DPDF, Azure Document Intelligence, Azure OpenAI, Azure Cognitive Search, PostgreSQL, Azure Storage, Langfuse, FlowiseAI, N8N

4. OBSERVAÇÕES
- Sempre utilize paginação e filtros ao consumir endpoints do Solar DPDF devido ao grande volume de dados.
- O sistema é extensível para novas integrações e fluxos de automação.
- Consulte o documento de requisitos funcionais para detalhes completos de cada módulo.