WFS Smart Document IA — documentação automática de todo o seu ecossistema de dados

Catálogo, dicionário, lineage column-level e Base de Conhecimento multi-modal — gerados por IA generativa a partir das suas bases, datalakes, pipelines e código. Em 3 camadas (técnica, semântica e de negócio), sempre atualizado, consultável em linguagem natural.

Catálogo · Lineage · Glossário
Gerados automaticamente por IA
WFS Smart Document IA Sua documentação de dados, sempre viva
Solicitar demo Ver recursos IA generativa Lineage column-level Catalog Chat em PT-BR
O problema

Sua documentação técnica nunca vai estar pronta — mas precisa estar

Engenheiros criam tabelas, views, notebooks e pipelines em ritmo acelerado. Catalogar metadados, lineage, regras de negócio e dicionário de dados é trabalho manual, repetitivo e historicamente abandonado. O custo: onboarding lento, auditorias caras, refatorações arriscadas e decisões de negócio sobre dados sem certeza da origem.

Como funciona

Conecta, varre, interpreta com IA, publica

ConectaDBs, datalakes, repositórios, BI
VarreSchemas, código, queries, notebooks
ProfilaEstatísticas, samples, PII
InterpretaIA generativa em 3 camadas
LineageColumn-level via parser de código
PublicaPortal, PDF, Confluence, API
Recursos

Tudo o que falta em catálogos tradicionais

3 camadas de documentação

Cada objeto e campo recebe descrição técnica (DBA), semântica (analista) e de negócio (controladoria) — geradas independentes pela IA.

Lineage column-level por código

Parser cobre 25 dialetos SQL, AST Python/PySpark e notebooks. Reconstrói a origem de cada coluna até a fonte primária — sem o cliente declarar nada.

Base de Conhecimento multi-modal

Suba PDF, DOCX, planilhas, vídeo, áudio, imagens, anotações livres — a IA absorve, indexa e enriquece a documentação com o seu vocabulário.

Catalog Chat em PT-BR

Pergunte em português: "onde está o CPF?", "qual a diferença entre faturamento bruto e líquido?". Respostas com lineage e referência ao código.

Mapa de PII / LGPD

Detecção automática de CPF, CNPJ, RG, e-mail, cartão e telefone em todas as fontes — com lineage até a derivação final e owners responsáveis.

Review editorial humano + IA

A IA produz a primeira versão; owners aprovam, editam ou rejeitam numa fila Kanban. A IA aprende com cada decisão e se ajusta ao vocabulário interno.

Cobertura total de objetos

Tabelas, views, procedures, functions, triggers, packages, índices, jobs, dashboards, ML models, dataflows — tudo o que a fonte expuser.

Detecção de drift

Alerta quando schema muda, % nulos sobe, distribuição se desloca ou novo tipo de PII aparece. Versionamento completo: veja como era a tabela X há 6 meses.

SaaS dedicado ou on-premises

Namespace Kubernetes dedicado por tenant. Conexão read-only. LLM compartilhado, dedicado ou self-hosted (Enterprise). Aderente a LGPD / ISO 27001.

Documentação em 3 camadas

Uma descrição não cabe a todos. Geramos três.

Cada camada é editável independentemente. O engenheiro ajusta a técnica sem afetar a de negócio. A controladoria reescreve a de negócio sem mexer em nada técnico. Histórico completo de quem editou o quê, quando e por quê.

1. Camada Técnica

Tipo, nullability, chaves inferidas, % nulos, cardinalidade, range, top valores, distribuição, FKs implícitas, dependências de procedures.

Para: engenheiros de dados, DBAs, arquitetos.

2. Camada Semântica

O que o campo representa no domínio: "código fiscal de produto", "data de emissão de NF-e", "identificador único de cliente PJ". Mapeada ao glossário central por sinônimos.

Para: analistas, cientistas de dados, novos integrantes.

3. Camada de Negócio

Como o campo é usado em decisão: KPI que alimenta, regra de cálculo, owner inferido, dashboards e relatórios que dependem dele, frequência de consulta.

Para: usuários de negócio, controladoria, auditoria.
Catalog Chat

Pergunte ao seu catálogo em português

Embarcado no portal, o Catalog Chat permite que qualquer usuário — técnico ou de negócio — converse com o catálogo em linguagem natural. Reusa a engine de NL→SQL do WFS DataTalk IA, agora apontada ao grafo do catálogo. Suporta perguntas sobre schema, lineage, regras de negócio, impacto de mudança e governança.

› Onde está o CPF do cliente nas nossas bases? Encontrei 7 ocorrências em 3 fontes: · ORACLE_PRD.CRM.CLIENTE.CD_CPF (origem primária) · DATABRICKS.silver.dim_cliente.cpf (derivado) · DATABRICKS.gold.fato_vendas.cpf_cliente (SHA-256) · POWERBI.Vendas_Mensal — usado em filtro Classificação: PII / LGPD-Sensível · Owner: time CRM › Diferença entre faturamento bruto e líquido? bruto = soma de NF-e emitidas líquido = bruto − impostos − devoluções − descontos Regra em: silver/calc_faturamento.py KPI: "Receita Líquida" no dashboard Diretoria
Conectores

Pluga em tudo o que você já usa

Cobertura por fonte vai além de tabelas: views, materialized views, procedures, functions, triggers, sequences, packages, jobs, ML models, dashboards e dataflows. Conectores adicionais sob demanda em 2-4 semanas.

Bancos Relacionais

SQL ServerOraclePostgreSQLMySQLDB2Sybase

Lakehouses

DatabricksMicrosoft FabricSnowflakeBigQuerySynapseRedshift

Storage

ADLS Gen2S3GCSDelta LakeIcebergParquet

Orquestradores

ADFDatabricks WorkflowsAirflowdbtFabric Pipelines

Repositórios

GitHubGitLabAzure DevOpsBitbucket

NoSQL

MongoDBCassandraCosmosDBDynamoDB

BI

Power BITableauLookerMetabase

ERPs (stack BR)

TOTVS ProtheusTOTVS DatasulSeniorSAP ECC/S4Oracle EBS

Genéricos

REST APIJDBCODBCCSV/ExcelJSON/XML
Casos de uso

Onde o produto entrega valor imediato

Onboarding de engenheiro novo

De 3 semanas estudando o lakehouse para poucas horas no portal — visão completa do que existe, o que faz e como tudo se conecta.

Auditoria LGPD / SOX

"Onde está o CPF?" responde em 1 clique, com lista completa de campos, fontes, lineage e tabelas derivadas. Conformidade defensável.

Refatoração com segurança

Antes de alterar uma tabela, lineage column-level mostra todos os pipelines, dashboards e relatórios que dependem dela — incluindo a medida específica no Power BI.

Glossário de negócio sempre atual

Áreas de negócio param de pedir explicação técnica. A definição de cada KPI fica visível no Catalog Chat com origem e regra derivada do código.

Migração de plataforma

Em projetos TOTVS→Databricks ou on-prem→Cloud, o catálogo serve de fonte da verdade do estado atual e gera o backlog do estado futuro com lineage preservada.

Inventário de PII automático

O Mapa de PII identifica continuamente onde dados pessoais estão armazenados e replicados. Alerta quando um novo PII surge.

Diferencial

WFS Smart Document IA vs catálogos tradicionais

WFS Smart Document IAAtlan / Collibra / Alation
Tempo de implantaçãoHoras (plug-and-play)Semanas a meses
Documentação automática3 camadas geradas por IA1 campo livre, manual
Lineage column-levelPor parser de código (SQL, Python, notebooks)Depende de metadata declarado
Catalog ChatPT-BR nativo, conversa sobre lineage e regrasBusca por palavra-chave
Base de ConhecimentoMulti-modal: PDF, DOCX, vídeo, áudio, imagensCampo de texto livre
Conectores ERP BRTOTVS Protheus, Datasul, Senior, Oracle EBSInexistente ou via JDBC genérico
LLM self-hostedDisponível no EnterpriseRaro ou inexistente
SuporteWFS no Brasil, em PT-BR, fuso BRGlobal, raramente em PT
Planos

Do squad pequeno ao grupo empresarial

Starter

Até 3 conectores · 1 tenant · 50 mil objetos · 5 usuários · Catalog Chat incluso · Suporte em horário comercial. Ideal para validação inicial.

Business

Até 10 conectores · multi-projetos · 500 mil objetos · 30 usuários · API REST/GraphQL · Lineage de código · Confluence/Notion. Para times de dados consolidados.

Enterprise

Conectores ilimitados · objetos ilimitados · LLM self-hosted · SSO/SAML · white-label · SLA 99,9% · suporte 24×7. Para grupos empresariais.

Cobrança por objeto catalogado em BRL (não por seat). Setup técnico — instalação, configuração de conectores, treinamento de glossário e ajuste de prompts ao domínio — cobrado à parte como entregável dedicado.

Quer ver o WFS Smart Document IA na sua base?

Demo executiva de 45 min sobre uma base de exemplo, ou Prova de Conceito de 2 semanas sobre um subset dos seus dados, sem custo.

Agendar demo
Perguntas frequentes

Sobre o WFS Smart Document IA

O que é o WFS Smart Document IA?

WFS Smart Document IA é uma plataforma de catálogo e documentação automática de bases de dados, datalakes e pipelines. Conecta na infraestrutura do cliente, varre todos os objetos (tabelas, views, procedures, notebooks, dashboards) e gera documentação em 3 camadas (técnica, semântica e de negócio) usando IA generativa, com lineage column-level reconstruída a partir do código real.

Como o catálogo de dados funciona na prática?

Após cadastrar fontes (DBs, datalakes, repositórios Git, ferramentas de BI) com credenciais read-only, o produto varre todos os objetos, calcula estatísticas e perfil de dados, detecta PII automaticamente, e processa cada artefato com LLM corporativo (Claude, Gemini, OpenAI) gerando descrições nas 3 camadas. Tudo fica navegável em um portal web com Catalog Chat em PT-BR.

Quais conectores o WFS Smart Document IA suporta?

Bancos: Oracle, SQL Server, PostgreSQL, MySQL, DB2, Sybase. Lakehouses: Databricks, Microsoft Fabric, Snowflake, BigQuery, Synapse, Redshift. Storage: ADLS Gen2, S3, GCS, Delta Lake, Iceberg. Orquestradores: ADF, Airflow, dbt, Fabric Pipelines. NoSQL: MongoDB, Cassandra, CosmosDB. BI: Power BI, Tableau, Looker. ERPs BR: TOTVS Protheus, Datasul, Senior, SAP. Conectores adicionais sob demanda em 2-4 semanas.

O que é lineage column-level e por que importa?

Lineage column-level mostra a origem exata de cada coluna até a fonte primária, percorrendo todas as transformações. O WFS Smart Document IA reconstrói isso analisando código real (SQL, Python, notebooks Databricks, dbt), sem depender de declaração manual do cliente. Útil para refatoração segura (saber o que vai quebrar antes de mexer), auditoria LGPD (onde está o CPF?) e governança.

Quanto custa o WFS Smart Document IA?

Três planos: Starter (até 3 conectores, 50 mil objetos, 5 usuários), Business (até 10 conectores, 500 mil objetos, 30 usuários, API REST/GraphQL) e Enterprise (ilimitado, LLM self-hosted, SSO/SAML, white-label, SLA 99,9%, suporte 24×7). Cobrança por objeto catalogado em BRL, não por seat. Setup técnico cobrado à parte.

É possível usar com LLM self-hosted (sem mandar dados pra fora)?

Sim, no plano Enterprise. Modelos LLM self-hosted disponíveis via AWS Bedrock privado, Azure AI dedicado ou Llama 3 / Claude on-prem. Dados sensíveis nunca saem do ambiente do cliente — apenas metadados e código trafegam entre conector e tenant dedicado da WFS. Aderente a LGPD, ISO 27001 e SOC 2.