Catálogo, dicionário, lineage column-level e Base de Conhecimento multi-modal — gerados por IA generativa a partir das suas bases, datalakes, pipelines e código. Em 3 camadas (técnica, semântica e de negócio), sempre atualizado, consultável em linguagem natural.
Engenheiros criam tabelas, views, notebooks e pipelines em ritmo acelerado. Catalogar metadados, lineage, regras de negócio e dicionário de dados é trabalho manual, repetitivo e historicamente abandonado. O custo: onboarding lento, auditorias caras, refatorações arriscadas e decisões de negócio sobre dados sem certeza da origem.
Cada objeto e campo recebe descrição técnica (DBA), semântica (analista) e de negócio (controladoria) — geradas independentes pela IA.
Parser cobre 25 dialetos SQL, AST Python/PySpark e notebooks. Reconstrói a origem de cada coluna até a fonte primária — sem o cliente declarar nada.
Suba PDF, DOCX, planilhas, vídeo, áudio, imagens, anotações livres — a IA absorve, indexa e enriquece a documentação com o seu vocabulário.
Pergunte em português: "onde está o CPF?", "qual a diferença entre faturamento bruto e líquido?". Respostas com lineage e referência ao código.
Detecção automática de CPF, CNPJ, RG, e-mail, cartão e telefone em todas as fontes — com lineage até a derivação final e owners responsáveis.
A IA produz a primeira versão; owners aprovam, editam ou rejeitam numa fila Kanban. A IA aprende com cada decisão e se ajusta ao vocabulário interno.
Tabelas, views, procedures, functions, triggers, packages, índices, jobs, dashboards, ML models, dataflows — tudo o que a fonte expuser.
Alerta quando schema muda, % nulos sobe, distribuição se desloca ou novo tipo de PII aparece. Versionamento completo: veja como era a tabela X há 6 meses.
Namespace Kubernetes dedicado por tenant. Conexão read-only. LLM compartilhado, dedicado ou self-hosted (Enterprise). Aderente a LGPD / ISO 27001.
Cada camada é editável independentemente. O engenheiro ajusta a técnica sem afetar a de negócio. A controladoria reescreve a de negócio sem mexer em nada técnico. Histórico completo de quem editou o quê, quando e por quê.
Tipo, nullability, chaves inferidas, % nulos, cardinalidade, range, top valores, distribuição, FKs implícitas, dependências de procedures.
Para: engenheiros de dados, DBAs, arquitetos.O que o campo representa no domínio: "código fiscal de produto", "data de emissão de NF-e", "identificador único de cliente PJ". Mapeada ao glossário central por sinônimos.
Para: analistas, cientistas de dados, novos integrantes.Como o campo é usado em decisão: KPI que alimenta, regra de cálculo, owner inferido, dashboards e relatórios que dependem dele, frequência de consulta.
Para: usuários de negócio, controladoria, auditoria.Embarcado no portal, o Catalog Chat permite que qualquer usuário — técnico ou de negócio — converse com o catálogo em linguagem natural. Reusa a engine de NL→SQL do WFS DataTalk IA, agora apontada ao grafo do catálogo. Suporta perguntas sobre schema, lineage, regras de negócio, impacto de mudança e governança.
Cobertura por fonte vai além de tabelas: views, materialized views, procedures, functions, triggers, sequences, packages, jobs, ML models, dashboards e dataflows. Conectores adicionais sob demanda em 2-4 semanas.
De 3 semanas estudando o lakehouse para poucas horas no portal — visão completa do que existe, o que faz e como tudo se conecta.
"Onde está o CPF?" responde em 1 clique, com lista completa de campos, fontes, lineage e tabelas derivadas. Conformidade defensável.
Antes de alterar uma tabela, lineage column-level mostra todos os pipelines, dashboards e relatórios que dependem dela — incluindo a medida específica no Power BI.
Áreas de negócio param de pedir explicação técnica. A definição de cada KPI fica visível no Catalog Chat com origem e regra derivada do código.
Em projetos TOTVS→Databricks ou on-prem→Cloud, o catálogo serve de fonte da verdade do estado atual e gera o backlog do estado futuro com lineage preservada.
O Mapa de PII identifica continuamente onde dados pessoais estão armazenados e replicados. Alerta quando um novo PII surge.
| WFS Smart Document IA | Atlan / Collibra / Alation | |
|---|---|---|
| Tempo de implantação | Horas (plug-and-play) | Semanas a meses |
| Documentação automática | 3 camadas geradas por IA | 1 campo livre, manual |
| Lineage column-level | Por parser de código (SQL, Python, notebooks) | Depende de metadata declarado |
| Catalog Chat | PT-BR nativo, conversa sobre lineage e regras | Busca por palavra-chave |
| Base de Conhecimento | Multi-modal: PDF, DOCX, vídeo, áudio, imagens | Campo de texto livre |
| Conectores ERP BR | TOTVS Protheus, Datasul, Senior, Oracle EBS | Inexistente ou via JDBC genérico |
| LLM self-hosted | Disponível no Enterprise | Raro ou inexistente |
| Suporte | WFS no Brasil, em PT-BR, fuso BR | Global, raramente em PT |
Até 3 conectores · 1 tenant · 50 mil objetos · 5 usuários · Catalog Chat incluso · Suporte em horário comercial. Ideal para validação inicial.
Até 10 conectores · multi-projetos · 500 mil objetos · 30 usuários · API REST/GraphQL · Lineage de código · Confluence/Notion. Para times de dados consolidados.
Conectores ilimitados · objetos ilimitados · LLM self-hosted · SSO/SAML · white-label · SLA 99,9% · suporte 24×7. Para grupos empresariais.
Cobrança por objeto catalogado em BRL (não por seat). Setup técnico — instalação, configuração de conectores, treinamento de glossário e ajuste de prompts ao domínio — cobrado à parte como entregável dedicado.
Demo executiva de 45 min sobre uma base de exemplo, ou Prova de Conceito de 2 semanas sobre um subset dos seus dados, sem custo.
Agendar demoWFS Smart Document IA é uma plataforma de catálogo e documentação automática de bases de dados, datalakes e pipelines. Conecta na infraestrutura do cliente, varre todos os objetos (tabelas, views, procedures, notebooks, dashboards) e gera documentação em 3 camadas (técnica, semântica e de negócio) usando IA generativa, com lineage column-level reconstruída a partir do código real.
Após cadastrar fontes (DBs, datalakes, repositórios Git, ferramentas de BI) com credenciais read-only, o produto varre todos os objetos, calcula estatísticas e perfil de dados, detecta PII automaticamente, e processa cada artefato com LLM corporativo (Claude, Gemini, OpenAI) gerando descrições nas 3 camadas. Tudo fica navegável em um portal web com Catalog Chat em PT-BR.
Bancos: Oracle, SQL Server, PostgreSQL, MySQL, DB2, Sybase. Lakehouses: Databricks, Microsoft Fabric, Snowflake, BigQuery, Synapse, Redshift. Storage: ADLS Gen2, S3, GCS, Delta Lake, Iceberg. Orquestradores: ADF, Airflow, dbt, Fabric Pipelines. NoSQL: MongoDB, Cassandra, CosmosDB. BI: Power BI, Tableau, Looker. ERPs BR: TOTVS Protheus, Datasul, Senior, SAP. Conectores adicionais sob demanda em 2-4 semanas.
Lineage column-level mostra a origem exata de cada coluna até a fonte primária, percorrendo todas as transformações. O WFS Smart Document IA reconstrói isso analisando código real (SQL, Python, notebooks Databricks, dbt), sem depender de declaração manual do cliente. Útil para refatoração segura (saber o que vai quebrar antes de mexer), auditoria LGPD (onde está o CPF?) e governança.
Três planos: Starter (até 3 conectores, 50 mil objetos, 5 usuários), Business (até 10 conectores, 500 mil objetos, 30 usuários, API REST/GraphQL) e Enterprise (ilimitado, LLM self-hosted, SSO/SAML, white-label, SLA 99,9%, suporte 24×7). Cobrança por objeto catalogado em BRL, não por seat. Setup técnico cobrado à parte.
Sim, no plano Enterprise. Modelos LLM self-hosted disponíveis via AWS Bedrock privado, Azure AI dedicado ou Llama 3 / Claude on-prem. Dados sensíveis nunca saem do ambiente do cliente — apenas metadados e código trafegam entre conector e tenant dedicado da WFS. Aderente a LGPD, ISO 27001 e SOC 2.