# robots.txt — https://empresas.credithub.com.br # Subdomínio público com snapshot RFB e dados cadastrais de CNPJ. User-agent: * # Páginas canônicas e diretórios (HTML). Allow: /$ Allow: /atividade Allow: /em Allow: /consulta-gratis/ # Discovery files. Allow: /llms.txt Allow: /llms-full.txt Allow: /sitemap.xml Allow: /sitemap- # Variantes IA (Markdown, plain-text, JSON-LD): use Accept header ou # acesse a URL canônica HTML para indexação. Evita conteúdo duplicado # em SERPs. Disallow: /*?format= Disallow: /*&format= # Tudo o mais é 404 servido pelo PHP — bloqueia explicitamente para # evitar requests desnecessários em rotas que não existem. Disallow: /admin Disallow: /api Disallow: /private Sitemap: https://empresas.credithub.com.br/sitemap.xml