Cursor ultrapassou 5 milhões de desenvolvedores. Veja o que sua Codebase Intelligence realmente faz.

O Cursor ultrapassou 5 milhões de desenvolvedores ativos mensais no início de 2025, ante cerca de 500 mil no início de 2024. Atualmente, é a ferramenta para desenvolvedores que mais cresce desde o npm. A história de crescimento é amplamente coberta — US$ 400 milhões em Série B, avaliada em US$ 9,9 bilhões em janeiro de 2025, adoção maciça em empresas como Stripe, Shopify e Samsung. O que é menos abordado é a arquitetura técnica real que distingue o Cursor do GitHub Copilot, que tem cerca de 1,8 milhão de usuários pagantes, ou de ferramentas como JetBrains AI Assistant e Amazon Q. Este é um post sobre o que o Cursor faz tecnicamente, não comercialmente.

Codebase Indexing: A Fundação

A arquitetura original do GitHub Copilot era baseada em contexto de documento: o modelo vê o arquivo atual, a posição do cursor e uma pequena janela de código ao redor. Ele não tem conhecimento estrutural da base de código mais ampla. O primeiro recurso diferenciador do Cursor foi o codebase indexing — um processo executado na abertura do projeto que produz um índice vetorial semântico de cada arquivo do repositório.

O processo de indexação usa uma combinação de parsing de AST e geração de embeddings. O código é dividido em chunks no nível de função e classe (não janelas arbitrárias de bytes), e cada chunk é embedded usando um modelo especializado de embeddings de código. O Cursor usa um modelo proprietário de embeddings fine-tuned em código, não um modelo de embeddings de texto de propósito geral. Esses embeddings são armazenados localmente em uma instância LevelDB dentro do diretório .cursor, indexados para busca aproximada do vizinho mais próximo usando FAISS.

Quando você faz uma pergunta ao Cursor ou aciona uma completação, a consulta também é embedded, e uma busca semântica recupera os 20 a 40 chunks de código mais relevantes de toda a base de código. Esses chunks são injetados na janela de contexto antes que o modelo veja sua solicitação. Isso é retrieval-augmented generation (RAG) aplicado especificamente a código — e é o que permite ao Cursor responder corretamente a perguntas como 'como funciona a autenticação nesta base de código?', enquanto o Copilot alucinaria uma resposta com base nos dados de treino.

The Shadow Workspace

O recurso mais arquiteturalmente interessante do Cursor é o que ele chama de shadow workspace. Quando você pede ao Cursor para fazer uma alteração, ele não apenas transmite tokens para o seu editor. Ele abre uma versão oculta, na memória, do seu arquivo, aplica a mudança proposta e executa uma série de validações antes que você veja o resultado.

As validações incluem verificação de tipo TypeScript (usando a integração LSP do tsserver), resolução de imports (verificando se novos imports adicionados pelo modelo realmente existem no seu grafo de dependências) e uma verificação de sintaxe via tree-sitter. Se alguma dessas falhar, o loop de controle do Cursor solicita ao modelo que revise sua saída — tipicamente 1 a 2 passagens adicionais de inferência — antes de exibir o resultado para você.

Este é o mecanismo por trás da menor taxa de alucinação do Cursor em completações de código comparado a saídas brutas de modelos. O modelo ainda alucina; o shadow workspace captura uma fração significativa das alucinações antes que elas cheguem à sua tela. Nos benchmarks internos do Cursor (divulgados em um post de blog em outubro de 2024), a validação do shadow workspace reduziu saídas de código sintaticamente inválidas em 67% e saídas com erros de tipo em 44% em comparação com o mesmo modelo sem validação.

Speculative Edits e Apply Mode

O recurso 'Apply' do Cursor — onde você descreve uma mudança em linguagem natural e ela é aplicada em vários arquivos — usa um pipeline de múltiplas etapas. Primeiro, o modelo gera um diff plan: uma lista estruturada de quais arquivos precisam mudar e qual é a mudança, em pseudocódigo. Segundo, um modelo separado (menor e mais rápido) converte cada item do pseudocódigo em um diff de código real. Terceiro, o shadow workspace valida cada diff antes de ser preparado.

A abordagem de dois modelos é importante porque a geração de diff e a escrita de código são tarefas cognitivas diferentes. Um modelo de contexto grande (Claude 3.5 Sonnet ou GPT-4o no sistema de roteamento do Cursor) lida com a etapa de planejamento, onde entender o contexto completo da base de código é crítico. Um modelo menor e mais rápido (tipicamente uma versão fine-tuned do DeepSeek Coder ou Code Llama) lida com a tradução mecânica do plano para código, onde a velocidade importa mais do que a compreensão profunda do contexto. A latência do Cursor em operações Apply multi-arquivo é tipicamente de 3 a 8 segundos — competitivo com digitar a mudança manualmente para qualquer coisa maior que uma única função.

Model Routing e a Relação do Cursor com os AI Labs

O Cursor não treina seus próprios modelos fundamentais. Ele roteia requisições para Anthropic, OpenAI e suas próprias variantes fine-tuned dependendo do tipo de tarefa. A lógica de roteamento não é pública, mas com base em análises de tráfego de rede publicadas por pesquisadores independentes no final de 2024, o Cursor usa Claude 3.5 Sonnet como modelo principal para consultas conversacionais e raciocínio multi-arquivo, GPT-4o para completações Tab (onde seu treinamento em código é mais adequado) e um modelo menor proprietário fine-tuned para o loop de validação do shadow workspace.

O modelo de negócios do Cursor significa que ele paga por token para esses provedores. Com 5 milhões de usuários ativos realizando várias centenas de completações por dia, o custo computacional é substancial — o que explica a captação de US$ 400 milhões. A empresa indicou que está trabalhando em sua própria infraestrutura de treinamento, mas isso é trabalho de vários anos. Por enquanto, a diferenciação do Cursor é arquitetural (indexação, shadow workspace, camada de roteamento), não na qualidade do modelo.

Privacy Mode e Implantação Empresarial

O Cursor oferece um Privacy Mode que desabilita a coleta de dados de treinamento da base de código. Nesse modo, o código ainda é enviado para as APIs dos provedores de IA para inferência, mas o Cursor afirma que não armazena pares de requisição/resposta. Para clientes empresariais, uma opção auto-hospedada roteia toda a inferência através das próprias chaves API do cliente e opcionalmente através de um caminho de rede privado.

O tier empresarial (US$ 40/usuário/mês) inclui conformidade SOC 2 Tipo II, SSO via Okta e Microsoft Entra, e logging de auditoria. Este é o tier usado por Stripe e Shopify. A certificação de conformidade foi concluída no terceiro trimestre de 2024 — antes disso, o Cursor não era amplamente implantável em empresas com requisitos rigorosos de governança de dados.

O Que o Cursor Não Faz Bem (Ainda)

O codebase indexing do Cursor tem um limite rígido de cerca de 100.000 tokens de contexto indexado por consulta — aproximadamente 75.000 a 100.000 linhas de código indexadas exibidas por solicitação. Para grandes monorepos com milhões de linhas, o código relevante pode não estar nos chunks recuperados, causando os mesmos problemas de alucinação que ferramentas mais simples exibem. A equipe de engenharia discutiu isso como uma limitação conhecida em vários fóruns de desenvolvedores.

A colaboração em tempo real está ausente. O Cursor é um editor de usuário único. Equipes que o utilizam trabalham em paralelo em instâncias separadas, o que cria problemas de coordenação em arquivos compartilhados que uma configuração tradicional de protocolo de servidor de linguagem trata naturalmente. JetBrains e VS Code têm respostas melhores aqui. O roadmap de produto do Cursor mencionou 'recursos colaborativos' para 2025-2026 sem especificações.

Recomendações Práticas

Se você ainda não configurou o codebase indexing: abra as configurações do Cursor e verifique se 'Codebase Indexing' está ativado (está por padrão). Verifique o status do índice em Cursor > Settings > Features > Codebase Indexing. Repositórios grandes podem precisar de 5 a 10 minutos para indexar completamente na primeira abertura.
Para alterações em vários arquivos, use o Composer mode (não o Chat): o Composer aciona o pipeline completo de speculative edit com validação do shadow workspace. O Chat mode usa uma abordagem de passagem única mais simples. A diferença de qualidade é significativa para tarefas de refatoração.
No Privacy Mode, seu código ainda sai da sua máquina: ele vai para as APIs da Anthropic e OpenAI. Se você precisa de inferência verdadeiramente local, o caminho empresarial auto-hospedado do Cursor suporta roteamento para instâncias Ollama executadas localmente — mas isso requer o tier empresarial.
Para grandes monorepos: fixe manualmente arquivos relevantes no contexto usando @ mentions em vez de depender apenas da busca semântica. A recuperação RAG não é perfeita, e expor explicitamente os arquivos corretos melhora a qualidade da saída de forma mensurável.