- Abra seu navegador
- Acesse:
http://localhost:3000/vectorization(ou sua URL de produção) - Você verá um painel com botões e estatísticas
- No painel, você verá um botão grande azul: "Vetorizar Todos os Dados"
- Clique nele
- Confirme quando perguntado
- Aguarde alguns minutos (depende da quantidade de dados)
Os dados serão vetorizados automaticamente. Você verá o progresso na tela.
- Abra o console do navegador (F12)
- Cole este código:
fetch('/api/vectorization/process', {
method: 'POST',
headers: { 'Content-Type': 'application/json' },
body: JSON.stringify({
action: 'vectorizeAll'
})
})
.then(r => r.json())
.then(data => console.log('Resultado:', data))Crie um arquivo temporário vetorizar.js na raiz do projeto:
import VectorizationService from './src/services/vectorizationService'
async function vetorizar() {
console.log('Iniciando vetorização...')
const result = await VectorizationService.vectorizeAll()
console.log('Concluído!', result)
}
vetorizar()-
Busca todos os dados das tabelas:
companies(Empresas)employees(Colaboradores)prospects(Prospects)cpf_clients(Clientes CPF)unbanked_companies(Empresas Não Bancarizadas)
-
Cria textos semânticos de cada registro
- Exemplo: "Messiax 12345678000190 Tecnologia Software"
-
Gera embeddings usando OpenAI
- Cada texto vira um vetor de 1536 números (text-embedding-3-small)
- Custo: ~$0.00002 por embedding (mais econômico que large)
-
Salva na tabela
data_embeddings- Permite busca semântica depois
- Primeira vez: Pode demorar alguns minutos dependendo da quantidade de dados
- Custo: Cada embedding custa ~$0.00013 (muito barato)
- Uma vez só: Você só precisa fazer isso uma vez para dados existentes
- Novos dados: Serão vetorizados automaticamente quando você processar pendentes
Após vetorizar todos os dados uma vez, você só precisa:
-
Processar Registros Pendentes (botão no painel)
- Isso processa novos dados que foram criados/atualizados
- Execute periodicamente (ex: uma vez por dia)
-
Ou configurar processamento automático (opcional)
- Criar um cron job para processar pendentes automaticamente
- "Quanto tempo demora?" → Depende da quantidade de dados. 100 registros = ~1 minuto
- "Quanto custa?" → ~$0.00013 por registro. 1000 registros = ~$0.13
- "Preciso fazer de novo?" → Não, apenas uma vez. Depois só processar pendentes
- "Como sei se funcionou?" → Veja o status no painel. Deve mostrar "Vetorizados: X"