Enviando dados com o Vector
- Managed ClickStack
- ClickStack open source
O guia a seguir pressupõe que você já criou um serviço Managed ClickStack e anotou suas credenciais de serviço. Caso ainda não tenha feito isso, siga o guia de Getting Started para Managed ClickStack até ser solicitado a configurar o Vector.Crie uma tabela para seus dados. Ela deve corresponder ao esquema de saída dos seus dados. O exemplo abaixo pressupõe uma estrutura clássica do Nginx. Ajuste conforme seus dados, seguindo as boas práticas de esquema. Recomendamos fortemente que você se familiarize com o conceito de chaves primárias, selecionando sua chave primária com base nas diretrizes descritas aqui.Por padrão, recomendamos usar o formato
Criar um banco de dados e uma tabela
O Vector exige que uma tabela e um schema sejam definidos antes da ingestão de dados.Primeiro, crie um banco de dados. Isso pode ser feito por meio do ClickHouse Cloud console.No exemplo abaixo, usamoslogs:Chave primária do NginxA chave primária acima considera padrões de acesso típicos na UI do ClickStack para logs do Nginx, mas talvez precise ser ajustada de acordo com a carga de trabalho no ambiente de produção.
Adicione o sink do ClickHouse à configuração do Vector
Modifique a configuração do Vector para incluir o sink do ClickHouse, atualizando o campoinputs para receber eventos dos pipelines existentes.Esta configuração pressupõe que o pipeline upstream do Vector já preparou os dados para corresponder ao schema de destino do ClickHouse, ou seja, que os campos já foram analisados, nomeados corretamente e tipados de forma adequada para inserção. Consulte o exemplo de Nginx abaixo para ver uma ilustração completa de como analisar e normalizar linhas brutas de log em um schema adequado para o ClickStack.json_each_row, que codifica cada evento como um único objeto JSON por linha. Esse é o formato padrão e recomendado para o ClickStack na ingestão de dados JSON e deve ser priorizado em relação a formatos alternativos, como objetos JSON codificados como strings.O sink do ClickHouse também oferece suporte à codificação de stream Arrow (atualmente em beta). Ela pode oferecer maior vazão, mas traz restrições importantes: o banco de dados e a tabela devem ser estáticos, pois o esquema é obtido uma única vez na inicialização, e o roteamento dinâmico não é compatível. Por isso, a codificação Arrow é mais adequada para pipelines de ingestão fixos e bem definidos.Recomendamos revisar as opções de configuração de sink disponíveis na documentação do Vector:O exemplo acima usa o usuário padrão do Managed ClickStack. Para implantações em produção, recomendamos criar um usuário de ingestão dedicado com as permissões e os limites apropriados.
Acesse a UI do ClickStack
Acesse seu serviço Managed ClickStack e selecione “ClickStack” no menu à esquerda. Se você já concluiu o onboarding, a UI do ClickStack será aberta em uma nova aba, e você será autenticado automaticamente. Caso contrário, prossiga com o onboarding e selecione “Launch ClickStack” depois de escolher o Vector como sua origem de entrada.Criar uma fonte de dados
Crie uma fonte de dados de logs. Se ainda não houver nenhuma fonte de dados, você será solicitado a criar uma no primeiro login. Caso contrário, vá para Team Settings e adicione uma nova fonte de dados.A configuração acima pressupõe um esquema no estilo Nginx, com uma colunatime_local usada como timestamp. Sempre que possível, essa deve ser a coluna de timestamp declarada na chave primária. Essa coluna é obrigatória.Também recomendamos atualizar o Default SELECT para definir explicitamente quais colunas são retornadas na visualização de logs. Se houver campos adicionais disponíveis, como nome do serviço, nível de log ou uma coluna de corpo, eles também poderão ser configurados. A coluna exibida como timestamp também pode ser substituída, caso seja diferente da coluna usada na chave primária da tabela e configurada acima.No exemplo acima, não existe uma coluna Body nos dados. Em vez disso, ela é definida usando uma expressão SQL que reconstrói uma linha de log do Nginx a partir dos campos disponíveis.Para ver outras opções possíveis, consulte a referência de configuração.Explore os dados
Acesse a visualização de logs para explorar os dados e começar a usar o ClickStack.Exemplo de conjunto de dados com Vector
- Managed ClickStack
- ClickStack Open Source
O guia a seguir pressupõe que você já criou um serviço Managed ClickStack e registrou suas credenciais de serviço. Caso ainda não tenha feito isso, siga o guia de Getting Started para Managed ClickStack até chegar à etapa de configuração do Vector.Crie uma tabela para os seus dados.Isso recompõe a linha de log com base nos campos estruturados.Para outras opções, consulte a referência de configuração.
Instalando o Vector
Antes de prosseguir, certifique-se de que o Vector esteja instalado no sistema em que você pretende executar seu pipeline de ingestão. Siga o guia oficial de instalação do Vector para instalar um binário pré-compilado ou um pacote adequado ao seu ambiente:Depois de instalar, verifique se o bináriovector está disponível no seu path antes de continuar com as etapas de configuração abaixo.Ele pode ser instalado na mesma instância que o OTel collector do ClickStack.Siga as melhores práticas de arquitetura e segurança ao colocar o Vector em produção.Baixe os dados de exemplo
Se quiser testar com um conjunto de dados de exemplo, baixe o exemplo do nginx a seguir.Estes dados foram coletados de uma instância do Nginx configurada para gerar logs em formato JSON, para facilitar o parsing. Para ver a configuração do Nginx para esses logs, consulte “Monitorando logs do Nginx com ClickStack”.
Crie um banco de dados e uma tabela
O Vector exige que uma tabela e um schema sejam definidos antes da ingestão de dados.Primeiro, crie um banco de dados. Isso pode ser feito no ClickHouse Cloud console.Crie um banco de dadoslogs:Chave primária do NginxA chave primária acima pressupõe padrões típicos de acesso na UI do ClickStack para logs do Nginx, mas talvez precise ser ajustada conforme a carga de trabalho em ambientes de produção.
Copie a configuração do Vector
Copie a configuração do Vector e crie um arquivonginx.yaml, definindo CLICKHOUSE_ENDPOINT e CLICKHOUSE_PASSWORD.O exemplo acima usa o usuário padrão do Managed ClickStack. Para implantações em produção, recomendamos criar um usuário dedicado para ingestão com as permissões e os limites adequados.
Inicie o Vector
Inicie o Vector com o comando a seguir, criando primeiro o diretório de dados para registrar os offsets do arquivo.Navegue até a UI do ClickStack
Acesse seu serviço Managed ClickStack e selecione “ClickStack” no menu à esquerda. Se você já concluiu o onboarding, isso abrirá a UI do ClickStack em uma nova aba, e sua autenticação será feita automaticamente. Caso contrário, prossiga com o onboarding e selecione “Launch ClickStack” depois de escolher o Vector como sua fonte de entrada.Criar uma fonte de dados
Crie uma fonte de dados de logs. Se não houver nenhuma fonte de dados, você será solicitado a criar uma no primeiro acesso. Caso contrário, vá para Configurações da equipe e adicione uma nova fonte de dados.A configuração pressupõe o schema do Nginx, com uma colunatime_local usada como timestamp. Essa é a coluna de timestamp declarada na chave primária. Essa coluna é obrigatória.Também especificamos a seleção padrão como time_local, remote_addr, status, request, que define quais colunas são retornadas na visualização de logs.No exemplo acima, não há uma coluna Body nos dados. Em vez disso, ela é definida como a expressão SQL:Explore os dados
Navegue até a tela de pesquisa em20 de outubro de 2025 para explorar os dados e começar a usar o ClickStack.