07.10.2025

Análise de erros do sistema Debian. Troubleshooting

Falhas, erros, bugs e servidores fora do ar — essa é apenas uma pequena lista dos possíveis pesadelos para administradores de sistemas, especialistas em segurança da informação e outros profissionais de TI. O objetivo é resolver o problema o mais rápido possível. Mas por onde começar? Onde procurar a causa e como corrigi-la?

Neste guia, vamos examinar as principais áreas onde surgem falhas: o sistema de arquivos, o kernel, os dispositivos e os drivers. Como existem muitas causas possíveis, também há diferentes métodos de solução. O processo de troubleshooting pode ser dividido em duas etapas: análise e resolução.

Primeira etapa: Análise

O primeiro passo é identificar o problema e a área do sistema afetada. A mensagem de erro pode vir de um programa, utilitário ou serviço.
Por exemplo, o sistema de controle de acesso e gerenciamento de contas pode exibir algo como:

Captura de tela nº1 — Mensagem de erro

Não temos permissão para acessar um arquivo criado pelo usuário root, pois ele possui o atributo 700 — ou seja, apenas o root tem permissões rwx, enquanto outros usuários e grupos não têm nenhuma.

Para corrigir o problema, é preciso alterar o atributo do arquivo ou diretório em questão.

O sistema pode não exibir mensagens sobre o que ocorre internamente, já que não interrompe o processo. O sistema operacional funciona como uma “caixa-preta” com milhões de processos — e é nossa tarefa monitorá-los. Para isso, existem os arquivos de log, que ajudam a entender o que está acontecendo.

Atenção: cada sistema, aplicativo ou serviço pode ter seu próprio log ou utilitário de diagnóstico — é importante lembrar disso.

Vamos observar o journal do sistema e ver como uma mensagem de evento aparece:

journalctl | grep "login" | tail

Esse comando combina três ações:

O resultado mostra as tentativas de login:

Captura de tela nº2 — Log de conexões

No servidor de teste, não configuramos uma chave pública, e é possível ver o motivo de falhas de acesso: diversas máquinas com IPs diferentes tentam conectar-se ao servidor. Portanto, configure uma chave pública confiável.

Também podemos verificar o status de um serviço específico:

journalctl -xeu postgresql@15-main.service

Captura de tela nº3 — Problema ao reiniciar o serviço

Com base nisso, é possível inspecionar o log detalhado do serviço:

Captura de tela nº4 — Falha de unidade

No log, há uma linha com o campo Subject indicando “Unit failed” — e um erro FATAL logo abaixo. Nesse caso, o problema está em arquivos de configuração, o que impede a inicialização do serviço.

Segunda etapa: Resolução

Para verificar o status dos serviços, use:

systemctl list-units -t service -p important

Captura de tela nº5 — Unidades ativas

Vamos corrigir o problema com o serviço PostgreSQL. Abra o arquivo de configuração, encontre a linha com erro:

Captura de tela nº6 — Solução do problema

Remova-a com Ctrl + K, salve e reinicie o serviço:

systemctl restart postgresql@15-main.service

Em seguida, verifique novamente o status:

systemctl status postgresql@15-main.service

Captura de tela nº7 — Resultado do troubleshooting

Em outros casos, pode ser necessário buscar a mensagem de erro na web ou usar serviços de IA generativa, como o GPT, para entender o problema.

Se o motivo ainda não for claro, mas o dispositivo estiver lento, instale o atop, um monitor de desempenho:

apt install atop -y

Depois, execute:

atop

Captura de tela nº8 — Gerenciador de tarefas

Na última coluna, o campo CPU mostra a porcentagem de uso por processo. Se algum estiver sobrecarregando o sistema, finalize-o:

kill -INT 332697

ou encerre completamente:

kill -TERM 332697

Captura de tela nº9 — Encerramento do processo

Se o terminal não retornar erros, o comando foi executado com sucesso.

Conclusão

Diagnosticar e corrigir erros no sistema é parte essencial da administração de sistemas. Este guia abordou diferentes métodos e ferramentas para identificar e resolver problemas com eficiência no Debian.