31.01.2025

Erros do sistema Debian. Solução

Introdução

Problemas, erros, bugs e servidores que não estão funcionando são uma pequena lista de problemas em potencial para administradores, especialistas em segurança da informação etc. Todos nós precisamos resolver um problema que apareceu o mais rápido possível! Mas como começar, onde está a localização do motivo e como lidar com isso? Vamos considerar a principal área de possíveis problemas: sistema de arquivos, serviços, unidades etc. Devido à enorme quantidade de problemas que aparecem, eles têm sua própria maneira de resolvê-los. Podemos dividir o processo de solução de problemas em duas etapas: analisar e aplicar a solução!

Cloud Servers from R$23,41 / moIntel Xeon Gold 6254 3.1 GHz CPU, SLA 99,9%, 100 Mbps channel

Primeira etapa: Analisar

Antes de tudo, precisamos identificar o problema e a área no sistema operacional. Podemos ver a mensagem de erro do programa, utilitário ou serviço. Por exemplo, o sistema de controle de acesso e gerenciamento de contas pode imprimir esse erro na tela:

Screenshot №1 - Message of problem

Não temos permissão para o arquivo criado pelo root porque ele tem o atributo 700. Isso significa que o root tem o direito rwx, mas outros usuários e grupos não têm! Para resolver esse tipo de problema, altere o atributo do arquivo ou catálogo necessário. Além disso, o sistema pode não notificá-lo sobre o que está acontecendo em seu interior, pois isso não interrompe o processo. O sistema operacional é como uma caixa preta com milhões de processos internos e precisamos monitorar todos eles.

Aviso! Mas cada sistema, aplicativo ou serviço pode ter seu próprio utilitário de registro ou arquivo para solução de problemas.

Vamos dar uma olhada no log do sistema, para saber exatamente como todos os problemas do sistema são documentados aqui:

journalctl | grep "login" | tail

Esse comando tem várias funções, vamos dar algumas explicações. O primeiro comando permite verificar os logs do sistema, o segundo ajuda a encontrar um padrão de texto na quantidade de dados e o último mostra o fim dos logs. No resultado, temos o fim dos registros de login do sistema operacional:

Screenshot №2 - Log message of login

É engraçado destacar, mas no servidor para os objetivos do experimento, não definimos a chave pública e você pode ver o motivo dos possíveis problemas: vários endereços IP estão tentando entrar na máquina. Portanto, defina uma chave pública confiável. Isso ajuda a descobrir a origem do problema. Também podemos usar isso para verificar o status de um dos serviços, se virmos o problema abaixo, basta digitar:

journalctl -xeu postgresql@15-main.service

Screenshot №3 - Problema com o serviço

Com as recomendações acima, podemos verificar o diário das unidades de ação:

Screenshot №4 - Problema com a unidade

Na tela acima, podemos ver o arquivo Subject com o problema Unit failed, verificar raw com a tag FATAL. Nesse caso, há um problema nos arquivos de configuração e, portanto, a unidade não pode ser iniciada!

Segunda etapa: Solução

Se quiser verificar o status dos serviços, você precisará digitar:

systemctl list-units -t service -p important

Screenshot №5 - Active units

Vamos solucionar o problema do serviço postgresql, acessar o arquivo de configuração e encontrar o erro raw:

Screenshot №6 - Error raw

Exclua-os com a combinação de botões Ctrl + K, salve-os e reinicie o serviço:

systemctl restart postgresql@15-main.service

E, ao mesmo tempo, precisamos verificar o status do serviço:

systemctl status postgresql@15-main.service

Screenshot №7 - Working service

Para o seu caso, talvez você precise de uma etapa mais exata para resolvê-los, vamos pesquisá-los pela mesma mensagem de erro no mecanismo de pesquisa ou nos serviços geradores de IA, como o GPT. Nesse artigo, consideramos ferramentas de monitoramento para resolver seus erros.

Além disso, se não conseguir encontrar o motivo do problema, mas sua máquina estiver funcionando lentamente, você pode instalar o Task Manager - atop:

apt install atop -y

Em seguida, basta digitar atop e aguardar a janela pop-up com o processo principal em execução:

atop

Screenshot №8 - atop

Na última coluna, podemos ver o campo CPU com a porcentagem de uso do processo no momento atual e, se houver uma carga alta, então, mate o processo ou suspenda-o:

kill -SIGINT 332697

E o segundo comando para eliminá-los:

kill -SIGTERM 332697

Screenshot №9 - PID trouble

Se a CLI não retornar uma mensagem com o problema, então a execução foi bem-sucedida!

Conclusão

Encontrar erros e desafios em um sistema baseado no Debian é uma parte comum da administração do sistema. Este guia abordou vários aspectos da identificação e resolução eficaz desses problemas.