Introdução
Problemas, erros, bugs e servidores que não estão funcionando são uma pequena lista de problemas em potencial para administradores, especialistas em segurança da informação etc. Todos nós precisamos resolver um problema que apareceu o mais rápido possível! Mas como começar, onde está a localização do motivo e como lidar com isso? Vamos considerar a principal área de possíveis problemas: sistema de arquivos, serviços, unidades etc. Devido à enorme quantidade de problemas que aparecem, eles têm sua própria maneira de resolvê-los. Podemos dividir o processo de solução de problemas em duas etapas: analisar e aplicar a solução!
Primeira etapa: Analisar
Antes de tudo, precisamos identificar o problema e a área no sistema operacional. Podemos ver a mensagem de erro do programa, utilitário ou serviço. Por exemplo, o sistema de controle de acesso e gerenciamento de contas pode imprimir esse erro na tela:
Não temos permissão para o arquivo criado pelo root porque ele tem o atributo 700. Isso significa que o root tem o direito rwx, mas outros usuários e grupos não têm! Para resolver esse tipo de problema, altere o atributo do arquivo ou catálogo necessário. Além disso, o sistema pode não notificá-lo sobre o que está acontecendo em seu interior, pois isso não interrompe o processo. O sistema operacional é como uma caixa preta com milhões de processos internos e precisamos monitorar todos eles.
Aviso! Mas cada sistema, aplicativo ou serviço pode ter seu próprio utilitário de registro ou arquivo para solução de problemas.
Vamos dar uma olhada no log do sistema, para saber exatamente como todos os problemas do sistema são documentados aqui:
Esse comando tem várias funções, vamos dar algumas explicações. O primeiro comando permite verificar os logs do sistema, o segundo ajuda a encontrar um padrão de texto na quantidade de dados e o último mostra o fim dos logs. No resultado, temos o fim dos registros de login do sistema operacional:
É engraçado destacar, mas no servidor para os objetivos do experimento, não definimos a chave pública e você pode ver o motivo dos possíveis problemas: vários endereços IP estão tentando entrar na máquina. Portanto, defina uma chave pública confiável. Isso ajuda a descobrir a origem do problema. Também podemos usar isso para verificar o status de um dos serviços, se virmos o problema abaixo, basta digitar:
Com as recomendações acima, podemos verificar o diário das unidades de ação:
Na tela acima, podemos ver o arquivo Subject com o problema Unit failed, verificar raw com a tag FATAL. Nesse caso, há um problema nos arquivos de configuração e, portanto, a unidade não pode ser iniciada!
Segunda etapa: Solução
Se quiser verificar o status dos serviços, você precisará digitar:
Vamos solucionar o problema do serviço postgresql, acessar o arquivo de configuração e encontrar o erro raw:
Exclua-os com a combinação de botões Ctrl + K, salve-os e reinicie o serviço:
E, ao mesmo tempo, precisamos verificar o status do serviço:
Para o seu caso, talvez você precise de uma etapa mais exata para resolvê-los, vamos pesquisá-los pela mesma mensagem de erro no mecanismo de pesquisa ou nos serviços geradores de IA, como o GPT. Nesse artigo, consideramos ferramentas de monitoramento para resolver seus erros.
Além disso, se não conseguir encontrar o motivo do problema, mas sua máquina estiver funcionando lentamente, você pode instalar o Task Manager - atop:
Em seguida, basta digitar atop e aguardar a janela pop-up com o processo principal em execução:
Na última coluna, podemos ver o campo CPU com a porcentagem de uso do processo no momento atual e, se houver uma carga alta, então, mate o processo ou suspenda-o:
E o segundo comando para eliminá-los:
Se a CLI não retornar uma mensagem com o problema, então a execução foi bem-sucedida!
Conclusão
Encontrar erros e desafios em um sistema baseado no Debian é uma parte comum da administração do sistema. Este guia abordou vários aspectos da identificação e resolução eficaz desses problemas.