07-16-2024 05:04 AM - editado 07-16-2024 06:45 AM
Olá Network Folks!
Após longo tempo sem falar sobre, hoje voltamos com o tópico da tecnologia que mais me brilha os olhos atualmente (badumm tss) que é o Thousandeyes.
Dando sequência nesse artigo de 2021 quando escrevi aqui e após minha participação no Quintas Quinze da Cisco Community, irei mostrar como se cria um teste no Thousandeyes e como interpretar as correlações dos resultados.
Pegue seu café e let's route!
A tão sonhada Observabilidade
Observabilidade (Observability) juntamente com a AI (Inteligência Artificial) a meu ver, são um dos top topics hoje no mundo da tecnologia. Conforme eu já escrevi aqui, a área de infra cada vez mais busca se aprimorar nos conceitos de CI/CD o qual é o principal pilar no mundo dos DEVs e por conta disso, as redes evoluíram para acompanhar toda a evolução das necessidades de negócio e tirar proveito das redes definidas por software (SDN).
Oriundo a isso, vivemos um momento onde a observabilidade se torna necessária e muito desejada nas companhias que querem sair do cenário reativo e ter uma análise mais detalhada e proativa dos dados da sua rede e/ou aplicação (lembram do rastreador dos sayajins que dava todos os dados e a forca do lutador? Pois bem, quase isso hahaha)
fonte: https://www.manageengine.com/it-operations-management/observability-and-beyond.html
Para se ter a tão sonhada observabilidade, é preciso um adoption bem feito e ter uma integração entre os times de network e devops para que todas as correlações sejam bem feitas e para que todos "falem a mesma língua", diminuindo assim os war rooms e trazendo inteligencia para a operação. Seguido disso, importante o foco na experiência do usuário final seja ele um colaborador trabalhando de casa, um CEO, um cliente, pois todos eles utilizam a nossa infra-estrutural e todos podem vir de diversos locais diferentes logo, são perspectivas e "visões" diferentes sobre o uso de nossa infraestrutura. LEMBRE-SE, observabilidade NÃO É uma tecnologia isolada, e sim um conjunto de soluções e workflows que geram insights para o seu ambiente.
Vou deixar esse artigo da Kentik que resume bem o que eu quero dizer e gosto muito de uma frase deles que é:
"Network observability is the ability to answer any question about your network quickly and easily."
A criação de testes com Thousandeyes
Contextualizado um pouco do que é observabilidade, podemos agora ir para a demonstração com o Thousandeyes. Conforme expliquei no primeiro artigo sobre a ferramenta (sugiro que leia ele primeiro antes de seguir aqui), os testes da Thousandeyes são divididos por categorias e eles são "nested". O que isso quer dizer? Quer dizer que a ferramenta entende que se você vai verificar uma página HTTPS, por exemplo, dentro do mesmo teste, ele já inclui os testes da camada de "network" e "routing" automaticamente. Abaixo esta uma imagem demonstrando os tipos de teste possíveis e suas categorias.
OBS: Não irei entrar no mérito de quantos pontos (units) cada teste consome e nem como isso é precificado. Para isso, sugiro que verifique esse link ou veja com seu parceiro Cisco para entender melhor a lógica de precificação.
No nosso cenário, irei criar um teste PAGE LOAD do site How to e irei verificar como esta a saúde do nosso site:
Acessar o app.thousandeyes.com/login e acessar com suas credenciais (importante relembrar que o Thousandeyes é uma aplicação SAAS)
Ir para "Cloud & Enterprise Agents" > Test Settings e Add new test para criar um novo teste
Creating a new test
3. Inserir a URL do meu site e definir quais os agents irão realizar o teste. (No nosso caso, todos os 3 agentes serão agentes da própria ThousandEyes, logo são todos Cloud Agents)
New Test
OBS: Veja que ao selecionar o Layer "Web" e o tipo de teste como "Page Load", a ferramenta já me informou os meus testes nested que serão criados juntamente com esse teste de forma automática.
Nested tests
4. Podemos ver os resultados do teste para https://www.howtonetwork.com.br/ dividido por Page Load, HTTP Server, Agent to Server e BGP. Na aba Page Load podemos ver qual o tempo que cada um dos nossos clouds agents que escolhemos levam para carregar nossa home page e outras informações como o waterfall de toda a requisição.
Page Load overview
Waterfall da conexão originada pelo agent de BH,Brasil
5. Na aba HTTP Server podemos ver a saúde da requisição HTTP para a home page. No modo "Table" podemos ver também o código de resposta da requisição, se houve algum erro e qual erro foi esse. No nosso caso, tivemos um erro no agent de SP, e iremos entender qual foi o causador disso em breve seguindo com as camadas de tests.
HTTP Server Availability overview
6. Na aba Agent to Server é onde fica todas as métricas relacionadas a network propriamente dito, ou seja, perda de pacotes, jitter, latência, etc. No modo "Path visualization" podemos ver de forma gráfica todos os saltos que realizamos para alcançar o destino, além de ter informações detalhadas do dispositivo no meio do caminho. Como podemos ver, algo aconteceu nesse período que selecionei que o node de SP teve 100% de perda em 1 de seus hops (10.10.10.5) para alcançar o nosso site, fazendo com que o alerta no print anterior ocorresse por 1 momento. Conseguem ver o poder da ferramenta? Apenas correlacionando essas informações eu obtive tive a minha causa raiz, onde ocorreu e qual foi o momento sem ter que pedir uma informação sequer.
Agent to server overview loss map
Information about the destination (howtonetwork homepage)
Correlation wih the page load, availability and the latency
7. Na aba BGP temos a relação de todos os Cloud Agents da Thousandeyes e como eles alçam o prefixo da nossa aplicação. Podemos ver fazendo a comparação entre Path Changes x Reachability x Updates que não tivemos qualquer update BGP nesse horário, logo, o problema que tivemos foi relacionado a um problema de rede interna entre o cloud agent de SP para com o destino, e não uma manipulação BGP que possa ter dado a intermitência na comunicação entre ele e o destino.
OBS: Caso tenha curiosidade de entender qual a base de dados BGP a Thousandeyes usa para realizar essa consulta leia aqui.
Essa foi apenas uma pequena demonstração de como o Thousandeyes tem inovado no assunto Network Observability. Da época que escrevi o primeiro artigo sobre essa ferramenta para hoje muita coisa mudou e continua mudando, e acredito que eles têm tudo para conquistar ainda mais o mercado. Por curiosidade eu dei uma olhada nas próximas novidades e muita coisa que eu estava bem empolgado de ver embargado no Thousandeyes finalmente vai ser inserido. Você pode conferir as novidades que eles soltaram no Cisco Live de 2024 aqui.
Documento super bem explicado e ajustado. Parabéns por sempre compartilhar seu conhecimento e dedicação na solução de ThousandEyes!
Encontre respostas, faça perguntas e conecte-se com nossa comunidade de especialistas da Cisco de todo o mundo.
Estamos felizes por você estar aqui! Participe de conversas e conecte-se com sua comunidade.
Navegue pelos links rápidos da Comunidade e usufrua de um conteúdo personalizado e em seu idioma nativo: