cancelar
Mostrar resultados para 
Pesquisar em vez de 
Queria dizer: 
cancel
221
Apresentações
3
Útil
1
Comentários
Pedroxh
Spotlight
Spotlight

Olá Network Folks!

Após longo tempo sem falar sobre, hoje voltamos com o tópico da tecnologia que mais me brilha os olhos atualmente (badumm tss) que é o Thousandeyes.

Dando sequência nesse artigo de 2021 quando escrevi aqui e após minha participação no Quintas Quinze da Cisco Community, irei mostrar como se cria um teste no Thousandeyes e como interpretar as correlações dos resultados.

Pegue seu café e let's route!

 

A tão sonhada Observabilidade

 

Observabilidade (Observability) juntamente com a AI (Inteligência Artificial) a meu ver, são um dos top topics hoje no mundo da tecnologia. Conforme eu já escrevi aqui, a área de infra cada vez mais busca se aprimorar nos conceitos de CI/CD o qual é o principal pilar no mundo dos DEVs e por conta disso, as redes evoluíram para acompanhar toda a evolução das necessidades de negócio e tirar proveito das redes definidas por software (SDN).

Pedroxh_0-1721110321773.gif

Oriundo a isso, vivemos um momento onde a observabilidade se torna necessária e muito desejada nas companhias que querem sair do cenário reativo e ter uma análise mais detalhada e proativa dos dados da sua rede e/ou aplicação (lembram do rastreador dos sayajins que dava todos os dados e a forca do lutador? Pois bem, quase isso hahaha)

Pedroxh_1-1721110367263.png

fonte: https://www.manageengine.com/it-operations-management/observability-and-beyond.html

Para se ter a tão sonhada observabilidade, é preciso um adoption bem feito e ter uma integração entre os times de network e devops para que todas as correlações sejam bem feitas e para que todos "falem a mesma língua", diminuindo assim os war rooms e trazendo inteligencia para a operação. Seguido disso, importante o foco na experiência do usuário final seja ele um colaborador trabalhando de casa, um CEO, um cliente, pois todos eles utilizam a nossa infra-estrutural e todos podem vir de diversos locais diferentes logo, são perspectivas e "visões" diferentes sobre o uso de nossa infraestrutura. LEMBRE-SE, observabilidade NÃO É uma tecnologia isolada, e sim um conjunto de soluções e workflows que geram insights para o seu ambiente.

Pedroxh_2-1721110404376.png
 
Fonte:https://www.techtarget.com/searchnetworking/feature/3-best-practices-for-network-observability

Vou deixar esse artigo da Kentik que resume bem o que eu quero dizer e gosto muito de uma frase deles que é:

"Network observability is the ability to answer any question about your network quickly and easily."

 

A criação de testes com Thousandeyes

Contextualizado um pouco do que é observabilidade, podemos agora ir para a demonstração com o Thousandeyes. Conforme expliquei no primeiro artigo sobre a ferramenta (sugiro que leia ele primeiro antes de seguir aqui), os testes da Thousandeyes são divididos por categorias e eles são "nested". O que isso quer dizer? Quer dizer que a ferramenta entende que se você vai verificar uma página HTTPS, por exemplo, dentro do mesmo teste, ele já inclui os testes da camada de "network" e "routing" automaticamente. Abaixo esta uma imagem demonstrando os tipos de teste possíveis e suas categorias.

Pedroxh_3-1721110439828.png

Fonte:https://docs.thousandeyes.com/product-documentation/user-management/usage-and-billing/test-layers-units

 

OBS: Não irei entrar no mérito de quantos pontos (units) cada teste consome e nem como isso é precificado. Para isso, sugiro que verifique esse link ou veja com seu parceiro Cisco para entender melhor a lógica de precificação.

 

No nosso cenário, irei criar um teste PAGE LOAD do site How to e irei verificar como esta a saúde do nosso site:

 

  1. Acessar o app.thousandeyes.com/login e acessar com suas credenciais (importante relembrar que o Thousandeyes é uma aplicação SAAS)

  2. Ir para "Cloud & Enterprise Agents" > Test Settings e Add new test para criar um novo teste
    Creating a new test

     

Pedroxh_5-1721110492431.png

3. Inserir a URL do meu site e definir quais os agents irão realizar o teste. (No nosso caso, todos os 3 agentes serão agentes da própria ThousandEyes, logo são todos Cloud Agents)

New Test

Pedroxh_6-1721110532787.png

 

OBS: Veja que ao selecionar o Layer "Web" e o tipo de teste como "Page Load", a ferramenta já me informou os meus testes nested que serão criados juntamente com esse teste de forma automática.

Nested tests

Pedroxh_7-1721110562064.png

 

4. Podemos ver os resultados do teste para https://www.howtonetwork.com.br/ dividido por Page Load, HTTP Server, Agent to Server e BGP. Na aba Page Load podemos ver qual o tempo que cada um dos nossos clouds agents que escolhemos levam para carregar nossa home page e outras informações como o waterfall de toda a requisição.

Page Load overview

Pedroxh_9-1721110594901.png

 

Waterfall da conexão originada pelo agent de BH,Brasil

Pedroxh_10-1721110614421.png

 

5. Na aba HTTP Server podemos ver a saúde da requisição HTTP para a home page. No modo "Table" podemos ver também o código de resposta da requisição, se houve algum erro e qual erro foi esse. No nosso caso, tivemos um erro no agent de SP, e iremos entender qual foi o causador disso em breve seguindo com as camadas de tests.

HTTP Server Availability overview

Pedroxh_11-1721110639364.png

6. Na aba Agent to Server é onde fica todas as métricas relacionadas a network propriamente dito, ou seja, perda de pacotes, jitter, latência, etc. No modo "Path visualization" podemos ver de forma gráfica todos os saltos que realizamos para alcançar o destino, além de ter informações detalhadas do dispositivo no meio do caminho. Como podemos ver, algo aconteceu nesse período que selecionei que o node de SP teve 100% de perda em 1 de seus hops (10.10.10.5) para alcançar o nosso site, fazendo com que o alerta no print anterior ocorresse por 1 momento. Conseguem ver o poder da ferramenta? Apenas correlacionando essas informações eu obtive tive a minha causa raiz, onde ocorreu e qual foi o momento sem ter que pedir uma informação sequer.

Agent to server overview loss map

Pedroxh_12-1721110661303.png

 

Information about the destination (howtonetwork homepage)

Pedroxh_13-1721110675214.png

 

Correlation wih the page load, availability and the latency

Pedroxh_14-1721110685040.png

 

7. Na aba BGP temos a relação de todos os Cloud Agents da Thousandeyes e como eles alçam o prefixo da nossa aplicação. Podemos ver fazendo a comparação entre Path Changes x Reachability x Updates que não tivemos qualquer update BGP nesse horário, logo, o problema que tivemos foi relacionado a um problema de rede interna entre o cloud agent de SP para com o destino, e não uma manipulação BGP que possa ter dado a intermitência na comunicação entre ele e o destino.

OBS: Caso tenha curiosidade de entender qual a base de dados BGP a Thousandeyes usa para realizar essa consulta leia aqui.
Pedroxh_15-1721110731311.png

 

Essa foi apenas uma pequena demonstração de como o Thousandeyes tem inovado no assunto Network Observability. Da época que escrevi o primeiro artigo sobre essa ferramenta para hoje muita coisa mudou e continua mudando, e acredito que eles têm tudo para conquistar ainda mais o mercado. Por curiosidade eu dei uma olhada nas próximas novidades e muita coisa que eu estava bem empolgado de ver embargado no Thousandeyes finalmente vai ser inserido. Você pode conferir as novidades que eles soltaram no Cisco Live de 2024 aqui.

33dac1_0453c9852519428fb8ac4821fb5e4ed0~mv2.gif

Comentários
fdefreit
Cisco Employee
Cisco Employee

Documento super bem explicado e ajustado. Parabéns por sempre compartilhar seu conhecimento e dedicação na solução de ThousandEyes!

Primeiros Passos

Encontre respostas, faça perguntas e conecte-se com nossa comunidade de especialistas da Cisco de todo o mundo.

Estamos felizes por você estar aqui! Participe de conversas e conecte-se com sua comunidade.