Pesquisando deep on Web Performance Analytics com HTTP Archive e BigQuery

Como desenvolvedor web ou membro da equipe de TI, você nunca pode ter muitos dados detalhando o desempenho do seu site e como ele se compara a outros em todo o setor. Uma maneira simples de entender como o desempenho do seu site se compara a uma amostra cruzada da internet dá apenas três passos:

Como desenvolvedor web ou membro da equipe de TI, você nunca pode ter muitos dados detalhando o desempenho do seu site e como ele se compara a outros em todo o setor. Uma maneira simples de entender como o desempenho do seu site se compara a uma amostra cruzada da internet dá apenas três passos:

  1. Execute uma linha de base de desempenho da Web em seu site usando uma ferramenta como o Teste de Velocidade do Sitedo Dotcom-Monitor .
  2. Execute uma consulta nos 100 ou 1000 melhores sites usando as ferramentas no HTTPArchive.
  3. httpsArchive.org
  4. Compare os dados para ver onde você está contra a indústria.

Isso lhe dá uma ótima visão sobre análises e médias gerais de desempenho da Web, mas você não pode investigar os detalhes. O conjunto de dados capturado pelo HTTP Archive é enorme, bem mais de 400 GB. No entanto, se você prosperar em barbear milissegundos a partir de um tempo de carga de página, você deseja acesso ao máximo de dados possíveis.

Análise de desempenho da Web na ponta dos dedos

Agora, o conjunto de dados completo do HTTP Archive já está disponível no BigQuery, uma ferramenta do Google que permite que desenvolvedores ou qualquer outra pessoa interessada em análises comparativas analisem big data na nuvem. Os usuários podem executar consultas semelhantes ao SQL contra enormes conjuntos de dados e obter resultados em segundos. Agora você pode investigar os dados detalhados da análise de desempenho da Web e descobrir nuances perspicazes sobre o desempenho do site você mesmo. Se você ainda não experimentou isso, você está perdendo; você pode triturar números de desempenho da Web para o conteúdo do seu coração e obter uma análise aprofundada de onde seu site se encaixa na mistura.

Por exemplo, você pode executar consultas realmente básicas em conjuntos enormes de dados e receber resultados imediatamente. Fizemos uma consulta para determinar as 10 redes de distribuição de conteúdo mais populares com a seguinte consulta:

[note note_color=”#e7e7e7″]SELECIONE CDN, Count(cdn) como Contagem DE Web Performance Analytics - Top 10 DCN [httpsarchive:runs .2014_09_01_pages] ONDE CDN < > “” GRUPO POR CDN ORDER BY Count Desc;[/note]

que retornaram os seguintes resultados:

Ao pensar nas CDNs mais referenciadas, também nos perguntamos quais sites em geral hospedam o material mais referenciado (como código de rastreamento para análise etc…) então executamos a seguinte consulta para recuperar essas informações:

[note note_color=”#e7e7e7″]SELECIONE DOMÍNIO (req.url) Most_Referenced, CONTAGEM(*) TotalMais Referenciados - Arquivo HTTP e BigQuery
DE [httpsarchive:runs .2014_09_01_requests] como req JOIN (
SELECIONE DOMÍNIO (url) self, pageid
De [httpsarchive:runs .2014_09_01_pages] ) como páginas ON pages.pageid = req.pageid
ONDE DOMÍNIO (req.url) != pages.self
GRUPO POR Most_Referenced
ORDEM POR Total desc;[/note]

Não surpreende que vários dos precursores aparecendo em ambas as listas como Google, Akamai e Amazon cloudfront são amplamente utilizados como hosts de conteúdo, bem como elementos referenciados adicionais.

Esses dados podem não ser uma grande surpresa para ninguém, mas essas consultas realmente apenas tocam na ponta do iceberg. Você pode escrever consultas mais complexas para realmente investigar os dados de análise de desempenho da Web e identificar conteúdo relevante para métricas de desempenho que mais lhe interessam.

Melhor ainda é a capacidade de usar uma planilha como sua frente para esse poder de processamento de big data. O BigQuery agora faz interface com o Google Docs, permitindo que os usuários vejam e compartilhem resultados de forma rápida e fácil — com o chefe, colegas de trabalho interessados e muito mais.

Aqui está um ótimo vídeo da advogada do Google Developer Ilya Grigorik na Velocity no ano passado que detalha exatamente como começar a usar o HTTP Archive Data no BigQuery. Não se esqueça: O primeiro passo é obter seu teste de desempenho da Web de linha de base para o seu próprio site para que você tenha benchmarks para comparar suas próprias análises de desempenho da Web com o resto da internet.

 

 

 

 

 

Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
LinkedIn
Share on email
Email
Share on print
Print