使用 HTTP 存档和大查询深入挖掘 Web 性能分析

作为 Web 开发人员或 IT 团队成员,您绝对不可能有太多数据来详细说明网站的性能及其与业内其他用户的比较情况。 了解您的网站性能与互联网交叉采样相比的一种简单方法只需三个步骤:

作为 Web 开发人员或 IT 团队成员,您绝对不可能有太多数据来详细说明网站的性能及其与业内其他用户的比较情况。 了解您的网站性能与互联网交叉采样相比的一种简单方法只需三个步骤:

  1. 使用 Dotcom-Monitor的网站速度测试等工具在您的网站上运行 Web 性能基线。
  2. 使用HTTPArchive上的工具在前 100 个网站或前 1000 名网站上运行查询。
  3. httpsArchive.org
  4. 比较数据,看看您与行业对抗的立场。

这使您可以深入了解常规 Web 性能分析和平均值,但您无法深入了解详细信息。 HTTP 存档捕获的数据集非常庞大,超过 400 GB。 但是,如果您靠页面加载时间的剃须毫秒而茁壮成长,则希望访问尽可能多的数据。

触手可及的 Web 性能分析

现在,完整的 HTTP 存档数据集现在可在 BigQuery 上使用,BigQuery 是一个 Google 工具,允许开发人员或其他任何对比较分析感兴趣的人分析云中的大数据。 用户可以针对大型数据集运行类似 SQL 的查询,并在数秒内获得结果。 现在,您可以深入了解详细的 Web 性能分析数据,并亲自了解网站性能的洞察细微差别。 如果你还没有尝试过,你就错过了;您可以根据心度内容处理 Web 性能数字,并深入了解您的网站适合混合的内容。

例如,您可以对大量数据运行真正基本的查询,并立即接收结果。 我们运行了一个查询,以确定前 10 个最受欢迎的内容分发网络,具有以下查询:

[note note_color=”#e7e7e7″]选择 cdn, 计数 (cdn) 作为计数 从 Web Performance Analytics - Top 10 DCN[httpsarchive:runs .2014_09_01_pages] 哪里 CDN “” 分组 按 CDN <> 顺序 按计数 描述;[/note]

返回以下结果:

在考虑引用最多的 CDN 时,我们还想知道一般哪些站点承载引用最多的材料(例如跟踪分析代码等),因此我们运行了以下查询以检索此信息:

[note note_color=”#e7e7e7″]选择域(req.url) Most_Referenced,COUNT(*) 总计Most Referenced - HTTP Archive and BigQuery
从 [httpsarchive:runs .2014_09_01_requests] 作为要求加入 (
选择域(url) 自我,页码
从 [httpsarchive:runs .2014_09_01_pages] ) 作为页面 ON 页.pageid = req.pageid
WHERE 域(req.url) != 页面.self
按Most_Referenced分组
订单 BY 总去向;[/note]

毫不奇怪,我们看到两个列表中都出现了几个先行者,因为 Google、Akamai 和 Amazon 云滨都被广泛用作内容的主机以及其他参考元素。

这些数据对任何人都来说可能并不感到意外,但这些查询实际上只是冰山一角。 您可以编写更复杂的查询,以真正深入了解 Web 性能分析数据,并确定与您最感兴趣的性能指标相关的内容。

更好的是,能够将电子表格作为您处理大数据处理能力的前端。 BigQuery 现在与 Google 文档进行接口,允许用户快速轻松地查看和共享结果—与老板、感兴趣的同事等。

这里是一个伟大的视频,从谷歌开发者倡导者伊利亚格里戈里克在速度去年,详细说明如何开始使用HTTP存档数据大查询。 不要忘记:第一步是为您自己的网站进行基线 Web性能测试,以便您有基准将自己的 Web 性能分析与互联网的其余部分进行比较。

 

 

 

 

 

Facebook
Twitter
LinkedIn
电子邮件
打印