分析站点地图

今天,我想分析mathworks.com上的网站地图。这些XML文件位于标准位置,为搜索引擎提供站点上的页面列表。我想把这些列表与我通过爬行网站编译的列表进行比较。我的目标是找到网站的区域,我错过了爬行或领域,我爬但缺少网站地图。

本文涉及的功能代码风格包括:视频

  • webreadreadtable
  • 包含startsWith提取extractBetween,和新的模式对象

跟我来(@stuartmcgarrity),如果你想在我发布时通过Twitter得到通知。

全屏播放视频,以获得更好的观看体验。

|

评论

请点击留下评论在这里登录到你的MathWorks帐户或创建一个新的。