网页Web优化工具Scrutiny 8 for Mac常见问题解答

Scrutiny 8 for Mac是很多网站站长都在使用的网页Web优化工具,使用Scrutiny 8 for Mac可以帮助您检查网站中包含的每个链接的状态,以提高其质量,提高网站的排名,并为访问者提供更好的用户体验它带有一个网站管理员,您可以在其中轻松输入您想要开始评估的网站的源URL。下面我们就来看看网页Web优化工具Scrutiny 8 for Mac常见问题解答。
网页Web优化工具Scrutiny 8 for Mac常见问题解答
网页Web优化工具Scrutiny 8 for Mac常见问题解答

如果您的扫描结果未达到预期效果,请查看答案是否在此处。
检索完成时只报告了一个链接
快速测试 - 在浏览器中关闭javascript和cookie,然后尝试重新加载页面。如果您没有按预期看到您的网页,那么您的网站需要启用其中一项或两项。这些选项位于“高级”选项卡下的站点设置和选项下。
首先要尝试的是将用户代理字符串切换为Googlebot(这是首选项中的第一项,第一个选项卡,您应该可以从下拉列表中选择googlebot)。如果这不起作用,请切换到“真正的”浏览器用户代理字符串之一,即Safari或Firefox。
现在,审查现在有一个工具可以帮助诊断这种失败。它可能会预测到问题,并在尝试爬网后为您提供诊断窗口。如果您拒绝该要约或未看到该要约,您仍然可以从“工具”菜单“启动网址的详细分析”访问该工具。(无论爬网是否成功,都可以从菜单中使用此工具)。它显示了许多内容,包括加载了Scrutiny收到的页面的浏览器窗口,html代码本身以及请求/响应的详细信息。
页面超时/ Web服务器停止响应/ 509/429/999状态代码
这并不罕见。有些服务器会响应许多同时发出的请求,但有些服务器会遇到问题,或者如果被同一个IP轰炸,可能会故意停止响应。
用于引入延迟的解决方案。从版本8开始,Scrutiny处理得更加优雅。现在,线程滑块上方有一个控件,允许您指定每分钟的最大请求数。
网页Web优化工具Scrutiny 8 for Mac常见问题解答
超时和延迟你不需要做任何数学; 它不是'每个线程'。审查将根据您设置的线程数计算事物(使用一些线程将有助于保持平稳运行)。如果适合您指定的最大请求,它将减少线程数。
如果您的服务器响应速度很慢,则可以增加超时。
据我们所知,999特定于LinkedIn,他们似乎在阻止自动检查器和机器人方面非常成功。如果你真的不想在结果中使用这些代码,唯一合理的方法是设置一个规则来忽略或不检查它们。
在没有接近完成的情况下,Scrutiny似乎抓取了比存在/扫描页面更多的页面
Scrutiny可能处于循环中有几个原因。最有可能的是查询字符串中存在某种会话ID或跟踪ID,使得每个网址都显得唯一,甚至重复访问同一页面。这可能是论坛/讨论区。对此的简单解决方案是使用'ignore querystrings'设置。
如果您必须允许查询字符串,因为其中有页面ID,则Scrutiny可以选择仅忽略会话ID(或其他单个参数)。
对于在浏览器中显示正常的链接,将报告404或其他错误
某些服务器上会出现这种情况,其中http://链接和https://链接都出现在网站上。似乎有些服务器不喜欢对http和https网址的快速请求。尝试从https:// url开始并将http://链接列入黑名单(制定规则'不要检查包含http://的网址'),然后查看https://链接是否返回正确的代码。
也值得更改“首选项”中的用户代理字符串,服务器有时可以对不是可识别的浏览器的UA字符串做出不同的响应,尽管版本8会自动使用其他设置进行一定量的重新尝试
[社交网站即Youtube,Facebook]的链接被报告为错误链接或Scrutiny中的错误,但链接在我的浏览器中正常工作?
在您的浏览器中,注销相关网站,然后访问该链接。然后,您将看到Scrutiny看到的同一页面,因为默认情况下,它不会尝试进行身份验证。
如果您看到一个页面上写着“您需要登录才能看到此内容”,那么这就是答案。如果网页要求您登录,网站是否应返回404是有争议的,但这应该与相关网站一起使用。
你有几个选择。您可以在Scrutiny中打开身份验证和Cookie(并使用这些复选框右侧的按钮登录)。您可以设置规则,以便Scrutiny不会检查这些链接,或者您可以在社交网站上更改您的个人资料,以便每个人都可以看到该内容。
如果问题是LinkedIn链接给出状态999,那么这是一个不同的问题,LinkedIn正在检测自动请求并发送999代码以示抗议。避免这种情况的唯一方法(据我所知)是严格限制审查(参见上面的“页面超时/网络服务器停止响应”),但这会严重降低扫描速度,因此最好设置规则忽略LinkedIn链接
限制
如果您的站点是一个更大的站点,则处理器和HD(虚拟内存)上的内存使用和需求将随着爬网页面列表和检查链接的时间变长而增加。
在过去几个版本中,审查变得更加有效,并且计算机容量也在增长,但如果网站足够大(数百万个链接),那么应用程序最终将耗尽资源,显然无法继续。

  • 由于查询字符串中的会话ID或日期,确保Integrity不会进入循环或多次抓取同一页面 - 您可以在设置中关闭查询字符串,但要确保要抓取的内容不是'由查询字符串中的信息控制(例如,页面ID)
  • 查看您是否正在抓取不必要的页面,例如留言板。为了完整性和详细审查,一个使用良好的留言板可能看起来像成千上万的独特页面,它将尝试列出并检查所有这些页面。同样,您可以通过将部分网址或查询字符串列入黑名单或忽略查询字符串来排除这些网页。
  • 您可以部分抓取网站。您可以通过子域扫描,按目录扫描或使用黑名单或白名单来执行此操作。
    提示:
    如果您在子域(例如engineering.mysite.com)内启动,则如果关闭“考虑根域内部的子域”设置,则扫描将仅限于该子域
    如果您在“目录”内启动(例如,mysite) .com / engineering)
    如果你创建一个白名单规则,即只跟随包含/ manual /的链接,扫描将仅限于该目录,扫描将仅限于包含该片段的网址。
    我在自己的网页上使用Google广告,并且不希望通过我的IP地址点击这些广告
    您网页上的Google Adsense代码只是一段javascript,不包含广告或链接。当浏览器加载页面时,它会运行javascript,然后将广告拉入。严格审核不会运行javascript(仔细检查Render页面(运行javascript)选项是否已关闭)所以它不会看到任何广告或找到其中的链接。
    显示为“www.mysite.com/../page.html”的链接被报告为错误,但当我在浏览器中单击它时,它的效果非常好
    有时链接在html中写为'../mypage.html'。../表示页面可以在上面的目录中找到,只要链接在站点深处就可以了。如果它出现在该表单的顶级页面上,那么它在技术上是不正确的,因为没有人应该有权访问您域名上方的目录。浏览器倾向于容忍这种情况并假设该链接应该指向您网站的根目录。默认情况下,Scrutiny不会做出此假设并报告错误。从v6.8.1开始,首选“容忍../在域之上传播”(常规选项卡)
    使用非ascii或unicode字符的链接被报告为错误,但是当我在浏览器中单击它时,它运行得非常好
    Integrity和Scrutiny现在处理URL中的非ascii字符。
    Scrutiny现在支持国际化域名(IDN),它使用punycode编码/解码的标准方法来处理这个问题。请注意,可以使用“相似”字符(同形异义***/脚本欺骗)制作IDN。浏览器有不同的方法来防御/防止这种情况,这可能是使用浏览器中的链接和Scrutiny的结果之间的差异。
    请注意,“unicode normalization”是一个用更常见的等价物替换或考虑等效的某些相似字符的系统。默认情况下,此选项在Scrutiny(首选项>链接>高级)中打开。在浏览器和Scrutiny中表现不同的链接(特别是如果它开始与Scrutiny中关闭的规范化一起工作)可能表明您的链接URL存在可疑之处。
    红色和橙色的颜色在列表中意味着什么?
    要检查链接,Scrutiny会发送请求并从您的服务器(200,404,无论如何)接收状态代码。
    “状态”列会告诉您代码。200个代码表示链接良好,300表示您可能需要了解的内容(通常是重定向)但链接仍然有效,400个代码表示链接错误且页面无法访问,500个代码表示服务器出现某种错误。所以数字越高,对错误的关注就越多。仔细检查这些(默认情况下)白色,橙色和红色。
    如果您不考虑重定向问题,则可以在“首选项”(“链接”选项卡)中关闭橙色。您还可以在“首选项”(常规选项卡)中选择不同颜色甚至完全关闭此着色
    (这里有所有可能的状态代码的完整列表:http://en.wikipedia.org/wiki/List_of_HTTP_status_codes)但是Scrutiny确实帮助您描述状态和代码编号。
    显示200表示服务器不存在的链接
    您的提供商可能会认识到这一事实并插入自己的页面(可能带有搜索框和一些有利于他们的广告)并返回200代码。他们称这是一项有用的服务,但当我们试图找到不良链接时,它对我们没有帮助。
    您可以要求服务提供商关闭此行为(通过其网站上的页面或通过联系他们)。如果没有你可以使用'软404'功能来为这些网址引发问题。这里有一个更长的解释这个问题和解决方案。
    它崩溃了
    据我们所知,这种情况很少见,而且一旦发生,我们真的很想知道。请使用此表单发送一些详细信息以帮助我们。
    崩溃报告中的详细信息可能会有所帮助,如果可能请发送。比报告本身更重要的是我们需要做的才能体验同样的问题。
    Scrutiny运行时会吃掉磁盘空间
    这应该仅适用于非常大的站点,从版本6开始,Integrity和Scrutiny将不那么需要资源。以下是一些使Scrutiny更有效的措施。
    转到您的站点的设置,选项选项卡,有四个复选框,标记为“这些选项可能会对资源产生严重影响” - 如果可以,请取消选中它们,尤其是语法检查和关键字分析。
    确保关闭了javascript选项。这应该只在非常罕见的情况下使用,其中包含链接的页面内容是由javascript生成的。它位于“高级”选项卡上的站点设置中(“渲染页面(运行javascript)”)
    也可以在抓取时取消选中“设置”>“选项”>“归档”页面,然后在“内容”>“首选项”>“SEO”>“计 如果选中其中任何一个框,则Scrutiny必须缓存页面内容。根据页面的大小和数量,这可能意味着大量的空间。除非您在扫描后保存存档,否则当您退出或失败时,当您开始下一次扫描时,将删除此缓存。
    如何抓取我的Wix网站
    Wix对javascript / AJAX / Flash的依赖使得网络抓取工具(以及任何不使用常规最新浏览器并且启用了js的人)变得非常困难。不建议将其作为一种可访问和搜索引擎优化的网站。如果您确实需要扫描Wix站点,Scrutiny现在应该检测到Wix站点并采取必要措施以便能够正确地对其进行爬网。

以上就是关于网页Web优化工具Scrutiny 8 for Mac常见问题解答,希望能解决您在使用Scrutiny 8 for Mac是遇到的一些问题。

猜你喜欢

转载自blog.51cto.com/14208028/2381354