帮助中心搜狗与站长从搜狗中删除内容

要从搜索结果中删除内容(包括网页摘要、标题、网页内容,或者整个网址或网站),网站拥有者可以选择使用多种方法。比如,从网页中删除相关信息、将网页从网络中彻底删除,以及通过标记告诉搜狗不要抓取相应网页。

以下是删除内容常见的几种情况:

1.网站已经更改,删除过时信息

    • 如果网页内容(无论是内容还是网页标题或者其他信息)已经更改,则在我们下次抓取网站并刷新索引前,网页快照仍然会包含原有的内容,因而

      这些内容仍然会出现在搜索结果中,您可以申请更新删除快照来删除快照信息。

       

2.我想从搜索结果中彻底删除某个网页
  • 为确保永久删除您的内容,请进行以下某项操作。如果您没有进行相应操作,那么您的网站稍后可能会重新显示在搜索结果中。


    • A.如果网页已不存在,请确保服务器返回 404(未找到)或 410(不存在)。这样可让 Sogou 知道该网页已不存在,无需再在搜索结果中显示。

    • B.如果网页仍存在,但您不想让其显示在搜索结果中,请使用 robots.txt 阻止 sogouspider 进行抓取。请注意,在通常情况下,即使您已通过

      robots.txt 禁止抓取某个网址,但如果我们在其他网站中发现该网址,仍会将相应网页编入索引。



    此外,如果要从搜索结果中删除非 HTML 格式的文件(例如可下载的 PDF),则您或网站站长应确保从服务器中删除该文件。

3.我想从搜索结果中删除整个网站或某个目录的内容
  • 如果您是网站拥有者,则需要在验证网站所有权后申请删除整个网站或目录。
  • 为确保永久删除您的目录或网站,请使用 robots.txt 阻止抓取工具访问该目录(如果要删除的是网站,则应阻止抓取工具访问您的整个网站)。我们建议您在请求删除目录前或请求删除后不久执行该操作。否则,您的内容稍后可能会重新显示在搜索结果中。仅返回 404 HTTP 状态代码还不够,因为可能出现这样一种情况:即某个目录返回了 404 状态代码,却仍然分发其中的文件。通过使用 robots.txt 禁止抓取目录,可确保将目录的所有子项也一并排除。
  • 完成上述某步操作后,您就可以发出删除请求,从搜索结果中删除相应目录及其所有内容。
  • 删除 https://www.example.com 的同时还会删除 http://www.example.com,以及 http://example.com 和 https://example.com。

如果您不是网站拥有者,请通过网站联系网站管理员,要求他通过以上步骤进行删除。搜狗没有权利控制互联网中的内容。

请求删除网站时,请务必谨慎。只有在您想从搜狗的索引中永久删除网站的所有内容时,才应该请求删除网站。