这是一个通用的社区Wiki全能问答集,旨在解决有关某个站点或特定站点内容未出现在搜索引擎结果中的原因的任何问题
。
/>
如果您的问题作为该问题的重复被关闭,并且您
觉得此处提供的信息不能提供足够的答案,请在Pro Webmasters Meta上进行讨论。 br />
我的网站(或网站上的特定页面)未出现在搜索引擎结果中。它吗?
#1 楼
有多种原因可能导致您的内容未出现在搜索引擎结果中,但是,请务必注意,搜索引擎的索引可能包含未显示在其中的页面其结果
页面。
如何判断您的内容是否已被索引
实际上可能很难判断您的内容是否已被索引。
搜索您站点中的所有文档,并查看列出的文档数量
Google:输入
site:example.com
(其中example.com
是您的域,冒号后不能有空格。)必应:输入
site: example.com
雅虎:输入
site: example.com
(或使用高级搜索表格)用8到12个单词的唯一句子搜索特定文档,然后用引号搜索该句子。例如,要查找此文档,您可以选择搜索“您的内容可能不会出现在搜索引擎结果中的原因数量”
除上述内容外,还可以使用
inurl:
和intitle:
搜索关键字尝试使用类似的方法,例如keyword with another keyword inurl:example.com
,这将显示仅针对指定域编制索引的upi页面。网站Google网站管理员工具-信息位于“健康”»“索引状态”下。如果您已提交站点地图,则还可以查看每个站点地图文件中有多少文档已被索引。
Bing网站管理员工具似乎未通过这些方法之一对文档进行索引,但是可以使用其他
方法在索引中找到文档。例如,即使您可以搜索网站站长工具的句子并在搜索引擎上找到
文档,网站站长工具也可能报告几乎没有索引该文档。在这种情况下,文档会被
实际索引。
内容如何被索引
在搜索引擎将内容编入索引之前,他们必须使用
网络搜寻器找到内容。
您应该检查Web服务器的日志,以查看
搜索引擎的抓取工具(由其用户代理标识-例如,
Googlebot,
Bing / MSNbot)是否正在访问您的现场。
大型搜索引擎(例如Google和Bing)通常会经常抓取网站
通过注册为网站管理员(Google网站管理员
工具,必应网站管理员
工具)或如果搜索
来通知搜索引擎网站是否存在引擎不提供此功能,而是向其爬网程序(例如Yahoo)提交链接。可能会很快发现内容的索引,但是,这些更新有时会被延迟。
更小的搜索引擎的响应速度也可能慢得多,并且需要数周才能索引新内容。 />
如果您的内容仅在线了几天,却没有其他网站的链接(或者其链接来自爬行者不经常访问的网站),则可能是尚未编入索引。
如果您的网站已经存在超过几个月,则搜索引擎
可能对其信任程度不足以索引很多内容。
网站管理员是否排除了内容?
如果您要从其他人那里接管网站,并且特定页面或目录存在问题,则此步骤尤为重要:
检查
robots.txt
和META
机器人
排除对象,如果希望爬网程序将内容编入索引,则将其删除
。
是否存在技术问题,无法阻止对您的内容编制索引?
如果您有一个已建立的网站,但未对特定内容进行索引
(该内容所在的URL上没有Web爬网程序命中
驻留)由Google和Bing提供的网站管理员工具可能会提供
有用的诊断信息。 />阻止内容被编入索引的抓取工具,如果您使用
Google网站站长工具,则如果在您的网站上检测到任何这些
问题,则会收到警报。
尽快纠正错误和配置错误,以确保
您网站上的所有内容都被编入索引。
内容质量低吗?
搜索引擎不会索引他们抓取的大多数页面。他们只索引最高质量的内容。如果出现以下情况,搜索引擎将不会为内容编制索引:
是垃圾邮件,胡言乱语或胡说八道。
在其他地方可以找到它。当搜索引擎找到重复的内容时,他们仅选择重复项之一进行索引。通常这是具有更多声誉和链接的原始作品。
很薄。它需要多于几行的原始文本。最好多得多。自动创建的页面内容很少,例如您每个用户的页面都不太可能被索引。
它没有足够的信誉或链接。网页可能埋在您的网站中太深而无法排名。如果没有外部链接并且从首页上单击几次后,任何页面都不可能被编入索引。网站上有数百个页面,Google几乎永远不会选择为每个页面建立索引。如果您的网站有数以万计的页面,则Google通常只选择对这些页面的一小部分编制索引。
Google根据网站的整体声誉和内容质量来选择要编制索引的页面数。随着网站的声誉不断提高,Google通常会在一段时间内为更大比例的网站建立索引。
#2 楼
我认为我不需要重复上述操作,但是,如果您不熟悉新工具,可以通过以下方法进行检查。您可以检查是否robot.txt文件不会通过转到旧版Google网站站长的robots.txt测试工具来阻止内容。
Google搜索控制台(新版本)
Google搜索控制台可提供比旧版本有价值的信息。直接从Google Search Console中检查问题,无论您的页面是否被抓取,是否被编入索引,是否正常运行以及是否存在问题。
登录到您网站的Google搜索控制台
如果您具有多个域属性,请确保已选择所需的域。
Google网站管理员已弃用的工具
这是您如何使用新的Search Console
#3 楼
如果您的根目录中有robots.txt文件,则可能是在告诉Google不要为您的网站编制索引。您检查过吗?
通常,删除(或重命名)那些文件通常是安全的,因为听起来您确实希望被索引。
重要提示:如果您试图让Google Adsense在您的网站上运行,这可能会破坏交易。
无论您在哪里放置特殊代码,如果未在索引中注明您的网站,则他们将无法正常运行。
评论
robots.txt文件具有用户定义的一组规则以进行爬网或不进行爬网,因此将其删除不是解决方案,因为这是第一个要爬网的文件。最好的解决方案是修正规则,测试robots.txt文件,然后在robot.txt文件中添加sitemap指令,以使lastmap与lastmod保持最新,并更改频率属性。
– Deepak Mathur
19年4月13日在13:33
评论
相关:webmasters.stackexchange.com/q/125191/52079
– Oker
19-09-17在8:06