noindex标签是什么?与nofollow的区别有哪些?
noindex是一项阻止Google搜索引擎显示(索引)您的网站的设置。有多种方法可以进行设置。目标不仅是HTML,还包括PDF文件和图像文件。
在SEO措施方面,从索引中删除低质量内容和重复内容有望提高网站的整体声誉。
另一方面,您需要小心,因为如果您滥用它或配置不正确,可能会导致您的网站流量大量损失。在这篇文章中,平哥SEO将讲解noindex怎么写、如何设置、什么时候使用、对SEO的影响以及注意点。
一、什么是无索引?
noindex是一种防止搜索引擎对网页建立索引的措施。由于该标签写在HTML文件中,因此也称为“noindex标签”。
搜索引擎通过对网页进行爬行和索引来在搜索结果中反映网站信息。设置了noindex的页面和文件将不会被索引,并且将不再显示在搜索结果中。它也不会影响现有网站的声誉。
重复的内容和低质量的内容会降低您网站的整体声誉。通过将对SEO有负面影响的内容设置为noindex并将其从搜索结果中删除,您可以期望提高网站的评价。
1.与nofollow的区别
与noindex类似的设置是nofollow。nofollow是一个设置,意思是“不会抓取页面内发布的链接”,它是一个HTML标记。
它有时与noindex同时使用,但是noindex不会索引页面,而nofollow只会阻止设置的链接被跟踪。例如,您可能希望为出于引用或参考目的而包含的URL设置nofollow,但您不希望将它们评估为与您的公司相关的链接。
如果您在下面描述的“robots元标记”中写入nofollow,则该页面内的所有链接都不会被抓取,但通过使用“rel属性”,您可以设置只不抓取相关链接。
首先,链接向Google表明网页之间的关系。如果该网站与您的网站没有直接关系,您可以通过设置nofollow来避免损害您网站的声誉。当引用指向您公司竞争对手的网站的链接时,它还用于设置nofollow。
2.与robots.txt的差异
有一个类似于noindex的设置,robots.txt(机器人点文本)。robots.txt是一个控制搜索引擎爬虫行为的文件。
对于不希望被抓取的页面,可以在robots.txt中设置“Disallow”,阻止抓取到相应的目录或页面。
例:
拒绝访问所有URL
不允许:/
拒绝“○○○”目录下的URL并允许其他目录时
不允许:/○○○/
尽管robots.txt本身会阻止抓取,但它不会指示页面被索引,因此它可能会通过外部站点的链接出现在搜索结果中。另一方面,noindex和nofollow不控制爬行。因此,它对爬行效率没有贡献。
二、使用noindex的案例
如果存在可能降低网站整体声誉的特定页面,请设置noindex以避免被搜索引擎索引。下面,我们将解释使用noindex的情况。
重复内容
低质量的内容
不需要索引的内容
您不希望编入索引的内容
1.重复内容
当您的网站上有重复内容时,请使用noindex。
重复内容是指内容相同或非常相似的内容,即使它具有不同的URL(页面)。
尽管谷歌尚未公布明确的重复内容标准,但如果内容几乎相同,也可能被视为重复内容。
例如,搜索结果可能是同一页面,仅更改了都道府县的名称,但其余信息相同,或者搜索结果可能相同,但顺序和URL不同。根据用于创建网站的CMS的规范,可能会无意中创建重复内容。
可以在Google Search Console上检查可能重复的内容,或者通过将参数“&filter=0”添加到Google搜索中的域末尾来检查。仅保留常规URL,并为其他重复内容设置noindex。
2.低质量的内容
任何对用户无用的内容都称为低质量内容,可以使用noindex来防止其影响搜索结果。
为增加页面数量而创建的低质量内容,例如大量创建的仅文本略有变化的重复内容、自动生成的内容以及通过复制其他页面创建的内容。
低质量的内容单薄且缺乏原创性,因此爬虫往往会给予较低的评分。如果存在大量低质量的内容,则是不可取的,因为这可能会降低网站本身的声誉。
不应创建低质量的内容,如果网站上存在低质量的内容,则应将其替换为高质量的内容。但是,您可能还需要没有任何实质性内容的页面,例如在您的网站内搜索时返回“0个结果”的页面。在这种情况下,请使用noindex来防止对站点搜索结果建立索引。
3.不需要索引的内容
首先,有些网站有不需要索引的内容,所以也为此类内容设置noindex。
例如,用于查询和下载材料的感谢页面、假设流量仅通过列表广告来创建的登陆页面以及用于下载的PDF。
如果此类页面无意中被索引,可能会对网站有效性衡量产生负面影响。这是因为下载了本应没有导体的材料,致谢页面的PV增加了。
为不需要索引的内容编写noindex标记是安全的。
4.您不希望编入索引的内容
如果您不想将页面或内容编入索引,也可以设置noindex。
例如,发布前有一些测试页,或者您只希望某些人(例如管理员或用户)查看的文件。
但是,如果您在测试页上设置了noindex,请注意发布后不要忘记将其删除。
三、设置noindex的三种方法
设置noindex的方式主要有3种。您可以直接使用元标记编辑页面,在HTTP响应标头中实现它,或者如果安装了WordPress等CMS,则可以使用菜单操作。
这就是设置noindex的方法。
1.在robots元标记中描述
这是直接在网页的HTML上写meta标签并设置noindex的方法。在“head”部分写入以下内容,搜索引擎爬虫在此读取网站信息。
2.在HTTP响应头中设置
元标记不能应用于非HTML文档的内容,例如PDF、视频文件和图像文件。所以在HTTP响应头中添加一个字段并设置noindex。
HTTP响应标头是构成对发送到服务器的请求的响应的元素之一。包含内容类型、缓存控制和连接状态等控制信息。
通过在HTTP响应头字段中写入“X-Robots-Tag:noindex”,您可以在HTTP响应头中包含与在HTML中写入robots元标记相同的效果。
在实践中,直接编辑“.htaccess”文件可能更实用。“.htaccess”文件是一个允许您以目录、扩展名等为单位控制Web服务器操作的文件。
例如,如果您想避免对特定PDF建立索引,请在“.htaccess”文件中写入以下说明并上传。
如果您不希望在搜索结果中显示特定图像,请编写如下内容:
3.设置WordPress功能等
如果您正在实施WordPress等CMS,您可以轻松地在菜单上配置设置,而无需直接编辑HTML。例如,WordPress的标准功能允许您逐个站点设置noindex。
即使您想为每个页面指定它,也可以通过安装All in one SEO等插件来实现。
四、检查noindex设置状态的两种方法
我们将介绍两种方法,让您轻松检查特定URL(页面)是否设置了noindex。
检查HTML源代码
检查谷歌搜索控制台
1.检查HTML源代码
仅通过查看网页无法检查是否设置了noindex。检查HTML源中是否存在相应的描述。
您可以通过使用“Ctrl+U”显示HTML源代码并使用“Ctrl+F”打开搜索窗口并搜索“noindex”来检查源代码中的noindex标记。
2.检查谷歌搜索控制台
您还可以在Google Search Console上检查noindex。
您可以通过打开“页面”菜单来检查索引状态。由于noindex标记而未编入索引的页面在“页面未编入索引的原因”下显示为“被noindex标记排除”。
如果无意中设置了noindex,请通过删除页面上的元标记来修复它。
五、无索引有效吗?设置时的注意事项
我们将解释设置noindex时应注意的事项,例如设置了noindex但在搜索结果中不反映的情况。
1.不要使用robots.txt阻止抓取
即使您对网页设置noindex,它也可能不会从搜索结果中消失。在这种情况下,robots.txt可能会阻止网页被抓取。
如果robots.txt中禁止抓取,抓取工具将无法首先抓取您的网站。即使为网页指定noindex,搜索引擎也无法读取noindex标签,因此不会反映在搜索结果中。
让我们删除不必要的描述并修复它们,以便可以正确抓取它们。
2.不要滥用noindex
不建议滥用noindex。通过设置noindex,该页面的自然搜索流量将为零。
例如,即使你有大量的低质量内容,你也应该首先考虑是否有可能将其改进为高质量内容。如果太多而您无法立即改进它们,请考虑使用noindex并在可以改进它们后立即对其建立索引。
另外,当内容重复时,不建议轻易使用noindex。这是因为设置了noindex的页面将从搜索结果中删除,并且其内容的评级也将为零。
如果您想消除重复内容,请使用规范或301重定向来整合对正确页面的访问。通过这些操作,重复内容的评估将被转移到标准化目的地。
3.由于noindex无法从Google Search Console注册?
当您尝试从Google Search Console为网站编制索引时,可能会显示消息“在机器人元标记中检测到‘noindex’”,并且可能无法注册。
这是使用WordPress等CMS时的常见错误。可能在常规设置菜单中选中了“阻止搜索引擎索引我的网站”选项。如果勾选此项,将为每个站点设置noindex,这意味着发布时将无法对其进行索引。
取消选中“阻止搜索引擎对站点建立索引”以删除整个站点的noindex。
六、概括
Noindex是一种防止特定页面、PDF文件、图像文件等被Google搜索引擎索引的措施。除了在HTML中编写元标记之外,还有一些方法可以向HTTP响应标头添加控件,并使用CMS上的菜单进行设置。
通过将noindex设置为您不希望被索引的内容(包括重复内容和低质量内容),您可以防止网站的整体声誉下降。另一方面,重要的是不要滥用noindex,因为noindex页面的自然搜索流量将为零。设置noindex时,请仔细考虑页面的目的和用户的需求。