Hexo 静态博客部署上线之后,下一件最重要的事就是:让搜索引擎知道你的网站存在,并收录你的页面。
前言
很多新手误以为:网站发布上线后,搜索引擎就会自动来爬取并收录。错。
搜索引擎对新站一向很“谨慎”——你没权重、没外链、更新频率低的情况下,搜索引擎甚至不会主动尝试抓取你的网站。
所以,如果你想让 Google、Bing 这些搜索引擎早点收录你写的文章,就得靠下面这些动作:
- 主动提交站点
- 提供 sitemap(站点结构图)
- 配置 robots.txt(抓取权限说明)
操作步骤
安装插件
Hexo 本质上只是一个静态页面生成器,它不会自动帮你生成 sitemap、robots.txt、RSS 等 SEO 所需的结构化文件。
如果你不手动处理,搜索引擎甚至不知道你的网站有几篇文章、文章结构如何。
所以第一步,我们得手动安装插件:
$
$
这两个插件的作用:
- hexo-generator-sitemap:生成 sitemap.xml / sitemap.txt
- hexo-generator-feed:生成 RSS 订阅用的 atom.xml
修改站点配置
打开 _config.yml,添加下面的配置:
1 | sitemap: |
接着执行命令:
$
配置 robots.txt
robots.txt 是一个写给搜索引擎爬虫的“网站抓取说明书”。它告诉搜索引擎:
- 哪些页面允许抓取
- 哪些页面禁止抓取
- 网站结构图在哪里(Sitemap)
因为 Hexo 生成的是纯静态页面,我们需要手动创建 robots.txt 文件,并放到正确的位置。
在 source 文件夹中新建 robots.txt 文件
文件内容如下:
1 | User-agent: * |
提交站点到各大搜索引擎
Google Search Console
- 地址:https://search.google.com/search-console
- 选择“添加网站属性”,输入你的博客网址
- 验证方式:选择“HTML文件”方式,将提供的 xxx.html 添加到博客的 source 文件夹中
- 成功后,点击【索引】→【Sitemap】→ 添加:https://example.com/sitemap.xml
Bing 站长平台
- 地址:https://www.bing.com/webmasters/
- 验证方式:验证域名或 Meta 标签或上传 HTML 文件
- 提交 Sitemap:进入【配置网站】→【Sitemaps】→ 添加 https://example.com/sitemap.xml
Bing
同时影响 Yahoo、DuckDuckGo、Ecosia 等搜索引擎,覆盖面比你想象得大。color=cyan
效果验证 & 后续建议
完成以上步骤后,你可以通过以下方式检查:
- 访问 example.com/sitemap.xml 是否能打开
- 访问 example.com/robots.txt 是否生效
- 查看各平台后台是否显示提交成功、是否开始抓取
- 用 Google 的【URL 检查】功能手动加速首页抓取
提升收录率的额外建议:
- 保持博客内容更新频率(哪怕每月 1 篇)
- 多使用内链,提升页面相关性
- 在其他平台留下你博客的外链(知乎/掘金/GitHub 等)
- 不要一上线就删文章,保持内容稳定