返回文章列表


【基础】HTML5查缺补漏(语义化 / SEO)

语义化标签

语义化标签主要优势:

  1. css加载失败时能让页面呈现清晰的结构。

  2. 有助于SEO,帮助爬虫获取更多有效信息。

  3. 提升可访问性,方便其他设备(屏幕阅读器)渲染页面。

  4. 便于团队开发维护。

有哪些语义化标签:

最常用的:header / nav / main / footer / section / article / aside

最容易犯错的也是最重要的:h1 ~ h6,屏幕阅读器用户可以通过标题快速跳转页面段落,类似目录导航。如果层级断裂(h1 → 直接 h3),中间的内容会被跳过,用户根本不知道它的存在。

次级:

  • figure + figcaption 配图 + 图注

  • details + summary 可展开折叠的详情

  • mark 高亮文本

  • time 日期/时间

  • address 联系信息

  • blockquote 块级引用

    <figure>
      <img src="photo.jpg" alt="日出自拍">
      <figcaption>今早阳台拍的,光真好</figcaption>
    </figure>
    
    <details>
      <summary>查看详情</summary>
      <p>这里是被折叠的内容</p>
    </details>
    
    <p>她说<mark>绝对不行</mark>,但我没听她的。</p>

SEO(Search Engine Optimization)搜索引擎优化

元数据

做好网页的 title / description / keywords (TDK)。

title:品牌词放前面,每页独立。

description:网站的广告文案,要含关键词,需要有吸引力。

keywords:渐渐不看重了,但写上不亏。

<head>
	<title>我的网站</title>
	<meta name="description" content="这是老白的个人网站,记录技术/思考/生活" />
	<meta name="keywords" content="老白,技术博客,个人网站,生活记录" />
</head>

内容策略

这是最重要的长期因素。高质量原创内容远大于任何技术手段。

技术SEO

提供 robots.txt:告诉爬虫哪些能爬、哪些不能。通常用于隐藏后台页面和无价值页面,给爬虫指向 sitemap 路径。

提供 sitemap.xml:给搜索引擎看你的站点地图,保证所有页面都被发现。

优化 web 核心指标(Core Web Vitals):Google将网站性能纳入排名参考信号。有三个指标:LCP(Largest Contentful Paint),FID(First Input Delay),CLS(Cumulative Layout Shift)

结构&规范

使用语义化标签,方便爬虫理解,使文档结构清晰。

非装饰性图片用 alt,一方面更规范,另一方面提高关键词密度。特别是产品介绍类型网站,大量图片,缺少文字,爬虫完全看不懂是什么。

符合 W3C 规范:嵌套正确,属性闭合,标签大小写统一。

链接策略

外链:高质量的外链是 Google 最重要的排名信号之一。

友情链接:站点互换,有助权重传递。

内部链接:站内页面互相链接,形成拓扑结构,帮爬虫爬得更深。

提交站点:向主流搜索引擎提交站点。生成/sitemap.xml后提交一次,搜索引擎会定期来抓。