全网整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:400-708-3566

如何用Python生成sitemap.xml网站地图

最简单可靠的方式是用Python标准库xml.etree.ElementTree手动构造符合Sitemap协议的XML,根节点为urlset,每个url包含必填loc及可选lastmod、changefreq、priority,确保loc为绝对URL、lastmod为ISO 8601格式。

用Python生成 sitemap.xml 最简单可靠的方式是手动构造符合Sitemap协议的XML内容,或借助轻量库(如 xml.etree.ElementTree 或第三方库 django-sitemaps / flask-sitemap)。对大多数静态网站或小型动态站,纯Python + 标准库就足够,无需引入复杂框架。

使用 xml.etree.ElementTree 构建标准 sitemap.xml

Python 标准库中的 xml.etree.ElementTree 足以生成合法、可被搜索引擎识别的 sitemap。关键点:根节点为 urlset,每个 url 包含 loc(必填),可选 lastmodchangefreqpriority

  • 确保 loc 是完整、可访问的绝对 URL(如 https://www./link/e4639aefe47ac53c3df3d8f9846b5161blog/post1/
  • lastmod 格式必须为 YYYY-MM-DDYYYY-MM-DDThh:mm:ss+00:00(推荐 ISO 8601)
  • 避免特殊字符未转义——ElementTree 会自动处理,但手动拼接字符串时需用 xml.sax.saxutils.escape()

一个可直接运行的生成脚本示例

以下脚本生成包含 3 个页面的 sitemap.xml,保存到当前目录:

import xml.etree.ElementTree as ET
from datetime import datetime

创建根元素

urlset = ET.Element("urlset", xmlns="https://www./link/654f3a10edb3bb1755a43cc4f9be9dc6")

定义页面数据(实际项目中可从数据库、文件列表或 CMS API 获取)

pages = [ {"loc": "https://www./link/e4639aefe47ac53c3df3d8f9846b5161", "lastmod": "2025-05-01", "changefreq": "weekly", "priority": "1.0"}, {"loc": "https://www./link/e4639aefe47ac53c3df3d8f9846b5161about/", "lastmod": "2025-04-22", "changefreq": "monthly", "priority": "0.8"}, {"loc": "https://www./link/e4639aefe47ac53c3df3d8f9846b5161blog/", "lastmod": "2025-05-10", "changefreq": "daily", "priority": "0.9"}, ]

for page in pages: url = ET.SubElement(urlset, "url") ET.SubElement(url, "loc").text = page["loc"] ET.SubElement(url, "lastmod").text = page["lastmod"] ET.SubElement(url, "changefreq").text = page["changefreq"] ET.SubElement(url, "priority").text = page["priority"]

写入文件(缩进需手动处理,或用第三方库如 xmltodict / lxml 美化)

tree = ET.ElementTree(urlset) tree.write("sitemap.xml", encoding="utf-8", xml_declaration=True)

print("✅ sitemap.xml 已生成")

运行后得到结构清晰、合规的 XML 文件,可直接部署到网站根目录。

处理大型网站:分片与索引(sitemap index)

单个 sitemap 最多支持 5 万条 URL,总大小不超过 50MB(压缩后)。超限时需拆分为多个 sitemap 并生成 sitemap_index.xml

  • 将 URL 列表按每 4 万条一组切分
  • 为每组生成独立 sitemap(如 sitemap-1.xml, sitemap-2.xml
  • sitemapindex 根节点汇总所有子 sitemap 的 loc 和可选 lastmod
  • 在 robots.txt 中添加 Sitemap: https://www./link/e4639aefe47ac53c3df3d8f9846b5161sitemap_index.xml

自动化建议:集成到构建流程

不推荐手动生成。应将其嵌入网站构建环节:

  • 静态站点(如 Jekyll、Hugo、MkDocs):用插件或自定义脚本,在 build 后自动生成
  • Flask/Django:在管理命令或部署钩子中调用生成函数(Django 可直接用 django.contrib.sitemaps
  • CI/CD(如 GitHub Actions):添加 Python 步骤,每次 push 后更新并提交 sitemap.xml

保持 sitemap 与线上内容实时一致,比“一次性生成”更重要。


# python  # git  # go  # cms  # github  # ai  # 搜索引擎  # django  # 标准库  # yy 


相关文章: 大型企业网站制作流程,做网站需要注册公司吗?  如何选择高效便捷的WAP商城建站系统?  宝塔建站教程:一键部署配置流程与SEO优化实战指南    如何在IIS7上新建站点并设置安全权限?  已有域名和空间如何快速搭建网站?  如何通过远程VPS快速搭建个人网站?  湖南网站制作公司,湖南上善若水科技有限公司做什么的?  免费视频制作网站,更新又快又好的免费电影网站?  制作销售网站教学视频,销售网站有哪些?  网站按钮制作软件,如何实现网页中按钮的自动点击?  个人网站制作流程图片大全,个人网站如何注销?  微信小程序 input输入框控件详解及实例(多种示例)  如何解决ASP生成WAP建站中文乱码问题?  微信h5制作网站有哪些,免费微信H5页面制作工具?  c++怎么使用类型萃取type_traits_c++ 模板元编程类型判断【方法】  济南网站建设制作公司,室内设计网站一般都有哪些功能?  建站之星图片链接生成指南:自助建站与智能设计教程  ,巨量百应是干嘛的?  定制建站哪家更专业可靠?推荐榜单揭晓  C++如何编写函数模板?(泛型编程入门)  Swift开发中switch语句值绑定模式  如何快速生成ASP一键建站模板并优化安全性?  建站之星价格显示格式升级,你的预算足够吗?  公司网站制作需要多少钱,找人做公司网站需要多少钱?  如何基于云服务器快速搭建个人网站?  网站app免费制作软件,能免费看各大网站视频的手机app?  定制建站模板如何实现SEO优化与智能系统配置?18字教程  Swift中swift中的switch 语句  合肥制作网站的公司有哪些,合肥聚美网络科技有限公司介绍?  昆明网站制作哪家好,昆明公租房申请网上登录入口?  如何快速完成中国万网建站详细流程?  如何在建站之星网店版论坛获取技术支持?  mc皮肤壁纸制作器,苹果平板怎么设置自己想要的壁纸我的世界?  网站制作需要会哪些技术,建立一个网站要花费多少?  如何用VPS主机快速搭建个人网站?  详解jQuery中基本的动画方法  天河区网站制作公司,广州天河区如何办理身份证?需要什么资料有预约的网站吗?  孙琪峥织梦建站教程如何优化数据库安全?  如何解决VPS建站LNMP环境配置常见问题?  如何通过西部数码建站助手快速创建专业网站?  b2c电商网站制作流程,b2c水平综合的电商平台?  如何在IIS中新建站点并配置端口与IP地址?  如何制作新型网站程序文件,新型止水鱼鳞网要拆除吗?  如何在VPS电脑上快速搭建网站?  韩国网站服务器搭建指南:VPS选购、域名解析与DNS配置推荐  制作证书网站有哪些,全国城建培训中心证书查询官网?  无锡营销型网站制作公司,无锡网选车牌流程?  高端网站建设与定制开发一站式解决方案 中企动力  外汇网站制作流程,如何在工商银行网站上做外汇买卖? 

您的项目需求

*请认真填写需求信息,我们会在24小时内与您取得联系。