xLog-ArticleURLCrawler 是一个用于从基于 xLog 的博客中爬取文章 URL 的 Python 脚本。
本项目使用ChatGPT协助开发
- 从
config.ini
读取博客的URL - 通过xLog的RSS订阅功能获取文章名和文章URL
- 多线程获取真实URL
- 写到
article.json
- 克隆项目到本地:
git clone https://github.com/endercatone/xLog-ArticleURLCrawler.git
- 安装依赖:
pip install feedparser requests
- 在终端中运行脚本:
python main.py
- 根据提示输入博客的 URL,例如:
博客URL: https://example.com
-
等待脚本执行完成。获取到的文章 URL 将保存在当前目录下的
article.json
文件中。 -
打开
article.json
文件,即可查看获取到的文章标题和对应的 URL。
该项目使用 MIT 许可证。详细信息请参阅 LICENSE 文件。