关键信息
- 分类
- 文本与写作
- 输入类型
- textarea, number, select, checkbox
- 输出类型
- html
- 样本覆盖
- 4
- 支持 API
- Yes
概览
本工具支持通过输入 URL 抓取或直接粘贴 XML 源码来解析 RSS 和 Atom 订阅源。它能够自动过滤指定时间窗口内的文章、去除重复项、按发布日期排序,并快速生成一份格式干净、包含可选字段的 Markdown 摘要与 HTML 预览,非常适合用于制作 Newsletter、周报或内容聚合。
适用场景
- •需要从多个博客或新闻网站的 RSS 订阅源中快速筛选并整理近期更新时。
- •制作个人或团队的 Newsletter 邮件周报,需要将多篇文章整理为干净的 Markdown 列表时。
- •抓取并去重特定主题的 Atom/RSS 订阅源,以便快速浏览最新动态或导入到其他知识库时。
工作原理
- •输入 RSS/Atom 订阅源的 URL,或直接粘贴原始的 XML 文本。
- •设置过滤与排序规则,包括最大条目数、时间窗口(如最近 24 小时或 7 天)、去重依据(按标题或 URL)以及排序方式。
- •勾选需要包含的字段(如标题、摘要、作者、日期、链接或分类),系统将在服务端抓取并解析数据。
- •实时生成 Markdown 格式的摘要文本,并提供顶部条目的 HTML 预览报告。
使用场景
用户案例
1. 快速生成 Hacker News 每日热门摘要
独立开发者- 背景原因
- 需要每天跟踪 Hacker News 上的热门讨论,但不想花太多时间浏览网页,希望有一份干净的 Markdown 列表导入到 Notion 中。
- 解决问题
- 原始 RSS 包含大量冗余信息,且格式不便于直接复制到 Markdown 笔记中。
- 如何使用
- 在输入框中填写 https://news.ycombinator.com/rss,将最大条目数设置为 10,时间窗口选择“最近 24 小时”,勾选标题、链接和日期,输出格式选择“仅 Markdown”。
- 效果
- 获得一份只包含最近 24 小时前 10 条热门文章的干净 Markdown 列表,可直接粘贴至 Notion。
2. 过滤并去重团队博客订阅源
团队知识库管理员- 背景原因
- 团队订阅了多个技术博客,部分博客会重复推送相同主题的文章,需要定期整理并去重。
- 解决问题
- 手动对比多篇文章的标题和链接非常繁琐,容易出现遗漏。
- 如何使用
- 粘贴团队博客的 XML 订阅源内容,将去重依据设置为“按标题(忽略大小写)”,排序方式选择“最新优先”,并勾选包含作者和分类。
- 效果
- 自动过滤掉标题相同的重复推送,生成一份按时间排序、带有作者和分类标签的 Markdown 摘要。
用 Samples 测试
xml, markdown, barcode相关专题
常见问题
支持哪些订阅源格式?
支持 RSS 2.0、RSS 1.0/RDF 以及 Atom 1.0 格式。
无法解析日期的文章会怎么处理?
无法解析日期的条目会被保留,但在按日期排序时会被排在最后。
抓取 URL 时有超时限制吗?
服务端抓取超时时间为 15 秒,并且会自动跟随重定向。
如何避免抓取到重复的文章?
您可以在“去重依据”选项中选择按标题(忽略大小写)或按 URL 进行去重。
可以自定义导出的 Markdown 字段吗?
可以,您可以通过勾选框自由选择是否包含标题、摘要、作者、日期、链接和分类。