分类

Markdown链接提取器

从Markdown文档中提取内联链接、引用链接和纯URL,并进行基本语法验证

功能

从Markdown内容中提取和分析各种链接类型:

  • 内联链接: [text](url)[text](url "title")
  • 引用链接: [text][ref][text][ref]、折叠式 [ref][]
  • 引用定义: [ref]: url "title"
  • 图片链接: ![alt](url)![alt](url "title")
  • 自动链接: <url>
  • 纯URL: http://、https://、www. 等不带Markdown语法的URL

验证功能

  • URL语法验证
  • 重复链接检测
  • 损坏的引用链接检测
  • 未使用的引用定义警告

输出

提供全面的统计信息,包括:

  • 按类型分类的链接计数
  • 唯一URL与重复URL
  • 内部链接与外部链接
  • 锚点/片段检测
  • 损坏或无效链接的问题报告

统计并跟踪带有#锚点的链接

关键信息

分类
Text Processing
输入类型
textarea, select, checkbox
输出类型
json
样本覆盖
4
支持 API
Yes

概览

Markdown链接提取器是一款专为解析和验证Markdown文档中链接而设计的工具。它能精准提取内联链接、引用链接、纯URL等多种格式,并提供URL语法验证、重复检测和损坏引用检查等功能,帮助用户全面分析文档的链接结构与健康状况。

适用场景

  • 需要检查Markdown文档中所有链接是否有效、无重复时。
  • 希望分析文档结构,统计内部链接、外部链接及锚点分布时。
  • 在发布或迁移文档前,需要批量提取链接进行审计或存档时。

工作原理

  • 在输入框中粘贴或上传您的Markdown内容。
  • 选择需要提取的链接类型(如内联链接、引用链接、纯URL等),并配置验证选项(如检查重复、验证URL语法)。
  • 工具将解析Markdown内容,提取所有符合条件的链接,并根据您的设置进行验证和分析。
  • 最终输出包含按类型分类的链接列表、统计信息以及任何检测到的问题报告(如损坏的引用、无效URL)。

使用场景

技术文档维护者使用它来定期检查项目文档中的外部链接是否失效,确保文档可用性。
博客作者或内容创作者在发布文章前,用它来验证所有引用和参考链接的正确性与唯一性。
SEO人员或网站管理员分析网站Markdown格式内容的链接结构,优化内部链接并识别潜在问题链接。

用户案例

1. 检查开源项目文档链接

技术文档工程师
背景原因
负责维护一个大型开源项目的文档站点,文档以Markdown格式编写,包含大量指向API参考、教程和外部资源的链接。
解决问题
在发布新版本文档前,需要确保所有链接有效,且没有因文档重构而产生的损坏引用链接。
如何使用
将整个文档的Markdown内容粘贴到输入框,勾选“验证URL语法”和“查找重复链接”选项,并选择提取所有链接类型。
效果
工具快速生成报告,列出了3个损坏的引用链接(指向已删除的章节)和5个重复的外部链接URL,便于工程师精准修复。

2. 分析技术博客的引用来源

技术博主
背景原因
撰写了一篇深度技术分析文章,文中使用了大量引用链接来标注数据来源和参考文献。
解决问题
希望在发布前清晰地看到所有引用了哪些外部网站,并检查是否有重复引用同一来源的情况。
如何使用
在链接类型中仅选择“引用链接”,并按“URL(字母顺序)”排序结果。
效果
提取结果清晰地按域名分组展示了所有引用的外部链接,博主发现有两处引用了同一份过时的RFC文档,随即进行了更新。

3. 审计网站Markdown内容的链接质量

背景原因
公司的知识库和博客文章均使用Markdown编写,近期计划进行网站迁移,需要评估现有内容的链接质量。
解决问题
需要一份全面的链接清单,以识别内部死链、外部失效链接以及过多的重复链接,为迁移和清理工作提供依据。
如何使用
分批处理核心文章的Markdown源文件,启用所有提取类型和验证选项,并特别关注“未使用的引用定义警告”。
效果
生成了详细的链接审计报告,不仅列出了问题链接,还统计出内部链接与外部链接的比例,以及锚点链接的使用情况,为迁移决策提供了数据支持。

用 Samples 测试

markdown

相关专题

常见问题

这个工具支持提取哪些Markdown链接格式?

支持提取内联链接 `[text](url)`、引用链接 `[text][ref]`、图片链接 `![alt](url)`、自动链接 `<url>` 以及文档中的纯URL。

如何检测损坏的引用链接?

工具会检查所有 `[text][ref]` 形式的引用链接,确认其对应的引用定义 `[ref]: url` 是否存在于文档中。如果找不到定义,则标记为损坏链接。

可以处理非常大的Markdown文件吗?

可以。工具在浏览器端运行,能够处理包含大量链接的文档。对于极大文件,处理时间可能会相应增加。

结果可以按什么方式排序?

您可以选择按链接在文档中出现的位置、链接类型或URL的字母顺序对提取结果进行排序。

这个工具能批量处理多个文件吗?

当前版本主要设计用于处理单次粘贴的Markdown内容。如需批量处理,可以依次处理每个文件,或考虑将多个文件内容合并后处理。

API 文档

请求端点

POST /zh/api/tools/markdown-link-extractor

请求参数

参数名 类型 必填 描述
markdownInput textarea -
linkTypes select -
validateUrls checkbox -
checkDuplicates checkbox -
sortBy select -
extractAnchors checkbox 统计并跟踪带有#锚点的链接

响应格式

{
  "key": {...},
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
JSON数据: JSON数据

AI MCP 文档

将此工具添加到您的 MCP 服务器配置中:

{
  "mcpServers": {
    "elysiatools-markdown-link-extractor": {
      "name": "markdown-link-extractor",
      "description": "从Markdown文档中提取内联链接、引用链接和纯URL,并进行基本语法验证",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=markdown-link-extractor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

你可以串联多个工具,比如:`https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`,最多20个。

如果遇见问题,请联系我们:[email protected]