分类

XML路径提取器

使用XPath表达式从XML文档中提取值。非常适合从复杂的嵌套XML结构、API响应、RSS源和配置文件中提取特定数据。

XPath表达式用于提取值。示例: //* - 所有元素 //book/title - 所有书籍标题 //person[@age>18] - 年龄大于18岁的人 留空则提取所有元素

包含每次提取使用的XPath表达式

包含提取元素的属性

将多个结果视为单个项目而不是数组

保持XML文档中元素的原始顺序

启用命名空间感知的XPath评估

在提取结果中包含空元素和null值

关键信息

分类
Data Processing
输入类型
textarea, select, checkbox
输出类型
text
样本覆盖
4
支持 API
Yes

概览

XML路径提取器是一个在线工具,它使用XPath表达式从XML文档中精确提取所需数据。无论是处理复杂的嵌套结构、API响应、RSS订阅源还是配置文件,它都能帮助您快速定位并获取特定元素或属性的值。

适用场景

  • 需要从大型或结构复杂的XML文件中提取特定节点或属性值时。
  • 处理来自Web服务的XML格式API响应,需要解析并获取关键数据字段时。
  • 需要批量解析RSS或Atom订阅源,提取文章标题、链接或发布时间等信息时。

工作原理

  • 在“XML输入”区域粘贴或输入完整的XML文档内容。
  • 在“XPath表达式”区域编写一个或多个XPath查询语句,每行一个,用于定位目标数据。
  • 根据需要配置输出格式(如列表、JSON、CSV)以及其他选项,如是否包含属性或XPath路径信息。
  • 工具将执行XPath查询,并按照您的设置格式化并展示提取出的结果。

使用场景

从SOAP Web服务的XML响应中提取业务数据,如订单号、状态和金额。
批量处理多个RSS源,提取所有条目的标题和发布日期,用于内容聚合。
解析应用程序的XML配置文件,动态获取数据库连接字符串或功能开关的值。

用户案例

1. 从书籍目录XML中提取信息

背景原因
一个图书馆系统导出了包含所有书籍信息的XML文件,结构包含书名、作者、出版年份和分类等嵌套元素。
解决问题
需要快速提取所有小说类书籍的标题和作者,用于生成推荐列表。
如何使用
将XML内容粘贴到输入框,然后在XPath表达式区域输入 `//book[@category='fiction']/title` 和 `//book[@category='fiction']/author`(每行一个)。
示例配置
//book[@category='fiction']/title
//book[@category='fiction']/author
效果
工具返回一个列表,清晰列出了所有小说类书籍的标题及其对应的作者姓名。

2. 解析天气API的XML响应

开发者
背景原因
一个天气API返回了包含详细预报数据的XML,包括温度、湿度、风速和多个时间点的预报。
解决问题
需要从响应中提取当前温度和未来24小时的最高温度,以便在应用界面显示。
如何使用
将API返回的XML响应粘贴到工具中,编写XPath表达式来选取当前温度节点和预报中的最高温度节点。
示例配置
//current/temperature
//forecast/day[1]/temperature[@type='high']
效果
成功提取出当前温度值和次日最高温度值,数据可直接用于前端展示。

用 Samples 测试

xml

相关专题

常见问题

什么是XPath?

XPath是一种在XML文档中查找信息的语言,它使用路径表达式来选取XML文档中的节点或节点集。

支持哪些输出格式?

支持简单列表、JSON数组、CSV格式和XML格式四种输出方式,您可以根据后续处理需求选择。

如何处理带有命名空间的XML?

您可以启用“命名空间感知”选项,然后在XPath表达式中使用命名空间前缀来正确查询带命名空间的元素。

可以提取元素的属性值吗?

可以。勾选“包含元素属性”选项后,提取结果将包含所选元素的属性信息。您也可以直接在XPath中使用`@属性名`来选取特定属性。

提取结果的顺序是如何确定的?

默认情况下,工具会保持XML文档中元素的原始顺序。您可以通过“保持文档顺序”选项来控制此行为。

API 文档

请求端点

POST /zh/api/tools/xml-path-extractor

请求参数

参数名 类型 必填 描述
xmlInput textarea -
xpathExpressions textarea XPath表达式用于提取值。示例: //* - 所有元素 //book/title - 所有书籍标题 //person[@age>18] - 年龄大于18岁的人 留空则提取所有元素
outputFormat select -
includePaths checkbox 包含每次提取使用的XPath表达式
includeAttributes checkbox 包含提取元素的属性
flattenArrays checkbox 将多个结果视为单个项目而不是数组
preserveOrder checkbox 保持XML文档中元素的原始顺序
namespaceAware checkbox 启用命名空间感知的XPath评估
nullValues checkbox 在提取结果中包含空元素和null值

响应格式

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}
文本: 文本

AI MCP 文档

将此工具添加到您的 MCP 服务器配置中:

{
  "mcpServers": {
    "elysiatools-xml-path-extractor": {
      "name": "xml-path-extractor",
      "description": "使用XPath表达式从XML文档中提取值。非常适合从复杂的嵌套XML结构、API响应、RSS源和配置文件中提取特定数据。",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=xml-path-extractor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

你可以串联多个工具,比如:`https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`,最多20个。

如果遇见问题,请联系我们:[email protected]