HTML属性提取器
从HTML内容中提取指定属性(href、src、data-*等),支持标签名称过滤
## 功能
从任何HTML内容中提取和分析HTML属性:
- **定向提取**:指定要提取的确切属性(href、src、id、class等)
- **标签过滤**:将提取限制为特定的HTML元素(a、img、div等)
- **数据属性**:支持带有通配符匹配的data-*属性
- **URL分析**:可选的URL组件解析和验证
- **统计信息**:每个属性的综合统计(计数、唯一值、空计数)
- **位置跟踪**:源引用的行号和字符位置
## 支持的属性
- 标准HTML属性:href、src、alt、title、id、class等
- 数据属性:data-*、data-id、data-custom-*等
- 自定义属性:HTML元素中存在的任何属性
## 使用场景
- 从HTML页面提取所有链接
- 查找所有图像源
- 分析数据属性以进行跟踪分析
- SEO链接审计和验证
- 资源URL提取和验证
- HTML结构分析
API 文档
请求端点
POST /zh/api/tools/html-attribute-extractor
请求参数
| 参数名 | 类型 | 必填 | 描述 |
|---|---|---|---|
| htmlContent | textarea | 是 | - |
| attributes | select | 否 | - |
| tagFilter | select | 否 | 可选:仅从特定HTML元素提取 |
| includeDataAttributes | checkbox | 否 | 在指定或使用data-*通配符时提取data-*属性 |
| extractUrlComponents | checkbox | 否 | 将URL解析为协议、域名和路径组件 |
响应格式
{
"key": {...},
"metadata": {
"key": "value"
},
"error": "Error message (optional)",
"message": "Notification message (optional)"
}
JSON数据:
JSON数据
AI MCP 文档
将此工具添加到您的 MCP 服务器配置中:
{
"mcpServers": {
"elysiatools-html-attribute-extractor": {
"name": "html-attribute-extractor",
"description": "从HTML内容中提取指定属性(href、src、data-*等),支持标签名称过滤",
"baseUrl": "https://elysiatools.com/mcp/sse?toolId=html-attribute-extractor",
"command": "",
"args": [],
"env": {},
"isActive": true,
"type": "sse"
}
}
}
你可以串联多个工具,比如:`https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`,最多20个。
如果遇见问题,请联系我们:[email protected]