Exportación de anotaciones PDF

Extrae anotaciones existentes (resaltados, comentarios, sellos, enlaces) de un PDF a una cadena JSON

Lee las anotaciones incrustadas en el PDF y las exporta como una cadena JSON estructurada que se muestra directamente en el área de salida (sin archivo descargable). Admite marca (resaltado/subrayado/tachado), notas, sellos, enlaces y formas. Implementación pura en JS con pdf-lib.

Resultados de ejemplo

1 Ejemplos

Exportar resaltados y comentarios a JSON

Extrae anotaciones de marca/nota de un PDF revisado y devuelve JSON estructurado.

{
  "sourceFile": "pdf-annotation-export-sample.pdf",
  "count": 2,
  "subtypes": {
    "Highlight": 1,
    "Text": 1
  },
  "annotations": [
    {
      "page": 1,
      "subtype": "Highlight",
      "author": "Alice",
      "text": "important claim",
      "color": "#ffff00"
    },
    {
      "page": 1,
      "subtype": "Text",
      "author": "Bob",
      "text": "Please review this section.",
      "color": "#ffcc00"
    }
  ]
}
Ver parámetros de entrada
{ "pdfFile": "/public/samples/pdf/pdf-annotation-export-sample.pdf", "includePageNumbers": true }

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/pdf

Datos clave

Categoría
Documentos y PDF
Tipos de entrada
file, checkbox
Tipo de salida
text
Cobertura de muestras
4
API disponible
Yes

Resumen

Extraiga de forma rápida y sencilla todas las anotaciones incrustadas en sus documentos PDF, incluyendo resaltados, comentarios, sellos y enlaces. Esta herramienta procesa el archivo directamente en su navegador y genera una estructura JSON limpia con los detalles de cada anotación, facilitando su integración en otros flujos de trabajo sin necesidad de descargar archivos adicionales.

Cuándo usarlo

  • Cuando necesite recopilar y analizar los comentarios y correcciones realizados por revisores en un documento PDF.
  • Al migrar notas, resaltados o marcas de lectura desde un PDF hacia una base de datos o sistema de gestión de notas.
  • Para auditar los enlaces, sellos y marcas de revisión aplicados en contratos o informes técnicos en formato PDF.

Cómo funciona

  • Suba el archivo PDF que contiene las anotaciones desde su dispositivo.
  • Seleccione si desea incluir los números de página correspondientes en la extracción.
  • La herramienta analiza el documento en el navegador utilizando la biblioteca pdf-lib para identificar marcas, notas, sellos y enlaces.
  • El resultado se muestra instantáneamente en pantalla como una cadena de texto estructurada en formato JSON.

Casos de uso

Consolidación de comentarios de revisión editorial para su importación en gestores de tareas.
Extracción de citas y textos resaltados durante la investigación académica para su archivo en bases de conocimiento.
Auditoría de enlaces y sellos de aprobación en documentos legales y contratos digitalizados.

Ejemplos

1. Extracción de revisiones editoriales

Editor de contenidos
Contexto
Un editor recibe un manuscrito en PDF con múltiples comentarios y textos resaltados por parte del autor.
Problema
Necesita consolidar todas las correcciones en un sistema de seguimiento interno sin tener que transcribirlas manualmente.
Cómo usarlo
Sube el PDF del manuscrito y marca la casilla para incluir los números de página.
Configuración de ejemplo
pdfFile: 'manuscrito_revisado.pdf', includePageNumbers: true
Resultado
Obtiene un JSON estructurado con el autor, el texto resaltado, los comentarios y la página exacta de cada corrección.

2. Recopilación de citas de estudio

Investigador académico
Contexto
Un estudiante lee artículos científicos en PDF y resalta las ideas clave directamente en el lector de PDF.
Problema
Desea exportar todos los fragmentos destacados a su aplicación de toma de notas personal en formato estructurado.
Cómo usarlo
Sube el artículo científico anotado a la herramienta.
Configuración de ejemplo
pdfFile: 'articulo_cientifico.pdf', includePageNumbers: false
Resultado
Se genera una lista en formato JSON que contiene únicamente los textos resaltados para copiarlos directamente a su base de datos.

Probar con muestras

json, pdf, file

Hubs relacionados

Preguntas frecuentes

¿Qué tipos de anotaciones se pueden extraer?

Extrae resaltados, subrayados, tachados, notas de texto, sellos, enlaces y formas geométricas incrustadas.

¿La herramienta guarda o almacena mi archivo PDF?

No, el procesamiento se realiza de forma local en su navegador y los datos no se envían a ningún servidor.

¿Puedo descargar el resultado como un archivo independiente?

No, la herramienta genera y muestra el JSON directamente en el área de salida de texto para que pueda copiarlo.

¿Es posible incluir los números de página en el JSON?

Sí, puede activar la opción correspondiente para asociar cada anotación extraída con su número de página.

¿Funciona con PDFs protegidos con contraseña?

No, el archivo PDF debe estar desbloqueado para que la herramienta pueda leer y extraer las anotaciones.

Documentación de la API

Punto final de la solicitud

POST /es/api/tools/pdf-annotation-export

Parámetros de la solicitud

Nombre del parámetro Tipo Requerido Descripción
pdfFile file (Subida requerida) -
includePageNumbers checkbox No -

Los parámetros de tipo archivo necesitan ser subidos primero vía POST /upload/pdf-annotation-export para obtener filePath, luego pasar filePath al campo de archivo correspondiente.

Formato de respuesta

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}
Texto: Texto

Documentación de MCP

Agregue este herramienta a su configuración de servidor MCP:

{
  "mcpServers": {
    "elysiatools-pdf-annotation-export": {
      "name": "pdf-annotation-export",
      "description": "Extrae anotaciones existentes (resaltados, comentarios, sellos, enlaces) de un PDF a una cadena JSON",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-annotation-export",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Puede encadenar múltiples herramientas, por ejemplo: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máximo 20 herramientas.

Soporte para enlaces de archivos URL o codificación Base64 para parámetros de archivo.

Si encuentra algún problema, por favor, póngase en contacto con nosotros en [email protected]