Extractor de revision con tachado PDF

Detecta texto tachado en PDFs de revision y genera un informe para contratos, politicas y borradores

Tras subir un PDF, la herramienta activa la deteccion de tachado de OpenDataLoader y extrae texto marcado como eliminado desde JSON y Markdown para revisar cambios rapidamente.

Resultados de ejemplo

1 Ejemplos

Extraer clausulas eliminadas de un borrador

El sample real lista el texto tachado para una revision rapida.

pdf-strikethrough-review-extractor-example1.html Ver archivo
Ver parámetros de entrada
{ "pdfFile": "/public/samples/pdf/pdf-strikethrough-review-extractor-source-example1.pdf", "pages": "", "useStructTree": true }

Click to upload file or drag and drop file here

Maximum file size: 10MB Supported formats: application/pdf

Datos clave

Categoría
Desarrollo y Web
Tipos de entrada
file, text, checkbox
Tipo de salida
html
Cobertura de muestras
4
API disponible
Yes

Resumen

El Extractor de revisión con tachado PDF permite identificar y extraer automáticamente el texto marcado como eliminado en documentos PDF. Esta herramienta es esencial para analizar cambios en contratos, políticas y borradores editoriales, transformando marcas visuales en informes estructurados para una revisión rápida y precisa de las modificaciones.

Cuándo usarlo

  • Al auditar cambios en contratos legales donde las cláusulas eliminadas no están documentadas en un registro de cambios formal.
  • Durante la revisión editorial de manuscritos o políticas internas para verificar qué contenido específico se ha descartado.
  • Para comparar versiones de documentos técnicos cuando solo se dispone del archivo PDF con marcas de revisión visuales.

Cómo funciona

  • Sube el archivo PDF que contiene el texto con formato de tachado digital.
  • Define el rango de páginas específico o procesa el documento completo utilizando el árbol estructural para mayor precisión.
  • El motor de detección identifica los elementos de texto asociados al estilo de tachado mediante OpenDataLoader.
  • Se genera un informe en formato HTML que lista de forma organizada todo el contenido extraído que fue marcado para eliminación.

Casos de uso

Revisión de contratos legales para identificar términos y condiciones eliminados durante la fase de negociación.
Auditoría de cumplimiento normativo comparando borradores de políticas corporativas y procedimientos internos.
Control de calidad editorial para consolidar cambios y descartes en la publicación de textos técnicos o académicos.

Ejemplos

1. Auditoría de Contrato de Arrendamiento

Abogado corporativo
Contexto
Un cliente envió un PDF con cambios sugeridos, pero en lugar de usar control de cambios, simplemente tachó las cláusulas que no acepta.
Problema
Extraer manualmente cada párrafo tachado en un documento extenso es lento y propenso a omisiones accidentales.
Cómo usarlo
Sube el contrato PDF, selecciona todas las páginas y asegúrate de que la opción de árbol estructural esté activada.
Resultado
Un informe HTML con todas las cláusulas rechazadas, permitiendo una preparación rápida para la reunión de negociación.

2. Revisión de Manual de Procedimientos

Especialista en cumplimiento
Contexto
La empresa está actualizando sus políticas de seguridad y el equipo técnico ha tachado los protocolos obsoletos en el manual vigente.
Problema
Se requiere documentar formalmente qué procedimientos específicos se eliminaron para el registro de auditoría anual.
Cómo usarlo
Carga el manual técnico y especifica el rango de páginas correspondiente a la sección de seguridad (ej. 15-30).
Resultado
Una lista clara y estructurada del texto eliminado que se adjunta directamente al informe de cambios de la normativa interna.

Probar con muestras

pdf, text, file

Hubs relacionados

Preguntas frecuentes

¿Qué tipos de archivos admite esta herramienta?

La herramienta admite exclusivamente archivos en formato PDF.

¿Es necesario que el PDF tenga etiquetas estructurales?

No es obligatorio, pero activar la opción de árbol estructural mejora significativamente la precisión en documentos complejos.

¿Puedo procesar solo una parte del documento?

Sí, puede especificar páginas individuales o rangos, por ejemplo: 1, 3, 5-10.

¿Qué formato tiene el informe de salida?

El resultado se entrega en un formato HTML que facilita la visualización y revisión del texto extraído.

¿Detecta tachados realizados con herramientas de dibujo a mano?

No, la herramienta detecta el atributo de texto tachado aplicado digitalmente mediante editores de PDF.

Documentación de la API

Punto final de la solicitud

POST /es/api/tools/pdf-strikethrough-review-extractor

Parámetros de la solicitud

Nombre del parámetro Tipo Requerido Descripción
pdfFile file (Subida requerida) -
pages text No -
useStructTree checkbox No -

Los parámetros de tipo archivo necesitan ser subidos primero vía POST /upload/pdf-strikethrough-review-extractor para obtener filePath, luego pasar filePath al campo de archivo correspondiente.

Formato de respuesta

{
  "result": "
Processed HTML content
", "error": "Error message (optional)", "message": "Notification message (optional)", "metadata": { "key": "value" } }
HTML: HTML

Documentación de MCP

Agregue este herramienta a su configuración de servidor MCP:

{
  "mcpServers": {
    "elysiatools-pdf-strikethrough-review-extractor": {
      "name": "pdf-strikethrough-review-extractor",
      "description": "Detecta texto tachado en PDFs de revision y genera un informe para contratos, politicas y borradores",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-strikethrough-review-extractor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Puede encadenar múltiples herramientas, por ejemplo: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máximo 20 herramientas.

Soporte para enlaces de archivos URL o codificación Base64 para parámetros de archivo.

Si encuentra algún problema, por favor, póngase en contacto con nosotros en [email protected]