PDF vers HTML

Convertit les documents PDF en pages web HTML avec formatage et structure préservés

Convertit les documents PDF au format HTML en utilisant Node.js pur.

Exemples de résultats

1 Exemples

Document PDF en HTML

Convertit un document PDF en une page web HTML avec styles

pdf-to-html-output.html Voir fichier
Voir paramètres d'entrée
{ "sourceFile": "/public/samples/pdf/document.pdf", "outputFormat": "styled", "includeStyles": true }

Click to upload file or drag and drop file here

Maximum file size: 50MB Supported formats: application/pdf

Points clés

Catégorie
Documents et PDF
Types d’entrée
file, select, checkbox
Type de sortie
file
Couverture des échantillons
4
API disponible
Yes

Vue d’ensemble

Cet outil en ligne vous permet de convertir instantanément vos documents PDF en pages web HTML tout en préservant leur mise en forme et leur structure d'origine. Grâce à des options flexibles, vous pouvez générer un code HTML complet avec styles CSS, extraire uniquement le contenu ou obtenir du Markdown brut.

Quand l’utiliser

  • Lorsque vous devez publier le contenu d'un rapport PDF directement sur un site web sans perdre la mise en page.
  • Pour extraire le texte structuré d'un document PDF afin de l'intégrer facilement dans un système de gestion de contenu (CMS).
  • Quand vous souhaitez convertir un document PDF en fichier Markdown brut pour une édition ultérieure.

Comment ça marche

  • Téléchargez votre fichier PDF (jusqu'à 50 Mo) dans le champ prévu à cet effet.
  • Choisissez le format de sortie souhaité : HTML complet avec styles, contenu HTML uniquement ou Markdown brut.
  • Cochez ou décochez l'option pour inclure les styles CSS selon vos besoins d'intégration.
  • Cliquez sur le bouton de conversion pour générer et télécharger votre fichier HTML ou Markdown.

Cas d’usage

Publication de rapports annuels ou de brochures PDF directement sur le blog d'une entreprise.
Migration de documentations techniques stockées au format PDF vers une base de connaissances en ligne.
Extraction rapide du texte structuré d'un PDF pour le convertir en Markdown pour des éditeurs de texte.

Exemples

1. Conversion d'un rapport d'activité avec styles

Chargé de communication
Contexte
Un chargé de communication doit publier le rapport annuel de l'entreprise sur le site intranet tout en conservant la charte graphique et la mise en page du document PDF original.
Problème
Recréer manuellement la mise en page en HTML prendrait trop de temps et risquerait de déformer le document.
Comment l’utiliser
Charger le fichier PDF du rapport, sélectionner le format de sortie 'Full HTML with Styles' et cocher l'option 'Inclure les Styles CSS'.
Configuration d’exemple
{"outputFormat": "styled", "includeStyles": true}
Résultat
Un fichier HTML complet prêt à être hébergé, affichant fidèlement la structure et les styles du PDF d'origine.

2. Extraction de contenu épuré pour un CMS

Développeur Web
Contexte
Un développeur doit intégrer le contenu textuel d'un manuel d'utilisation PDF dans un template de site web existant qui possède déjà ses propres feuilles de style.
Problème
Les styles CSS intégrés au PDF entrent en conflit avec la charte graphique globale du site web.
Comment l’utiliser
Charger le PDF du manuel, choisir le format 'Content HTML Only' et désactiver l'option 'Inclure les Styles CSS'.
Configuration d’exemple
{"outputFormat": "content-only", "includeStyles": false}
Résultat
Un fichier HTML contenant uniquement les balises de structure (titres, paragraphes, listes) sans aucun style CSS parasite, facilitant son intégration.

Tester avec des échantillons

html, pdf, file

Hubs associés

FAQ

Quels formats de sortie sont disponibles ?

Vous pouvez choisir entre un HTML complet avec styles, un HTML contenant uniquement le contenu, ou du Markdown brut.

Quelle est la taille maximale de fichier PDF acceptée ?

La limite de taille pour le fichier PDF importé est de 50 Mo.

Puis-je conserver la mise en page originale du PDF ?

Oui, en choisissant le format de sortie 'Full HTML with Styles' et en activant l'inclusion des styles CSS.

L'outil nécessite-t-il l'installation d'un logiciel ?

Non, la conversion s'effectue directement en ligne via votre navigateur web.

Est-il possible d'extraire uniquement le texte sans le code CSS ?

Oui, il suffit de sélectionner le format de sortie 'Content HTML Only' ou de désactiver l'option d'inclusion des styles.

Documentation de l'API

Point de terminaison de la requête

POST /fr/api/tools/pdf-to-html

Paramètres de la requête

Nom du paramètre Type Requis Description
sourceFile file (Téléchargement requis) Oui -
outputFormat select Non -
includeStyles checkbox Non -

Les paramètres de type fichier doivent être téléchargés d'abord via POST /upload/pdf-to-html pour obtenir filePath, puis filePath doit être passé au champ de fichier correspondant.

Format de réponse

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Fichier: Fichier

Documentation de MCP

Ajoutez cet outil à votre configuration de serveur MCP:

{
  "mcpServers": {
    "elysiatools-pdf-to-html": {
      "name": "pdf-to-html",
      "description": "Convertit les documents PDF en pages web HTML avec formatage et structure préservés",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-to-html",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Vous pouvez chaîner plusieurs outils, par ex.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, max 20 outils.

Prend en charge les liens de fichiers URL ou la codification Base64 pour les paramètres de fichier.

Si vous rencontrez des problèmes, veuillez nous contacter à [email protected]