Points clés
- Catégorie
- Sécurité et validation
- Types d’entrée
- file, checkbox
- Type de sortie
- html
- Couverture des échantillons
- 4
- API disponible
- Yes
Vue d’ensemble
Le Scanner de prompt injection PDF est un outil de sécurité conçu pour analyser les documents avant leur traitement par un LLM. En comparant une extraction de texte standard avec des extractions désactivant les filtres de sécurité, il détecte automatiquement les textes cachés, les contenus hors page, les polices minuscules et les calques masqués qui pourraient manipuler vos modèles d'intelligence artificielle.
Quand l’utiliser
- •Avant d'intégrer des documents PDF provenant de sources externes dans un système RAG (Retrieval-Augmented Generation).
- •Lors de l'audit de sécurité de fichiers PDF suspects pour identifier des tentatives de manipulation de LLM.
- •Pour vérifier l'intégrité des données extraites en s'assurant qu'aucun texte invisible n'a été inséré intentionnellement.
Comment ça marche
- •Importez votre fichier PDF dans l'outil et sélectionnez les types de risques à scanner (texte caché, contenu hors page, texte minuscule, calques cachés).
- •L'outil effectue une première extraction sécurisée avec les filtres par défaut d'OpenDataLoader.
- •Il relance ensuite l'extraction en désactivant un par un les filtres sélectionnés pour isoler les éléments invisibles.
- •Un rapport HTML met en évidence les extraits de texte supplémentaires détectés, vous permettant de les examiner manuellement.
Cas d’usage
Exemples
1. Sécurisation d'un pipeline RAG financier
Ingénieur Sécurité IA- Contexte
- L'entreprise utilise un LLM pour résumer des rapports financiers fournis par des partenaires externes.
- Problème
- S'assurer qu'aucun rapport ne contient des instructions cachées visant à fausser le résumé généré par l'IA.
- Comment l’utiliser
- Uploadez le rapport financier, cochez toutes les options de scan (texte caché, hors page, minuscule, calques) et lancez l'analyse.
- Configuration d’exemple
-
{ "scanHiddenText": true, "scanOffPageContent": true, "scanTinyText": true, "scanHiddenLayers": true } - Résultat
- Le rapport HTML signale un bloc de texte blanc sur fond blanc contenant des instructions de manipulation, permettant de bloquer le fichier avant son ingestion.
2. Détection de triche dans les CV
Responsable RH- Contexte
- L'entreprise reçoit des centaines de CV au format PDF et utilise un outil d'analyse sémantique pour présélectionner les candidats.
- Problème
- Certains candidats insèrent des listes de compétences en police minuscule pour tromper l'algorithme de tri.
- Comment l’utiliser
- Chargez le CV suspect en activant spécifiquement l'option Scanner le texte minuscule.
- Configuration d’exemple
-
{ "scanTinyText": true, "scanHiddenText": false, "scanOffPageContent": false, "scanHiddenLayers": false } - Résultat
- L'outil isole et affiche la liste des mots-clés minuscules cachés dans le document, confirmant la tentative de manipulation.
Tester avec des échantillons
pdf, text, fileHubs associés
FAQ
Qu'est-ce qu'une prompt injection dans un PDF ?
C'est une technique où un attaquant cache des instructions malveillantes dans un document (texte blanc sur fond blanc, texte hors page) pour manipuler le comportement du LLM qui l'analyse.
Quels types de contenus cachés cet outil peut-il détecter ?
L'outil détecte le texte caché par couleur, le contenu placé en dehors des limites de la page, le texte de taille minuscule et le texte situé dans des calques masqués (OCG).
L'outil supprime-t-il les menaces automatiquement ?
Non, l'outil agit comme un scanner de détection. Il génère un rapport mettant en évidence les textes suspects pour que vous puissiez les examiner et décider de rejeter ou nettoyer le fichier.
À quoi sert l'option Utiliser l'arbre de structure ?
Cette option permet d'utiliser la structure logique interne du PDF (si elle existe) pour améliorer la précision de l'extraction et l'analyse du contexte des éléments cachés.
Puis-je désactiver la recherche de certains risques ?
Oui, vous pouvez décocher des options spécifiques comme Scanner le texte minuscule ou Scanner le contenu hors page selon vos besoins d'analyse.