Catégories

Extracteur de Caractères Chinois

Extrait tous les caractères chinois du texte, en filtrant la ponctuation, les lettres anglaises, les chiffres et les symboles non chinois

Inclure les signes de ponctuation chinois (,。!?、;:""''()【】《》) dans l'extraction

Choisissez comment extraire le contenu chinois

Renvoyer uniquement les caractères/mots/phrases uniques (supprimer les doublons)

Points clés

Catégorie
Text Processing
Types d’entrée
textarea, checkbox, select
Type de sortie
json
Couverture des échantillons
4
API disponible
Yes

Vue d’ensemble

L'Extracteur de Caractères Chinois est un outil en ligne qui permet d'isoler rapidement tous les caractères chinois (hanzi) d'un texte mixte. Il filtre automatiquement la ponctuation, les lettres anglaises, les chiffres et les symboles non chinois pour vous fournir uniquement le contenu chinois désiré.

Quand l’utiliser

  • Lorsque vous avez un document bilingue ou multilingue et que vous souhaitez extraire uniquement le texte chinois.
  • Pour nettoyer des données textuelles avant une analyse linguistique ou un traitement en langage naturel chinois.
  • Quand vous étudiez le chinois et que vous voulez isoler des caractères ou des mots spécifiques d'un texte contenant des langues mixtes.

Comment ça marche

  • Collez ou saisissez votre texte dans la zone de saisie prévue.
  • Configurez les options : choisissez d'inclure la ponctuation chinoise, sélectionnez le mode d'extraction (caractères, mots ou phrases), et activez l'option pour ne garder que les éléments uniques si nécessaire.
  • Cliquez sur le bouton d'extraction pour traiter le texte.
  • Les caractères chinois extraits sont affichés dans un format JSON structuré, prêt à être copié ou utilisé.

Cas d’usage

Nettoyage de données pour des projets de recherche en linguistique chinoise.
Extraction de vocabulaire chinois à partir de textes bilingues pour l'apprentissage des langues.
Préparation de jeux de données pour des algorithmes de traitement du langage naturel (NLP) en chinois.

Exemples

1. Extraction de texte chinois d'un article académique

Chercheur en linguistique
Contexte
Un chercheur travaille sur un article académique qui contient des citations en chinois et en anglais.
Problème
Il a besoin d'isoler uniquement les parties en chinois pour une analyse textuelle ciblée.
Comment l’utiliser
Copiez le texte de l'article dans l'outil, désélectionnez l'option d'inclure la ponctuation pour un nettoyage maximal, et utilisez le mode 'Phrases' pour conserver le contexte.
Résultat
Le chercheur obtient un JSON contenant toutes les phrases chinoises de l'article, prêtes pour l'analyse.

2. Création d'une liste de caractères uniques pour l'étude

Contexte
Un étudiant lit un texte chinois et veut mémoriser les caractères qu'il ne connaît pas.
Problème
Il a besoin d'une liste de caractères uniques pour créer des flashcards.
Comment l’utiliser
Entrez le texte dans l'outil, cochez 'Uniques Seulement' et sélectionnez le mode 'Caractères'.
Résultat
L'étudiant reçoit une liste JSON de tous les caractères chinois uniques du texte, sans doublons, facilitant la création de matériel d'étude.

Tester avec des échantillons

image, video, text

Hubs associés

FAQ

Quels caractères sont considérés comme chinois ?

L'outil extrait les caractères de l'écriture chinoise (hanzi), incluant les caractères CJK unifiés dans Unicode.

Puis-je inclure la ponctuation chinoise dans l'extraction ?

Oui, en cochant l'option 'Inclure la Ponctuation Chinoise', vous pouvez conserver les signes de ponctuation spécifiques au chinois comme ,。!?.

Quelle est la différence entre les modes d'extraction ?

Le mode 'Caractères' extrait chaque caractère individuellement, 'Mots' extrait des séquences de caractères, et 'Phrases' extrait des phrases complètes basées sur la ponctuation.

L'outil est-il gratuit ?

Oui, cet outil est entièrement gratuit et accessible en ligne sans inscription.

Comment puis-je utiliser les résultats ?

Les résultats sont fournis en JSON, ce qui les rend faciles à intégrer dans des scripts, des bases de données ou d'autres applications.

Documentation de l'API

Point de terminaison de la requête

POST /fr/api/tools/chinese-character-extractor

Paramètres de la requête

Nom du paramètre Type Requis Description
text textarea Oui -
includePunctuation checkbox Non Inclure les signes de ponctuation chinois (,。!?、;:""''()【】《》) dans l'extraction
mode select Non Choisissez comment extraire le contenu chinois
uniqueOnly checkbox Non Renvoyer uniquement les caractères/mots/phrases uniques (supprimer les doublons)

Format de réponse

{
  "key": {...},
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Données JSON: Données JSON

Documentation de MCP

Ajoutez cet outil à votre configuration de serveur MCP:

{
  "mcpServers": {
    "elysiatools-chinese-character-extractor": {
      "name": "chinese-character-extractor",
      "description": "Extrait tous les caractères chinois du texte, en filtrant la ponctuation, les lettres anglaises, les chiffres et les symboles non chinois",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=chinese-character-extractor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Vous pouvez chaîner plusieurs outils, par ex.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, max 20 outils.

Si vous rencontrez des problèmes, veuillez nous contacter à [email protected]