Quels formats de fichiers sont pris en charge ?

L'outil accepte les données collées au format texte CSV, ainsi que les fichiers téléversés aux formats CSV et JSON.

Quelle est la différence entre l'oversampling et l'undersampling ?

L'oversampling duplique les lignes de la classe minoritaire pour atteindre le niveau de la classe majoritaire, tandis que l'undersampling réduit la classe majoritaire au niveau de la minoritaire.

Comment choisir la colonne cible ?

Saisissez simplement le nom de l'en-tête de la colonne qui contient les étiquettes de classification (par exemple "fraude", "statut" ou "label").

Puis-je exporter le jeu de données complet ?

L'outil génère un aperçu limité au nombre de lignes défini dans les paramètres (jusqu'à 50 lignes) au format JSON ou CSV.

L'outil crée-t-il de nouvelles données synthétiques ?

Non, la stratégie d'oversampling se contente de dupliquer les lignes existantes de la classe minoritaire.

Elysia Tools

Navigation mobile

Data Analysis

Detecteur de desequilibre et reechantillonneur

Detecte le desequilibre de classes dans un dataset CSV ou JSON, compare les strategies et previsualise un jeu equilibre

Détails

Ce que cet outil vous aide à faire

Collez un dataset CSV ou televersez un CSV/JSON, puis indiquez la colonne cible. Loutil compte chaque classe, mesure le ratio de desequilibre, suggere si lover- ou lunder-sampling est plus adapte et genere un apercu equilibre.

Comment lutiliser :

Entree du dataset : collez du CSV pour une lecture rapide
Fichier de donnees : televersez CSV ou JSON
Colonne cible : choisissez la classe a profiler
Strategie de reechantillonnage : none, oversample ou undersample
Format dexport : previsualisez en JSON ou CSV
Lignes daperçu : limite le nombre de lignes affichees

Notes :

L'oversampling duplique les lignes minoritaires jusqu'au niveau majoritaire
L'undersampling reduit la majorite jusqu'au niveau minoritaire
Le rapport compare les deux strategies
Cela aide a decider si un outil plus avance comme SMOTE sera utile ensuite

Exécution

Exécuter cet outil

Remplissez le formulaire, lancez l’outil et consultez le résultat au même endroit.

Exécutions d’exemple préparées

Cliquez sur un exemple pour remplir automatiquement le formulaire. Les fichiers doivent toujours être téléversés.

1 exemples

Inspecter un dataset fraude 95:5

Mesure le desequilibre, compare les strategies et exporte un apercu equilibre.

<div>Original distribution</div>

Entrées

Renseignez les champs nécessaires, puis lancez l’outil.

6 réglages

FichiersImportez les fichiers source du flux.1

Fichier de donneesfileOptionnel

Taille maximale par fichier : 20 MBTypes pris en charge : text/csv, application/json, text/plain, .csv, .json

ContenuCollez ou saisissez les valeurs principales.2

Entree du datasettextareaOptionnelColonne cibletextRequis

RéglagesAjustez formats, plages, nombres et modes.3

Strategie de reechantillonnageselectOptionnelFormat dexportselectOptionnelLignes daperçunumberOptionnel

Résultat

Prêt à exécuter

Après exécution, les fichiers, textes, données structurées ou sorties en flux apparaîtront ici.

Exemples

Exemples adaptés à cet outil

Associé

Detecteur de desequilibre et reechantillonneur

Ce que cet outil vous aide à faire

Exécuter cet outil

Exécutions d’exemple préparées

Entrées

Résultat

Exemples adaptés à cet outil

Continuer avec des outils et dossiers associés

Exécutions d’exemple préparées

Entrées

Résultat

Découvrez quand utiliser cet outil, ce qu'il prend en charge et comment les utilisateurs l'appliquent.

Points clés

Aperçu

Quand l’utiliser

Fonctionnement

Cas d’usage

Exemples

1. Équilibrage d'un jeu de données de détection de fraude

2. Sous-échantillonnage pour l'analyse de churn

FAQ

Exemples CSV

Exemples Python

Exemples de Traçage Distribué

Exemples JWT

Detecteur d anomalies de series temporelles

Profileur de qualite de dataset

Detecteur de conflits de prefixes et abreviations pour mock data

Analyseur de prevision et de saisonnalite

Outils d interchange JSON et de traduction de formats

Outils de conversion de casse, d’encodage et de normalisation de texte

Outils d inspection, de diff et de transformation JSON

Outils d export CSV et de conversion de tableaux