Skip to content

Latest commit

 

History

History
132 lines (76 loc) · 9.57 KB

README.md

File metadata and controls

132 lines (76 loc) · 9.57 KB

Yellowbrick (français)

Build Status Coverage Status Total Alerts Language Grade: Python PyPI version Documentation Status Black DOI JOSS Binder

Analyse visuelle et outils de diagnostic pour faciliter la sélection de modèles d'apprentissage automatique.

Banner

Gratitude à Nicola Tabbah pour avoir traduit la documentation Yellowbrick en français !

Qu'est-ce que Yellowbrick ?

Yellowbrick est une suite d'outils de diagnostic visuel appelés "Visualizers" qui étendent l'API scikit-learn pour permettre un pilotage humain du processus de sélection de modèle. En bref, Yellowbrick combine scikit-learn et matplotlib dans la meilleure tradition de la documentation scikit-learn, mais pour produire des visualisations pour votre flux de travail d'apprentissage automatique !

Pour une documentation complète sur l'API Yellowbrick, une galerie de visualisateurs disponibles, le guide du contributeur, des tutoriels et des ressources pédagogiques, une foire aux questions, et plus encore, veuillez consulter notre documentation à l'adresse www.scikit-yb.org.

Installation de Yellowbrick

Yellowbrick est compatible avec Python 3.4 ou plus récent et dépend également de scikit-learn et matplotlib. La manière la plus simple d'installer Yellowbrick et ses dépendances est de le faire à partir de PyPI avec pip, l'installateur de paquets préféré de Python.

$ pip install yellowbrick

Notez que Yellowbrick est un projet actif et qu'il publie régulièrement de nouvelles versions avec plus de visualiseurs et de mises à jour. Afin de mettre à jour Yellowbrick vers la dernière version, utilisez pip comme suit.

$ pip install -U yellowbrick

Vous pouvez également utiliser le drapeau -U pour mettre à jour scikit-learn, matplotlib, ou tout autre utilitaire tiers qui fonctionne bien avec Yellowbrick vers leurs dernières versions.

Si vous utilisez Anaconda (recommandé pour les utilisateurs de Windows), vous pouvez utiliser l'utilitaire conda pour installer Yellowbrick :

conda install -c districtdatalabs yellowbrick

Utilisation de Yellowbrick

L'API Yellowbrick est spécialement conçue pour fonctionner avec scikit-learn. Voici un exemple de séquence de travail typique avec scikit-learn et Yellowbrick :

Visualisation des caractéristiques

Dans cet exemple, nous voyons comment Rank2D effectue des comparaisons par paire de chaque caractéristique de l'ensemble de données avec une métrique ou un algorithme spécifique et les renvoie ensuite classées dans un diagramme triangulaire en bas à gauche.

from yellowbrick.features import Rank2D

visualizer = Rank2D(
    features=features, algorithm='covariance'
)
visualizer.fit(X, y)                # Fit the data to the visualizer
visualizer.transform(X)             # Transform the data
visualizer.show()                   # Finalize and render the figure

Visualisation du modèle

Dans cet exemple, nous instancions un classificateur scikit-learn et utilisons ensuite la classe ROCAUC de Yellowbrick pour visualiser le compromis entre la sensibilité et la spécificité du classificateur.

from sklearn.svm import LinearSVC
from yellowbrick.classifier import ROCAUC

model = LinearSVC()
visualizer = ROCAUC(model)
visualizer.fit(X,y)
visualizer.score(X,y)
visualizer.show()

Pour plus d'informations sur le démarrage de Yellowbrick, consultez le Guide de démarrage rapide dans la documentation et consultez notre cahier d'exemples.

Contribuer à Yellowbrick

Yellowbrick est un projet open source soutenu par une communauté qui acceptera avec gratitude et humilité toutes les contributions que vous pourriez apporter au projet. Grande ou petite, toute contribution fait une grande différence ; et si vous n'avez jamais contribué à un projet open source auparavant, nous espérons que vous commencerez avec Yellowbrick !

Si vous souhaitez contribuer, consultez notre guide du contributeur. Au-delà de la création de visualiseurs, il y a de nombreuses façons de contribuer :

  • Soumettre un rapport de bogue ou une demande de fonctionnalité sur GitHub Issues.
  • Ajoutez un carnet Jupyter à notre galerie d'exemples.
  • Aidez-nous avec user testing.
  • Ajoutez à la documentation ou aidez-nous avec notre site web, scikit-yb.org.
  • Écrire des tests unitaires ou d'intégration pour notre projet.
  • Répondre aux questions sur nos problèmes, notre liste de diffusion, Stack Overflow, et ailleurs.
  • Traduire notre documentation dans une autre langue.
  • Écrire un billet de blog, tweeter ou partager notre projet avec d'autres.
  • Enseigner à quelqu'un comment utiliser Yellowbrick.

Comme vous pouvez le voir, il y a de nombreuses façons de s'impliquer et nous serions très heureux que vous nous rejoigniez ! La seule chose que nous vous demandons est de respecter les principes d'ouverture, de respect et de considération des autres tels que décrits dans le Python Software Foundation Code of Conduct.

Pour plus d'informations, consultez le fichier CONTRIBUTING.md à la racine du dépôt ou la documentation détaillée sur Contributing to Yellowbrick.

Jeux de données Yellowbrick

Yellowbrick donne un accès facile à plusieurs ensembles de données qui sont utilisés pour les exemples dans la documentation et les tests. Ces jeux de données sont hébergés dans notre CDN et doivent être téléchargés pour être utilisés. Généralement, lorsqu'un utilisateur appelle l'une des fonctions de chargement de données, par exemple load_bikeshare(), les données sont automatiquement téléchargées si elles ne se trouvent pas déjà sur l'ordinateur de l'utilisateur. Cependant, pour le développement et les tests, ou si vous savez que vous travaillerez sans accès à Internet, il peut être plus facile de télécharger toutes les données en une seule fois.

Le script de téléchargement des données peut être exécuté comme suit :

$ python -m yellowbrick.download

Ceci téléchargera les données dans le répertoire fixtures à l'intérieur des paquets du site Yellowbrick. Vous pouvez spécifier l'emplacement du téléchargement soit comme argument au script de téléchargement (utilisez --help pour plus de détails) ou en définissant la variable d'environnement $YELLOWBRICK_DATA. C'est le mécanisme préféré car il influencera également la façon dont les données sont chargées dans Yellowbrick.

Note : Les développeurs qui ont téléchargé des données à partir de versions de Yellowbrick antérieures à v1.0 peuvent rencontrer des problèmes avec l'ancien format de données. Si cela se produit, vous pouvez vider votre cache de données comme suit :

$ python -m yellowbrick.download --cleanup

Cela supprimera les anciens jeux de données et téléchargera les nouveaux. Vous pouvez également utiliser le drapeau --no-download pour simplement vider le cache sans retélécharger les données. Les utilisateurs qui ont des difficultés avec les jeux de données peuvent également utiliser ceci ou ils peuvent désinstaller et réinstaller Yellowbrick en utilisant pip.

Citer Yellowbrick

Nous serions heureux que vous utilisiez Yellowbrick dans vos publications scientifiques ! Si vous le faites, veuillez nous citer en utilisant les directives de citation.

Affiliations

District Data Labs Projet affilié NumFOCUS