- Auteur : Stéphane Meurisse
- Contact : [email protected]
- Site Web : https://www.codeandcortex.fr
- LinkedIn : https://www.linkedin.com/in/st%C3%A9phane-meurisse-27339055/
- Date : 31 Décembre 2024
- Version : 3.0.2
- Licence : Ce programme est un logiciel libre : vous pouvez le redistribuer selon les termes de la Licence Publique Générale GNU v3
- pip install streamlit beautifulsoup4 pandas lxml html5lib
Cette application est distribuée sous la licence GNU v3.
Toute réutilisation ou modification de ce projet doit respecter les termes de cette licence.
L'exploitation commerciale de ce projet est interdite sans autorisation.
- Reconstruction des noms de journaux (version longue et abrégée).
- Conversion des dates en plusieurs formats.
- Nettoyage de multiples balises inutiles, URL et noms d’auteurs
- Export au format texte et CSV.
- Rendez-vous sur l'application [Europresse to IRaMuTeQ] : https://europresse-to-iramuteq.streamlit.app/
- Glissez-déposez vos fichiers HTML pour les traiter.
- Téléchargez les résultats au format texte ou CSV.