jeudi 11 janvier 2024
« C'est un livre destinée aux débutants en analyse de données, utile même pour ceux qui n'envisagent pas forcément l'emploi du langage R au quotidien.  »
jeudi 8 décembre 2022
« L'histogramme est un moyen très pratique pour se faire une idée rapide de la distribution d'un jeu de données mais les choses se compliquent pour les données multidimensionnelles. Cet article montre une manière de surmonter le problème via les histogrammes fonctionnels.
Meta needs explicit user consent to run personalized ads, EU watchdog rules [Sébastien]
« La commission européenne joue son rôle de régulateur et veut encadrer les publicités ciblées de Meta  »
 »
jeudi 9 juin 2022
« Une présentation très pédagogique de l'algorithme espérance-maximisation (expectation-maximisation en anglais), outil statistique précieux dans l'apprentissage non supervisé.  »
Red Blob Games [Christian]
mercredi 10 février 2021
« Ce site explique par des moyens visuels et interactifs des notions mathématiques et des algorithmes connus qui interviennent souvent dans les jeux vidéo et aussi dans d'autres domaines : traitement d'images, statistiques, IA etc.  »
mercredi 10 avril 2019
« Ce site démystifie à travers une animation interactive d'une grande qualité la méthode dite d'estimation par noyau (en anglais "Kernel Density Estimation") qui permet de déterminer la densité de probabilité d'une variable aléatoire (voir aussi l'article Wikipédia et le tutoriel Scikit-learn).  »
Tidy data [Sébastien]
mercredi 5 juillet 2017
« Une très intéressante réflexion sur la problématique de préparation des données, qui a été au centre de l'atelier "Préparation des données pour l'analyse statistique et le machine learning" animé par Sébastien Dejean (IMT) lors des JDEV 2017. »
vendredi 8 juillet 2016
« Une introduction à l'algorithme de descente de gradient avec des exemples de code en Python. »
Statistical Learning [Alexandre]
vendredi 15 janvier 2016
« Un MOOC sur l'apprentissage statistique. »
vendredi 23 octobre 2015
« Ce billet met en perspective l'utilisation des langages Python et R dans la mise en œuvre de deux techniques utilisées dans l'analyse de données: l'analyse en composantes principales et la classification (clustering). »
vendredi 23 octobre 2015
« Manipulation de données et machine learning en python »
vendredi 27 mars 2015
« Une introduction à la statistique avec Python. »
vendredi 6 février 2015
«  Comment implémenter une Analyse en Composante Principale (ACP) avec Python. »