« C'est un livre destinée aux débutants en analyse de données, utile même pour ceux qui n'envisagent pas forcément l'emploi du langage R au quotidien. »
« L'histogramme est un moyen très pratique pour se faire une idée rapide de la distribution d'un jeu de données mais les choses se compliquent pour les données multidimensionnelles. Cet article montre une manière de surmonter le problème via les histogrammes fonctionnels.
« Une présentation très pédagogique de l'algorithme espérance-maximisation (expectation-maximisation en anglais), outil statistique précieux dans l'apprentissage non supervisé. »
« Ce site explique par des moyens visuels et interactifs des notions mathématiques et des algorithmes connus qui interviennent souvent dans les jeux vidéo et aussi dans d'autres domaines : traitement d'images, statistiques, IA etc. »
« Ce site démystifie à travers une animation interactive d'une grande qualité la méthode dite d'estimation par noyau (en anglais "Kernel Density Estimation") qui permet de déterminer la densité de probabilité d'une variable aléatoire (voir aussi l'article Wikipédia et le tutoriel Scikit-learn). »
« Une très intéressante réflexion sur la problématique de préparation des données, qui a été au centre de l'atelier "Préparation des données pour l'analyse statistique et le machine learning" animé par Sébastien Dejean (IMT) lors des JDEV 2017. »
« Ce billet met en perspective l'utilisation des langages Python et R dans
la mise en œuvre de deux techniques utilisées dans l'analyse de
données: l'analyse en composantes principales et la classification
(clustering). »