Lumen [Christian]
lundi 3 mai 2021
« Lumen est un outil qui permet de construire de façon déclarative (à travers une spécification YAML) des applications d'analyse visuelle de données.  »
mercredi 10 mars 2021
« Apache Arrow est une bibliothèque qui propose un format de données en mémoire, orienté colonne, transversal aux langages et aux plateformes matérielles qui évite les coûts (considérables) dus aux opérations de conversion.  »
lundi 28 septembre 2020
« La préparation des données pour être utilisées efficacement dans un projet d'apprentissage machine (Machine Learning) n'a rien d'évident et constitue une partie non négligeable de l'effort à fournir sur un projet. Cet article constitue une bonne introduction en matière.  »
mercredi 26 février 2020
« Le journal Nature propose, ce mois ci, un long article qui retrace l'histoire de la désormais célèbre bibliothèque logicielle SciPy. C'est l'occasion de (re)découvrir les choix d'architecture et d'implémentation de SciPy ainsi que l'organisation du projet et de sa communauté des développeurs.  »
The xtensor vision [Christian]
mercredi 5 juin 2019
« Le C++ n'est pas cité souvent parmi les langages de la science des données (Data Science) ... Pourtant il arrive qu'il soit le principal recours possible quand on est face à des problèmes de performance. Quand cela arrive on est confronté à la relative pauvreté des moyens dans la manipulation de données par rapport à d'autres langages de plus haut niveau comme Python, R ou Julia. Le présent article illustre les capacités de la bibliothèque Xtensor de combler ce manque en apportant des fonctionnalités comparables à celles de NumPy (par exemple) et surtout des capacités remarquables d'intégration avec les trois autres langages évoqués précédemment.  »
jeudi 18 avril 2019
« Pyodide (projet expérimental de Mozilla) a pour but de rendre le langage Python ainsi que son écosystème (NumPy, Pandas, Matplotlib et SciPy notamment) destiné à l'analyse des données accessible dans un navigateur web via WebAssembly.  »