jeudi 1 décembre 2022
« Des formations ont lieu en ce moment au mois de décembre pour déposer un jeu de données, administrer une collection de jeux de données, ou encore utiliser l'API de https://recherche.data.gouv.fr »
lundi 20 septembre 2021
« When we start an application, we often draw the data model, and also, most of the time, implement "normalization" concepts, without really knowing it exists, and what means 1NF, 2NF, 3NF, ... This article is a good introduction to this, along with what are keys, composite keys, foreign keys. »
mardi 12 janvier 2021
« L'article offre un aperçu des travaux récents de Tim Berners-Lee, l'inventeur du web, visant à donner aux utilisateurs les moyens de maîtriser leurs données personnelles. »
jeudi 12 novembre 2020
« En Grande-Bretagne, les entreprises proposant des systèmes de QRCode pour le contact tracing aux restaurateurs, auraient revendu les données personnelles récoltées à des fins publicitaires. L'une d'elles affiche garder ces données pour 25 ans... »
jeudi 12 novembre 2020
« Une présentation des dernières avancées de Solid, la plateforme de Tim Berners-Lee qui a pour objectif de redonner aux internautes le contrôle sur leurs données. »
jeudi 18 avril 2019
« Un grand dossier interactif du New York Times sur la vie privée et internet (seulement 4 articles gratuits pour les non-abonnés). »
mercredi 9 janvier 2019
« Un article rendant compte du travail qu'ont réalisés plusieurs étudiants en design de l’ENS Cachan et de l’école Boulle; la problématique de visualisation des données est fortement mise en avant. »
mercredi 5 décembre 2018
« Un retour d'expérience sur les modèles que le site 538 proposait pour prédire les résultats des élections de mi-mandat. »
mardi 11 septembre 2018
« Une compilation d'exemples d'utilisation de la bibliothèque Pandas correspondant à des cas qu'on rencontre souvent dans la pratique. C'est à la fois un guide de survie pour les utilisateurs occasionnels et une belle illustration de la puissance de Pandas. »
Datasets in Python [Christian]
mercredi 14 mars 2018
« Nous sommes souvent confrontés, tout au long du processus de développement, au besoin de jeux de données satisfaisant des contraintes diverses. Ce billet est un recueil de sources de données qui ont en commun le fait d'être exploitables en Python. »
mercredi 29 novembre 2017
« Dask est un framework en langage Python de calcul parallèle pour l'analyse de données. Cette présentation de Matthew Rocklin expose les derniers développement de ce projet pour le traitement à la volée de données (Stream processing). »