Durée: 1 journée

Dates: 24 novembre 2015 (9h30-17h30)

Lieu: INRIA Saclay, bâtiment Turing, salle Gilles Khan

Intervenant: Olivier Grisel

Pré-requis (fort): Voir ci-dessous.

La formation est ouverte, prioritairement, à tous les agents Inria. Cependant en fonction des places disponibles, les agents non Inria travaillant dans une équipe peuvent accéder aux formations organisées par Inria après demande et validation par le responsable hiérarchique.

L'inscription se fait en ligne jusqu'au 30 septembre.

La formation sera dispensée en français ou en anglais selon le public.

Introduction

Le langage Python est de plus en plus utilisé dans la Science des données (Data Science), en partie grâce à ses qualités intrinsèques mais également grâce à la richesse bibliothèques d'analyse numérique, calcul scientifique (NumPy, SciPy, Pandas) et visualisation des données (matplotlib) qui lui sont dédiées. Un rôle particulièrement important dans cette percée de Python dans les Data Sciences est joué par la bibliothèque Scikit-learn, consacrée au Machine Learning.

The Python programming language is extensively used by Data Scientists thanks to a rich ecosystem of Open Source libraries for numerical computing (NumPy, SciPy), data processing (pandas), data visualization (matplotlib) and predictive modeling (scikit-learn).

Pré-requis

Avoir déjà une bonne expérience de la programmation de manière générale et une première expérience en Python. Cette session ne sera pas une introduction à Python. Ceux qui maîtrisent déjà un langage de programmation objet (C++, Java) ou scientifique (R, Matlab) mais qui ne connaissent pas Python et qui veulent quand même participer à la formation, il est indispensable qu'ils se familiarisent, au préalable, avec le langage, par exemple en suivant (sérieusement) la section 1.2 de ce tutoriel et éventuellement cet autre tutoriel.

Contenu de la formation
Matin
Prise en main de Numpy / matplotlib / IPython notebook suivie d'une courte introduction aux concepts du "machine learning" et au projet Scikit-learn.
Après midi
Initiation au prédictive data analytics avec Scikit-learn et Pandas.
Morning
Tutorial setup, getting started with Numpy / matplotlib / IPython notebook followed by a short introduction to machine learning concepts and the scikit-learn project.
Afternoon
Hands on sessions on feature preprocessing and predictive modeling.