SED Saclay : Pages du mot-clé 'machine

La recherche démontre que certains grands modèles de langue bafouent le droit d'auteur, quelles implications pour le futur ? [Ghislain Vaillant]

jeudi 19 juin 2025

« En partant du constat que plusieurs grands modèles de langue sont capables de régurgiter verbatim une large portion d'œuvres sous droit d'auteur, s'ouvre une discussion plus large sur la faiblesse argumentative du fair use actuellement en vigueur aux États-Unis, et les conséquences délétères (ou pas ?) que pourraient engendrer sa remise en cause. »

[machine_learning, llm, droit]

ClearML [Federico]

jeudi 27 février 2025

« Logiciel libre utilisé dans ma précédente entreprise pour centraliser les résultats (modèles, benchmarks) de l'équipe recherche. »

[outils, machine_learning, simulation, data_science]

Luc Ferry n'a rien compris à l'open source [Romain]

jeudi 6 février 2025

« Nul besoin d'un LLM pour produire des propos incohérents. »

[machine_learning, opensource]

Project: VERDAD—tracking misinformation in radio broadcasts using Gemini 1.5 [Romain]

jeudi 14 novembre 2024

« Une description d'un projet de data-journalisme visant à étudier la désinformation à la radio. Le pipe-line est intéressant : plusieurs modèles coopèrent sur différents aspects (transcription, découverte de désinformation potentielle, extraction de timestamps...) pour ensuite passer la main à des journalistes. »

[machine_learning, journalisme, désinformation]

L'OSI publie enfin sa définition de l'IA "open source" [Ghislain Vaillant]

jeudi 7 novembre 2024

« Je laisse chacun se forger son propre avis. Pour ma part, je trouve la proposition trop libertaire concernant les données d'entraînement, se contentant de recommandations trop légères pour garantir une quelconque liberté de modification. »

[intelligence_artificielle, machine_learning, opensource]

Attention in transformers, visually explained [Romain (via le blog de Simon Willison)]

jeudi 18 avril 2024

« Grant Sanderson (3blue1brown) est un youtubeur qui publie des explications animées de concepts mathématiques. Ici, il parle du mécanisme d'attention des transformers qui sont à la base de certains grands modèles de langages (LLM). »

[machine_learning]

Image Classification with scikit-learn (9:41) [Vincent]

jeudi 15 février 2024

« Comment classifier des images avec scikit-learn et son système de pipelines »

[machine_learning, scikit_learn]

Understanding Deep Learning [Kim (Paris), via Sébastien]

mercredi 8 novembre 2023

« Un ouvrage intéressant avec des notebooks d'exemples. »

[machine_learning, deep_learning]

Decomposing Language Models Into Understandable Components [Romain]

jeudi 12 octobre 2023

« Des chercheurs d'Anthropic (qui commercialise le modèle Claude, dont une des caractéristiques est sa grande fenêtre de contexte) présentent une approche permettant de décomposer des réseaux de neurones en unités interprétables. »

[llm, machine_learning]

Prompt Engineering Guide [Romain]

jeudi 28 septembre 2023

« Les gros modèles de langage (Large Language Models ou LLMs) peuvent accomplir des tâches variées, mais leur donner des instructions n'est pas chose aisée et fait l'objet d'une discipline/appellation spécifique, le prompt engineering. Ce guide propose une entrée en matière. »

[llm, machine_learning, prompt_engineering]

AI can identify passwords by sound of keys being pressed, study suggests [Vincent]

jeudi 28 septembre 2023

« Des chercheurs ont développé une IA capable de détecter quelle touche d'un clavier a été pressée avec une précision de plus de 90%, que ce soit lors d'une visioconférence, ou avec un téléphone portable placé à proximité. Cela pose bien évidemment des questions de sécurité. »

[machine_learning, security]

Entraînez un ordinateur à reconnaître vos propres images, sons et postures. [Vincent]

vendredi 8 septembre 2023

« Teachablemachine permet de créer des modèles d'apprentissage à partir de d'images ou de sons que l'on classifie au préalable, et que l'on peut ensuite exporter sous plusieurs formats (tensorflow.js, sur Arduino, ...) »

[machine_learning, vulgarisation, tensorflow]

La machine meilleure que l’humain pour prouver qu’elle n'est pas une machine [Vincent]

jeudi 24 août 2023

« Maintenant qu'il a été prouvé par une équipe de recherche que les méthodes d'apprentissage dépassent les humains pour résoudre les CAPTCHA, ces techniques de détection de robot sont devenues obsolètes. »

[machine_learning, interaction_homme_machine]

Quel statut juridique pour les avatars post-mortem ? [Vincent]

jeudi 24 août 2023

« Alors que des entreprises déposent des brevets sur des méthodes d'apprentissage à partir la production numérique d'une personne, voici un débat sur sur le statut jurique des avatars créés à partir de ces données. »

[droit, numérique, machine_learning]

Catching up on the weird world of LLMs [Romain]

mardi 8 août 2023

« Un panorama du fonctionnement, de l'utilisation et de l'actualité récente des LLMs (Large Language Models). »

[llm, machine_learning, intelligence_artificielle]

An in-depth look at Google’s first Tensor Processing Unit (TPU) [Laurent Steff]

vendredi 16 juin 2023

« Do you have a recent NVidia graphic card with Raytracing (RTX) ? If yes chances are your GPU embeds a TPU (Tensor Processing Unit) to accelerate the RayTracing with machine learning (Deep Learning Super Sampling, DLSS). OK, enough of acronyms, and let's dive deep in what those Tensor Process Unit are, with an in depth explanation of what is inside the now legacy first version. Back in the days Google really though out of the box to tackle energy efficiency for Machine Learning. With for example 8 bits registers, and a way of loading registers in matrix multiplication unit inspired from biology: the "systolic array". From the article: "The design is called systolic because the data flows through the chip in waves, reminiscent of the way that the heart pumps blood". »

[neural_networks, nvidia, machine_learning, google, gpu, raytracing]

Apple avoids “AI” hype at WWDC keynote by baking ML into products [Sébastien]

jeudi 8 juin 2023

« Cet article couvrant la Apple Worldwide Developers Conference souligne qu'Apple s'est ostensiblement détaché du hype actuel autour des termes "intelligence artificielle ("IA/AI") et "grand modèle de langage (LLM)" et utilisant plutôt "machine learning" et "large transformer models", et en les présentant systématiquement comme un moyen et non une fin. »

[apple, machine_learning, intelligence_artificielle, arm]

Leaked Google document: “We Have No Moat, And Neither Does OpenAI” [Romain]

jeudi 11 mai 2023

« Simon Willison commente un document qui a récemment fuité de Google. L'auteur y développe la thèse que les producteurs et mainteneurs de gros modèles de langage ne disposent pas d'un avantage compétitif, et que les modèles ouverts, avec un "fine tuning" peu coûteux, sont une alternative nettement plus agile qui permet d'obtenir des résultats de qualité comparable. »

[machine_learning, google, openai]

Lazypredict: Run All Sklearn Algorithms With a Line Of Code - How to (and why you shouldn’t) use it [Vincent]

jeudi 12 janvier 2023

« Comment tester les différents algorithmes de régression ou de classification de scikit-learn sur votre jeu de données avec le paquet LazyPredict. La syntaxe est intéressante (car proche de celle de scikit-learn), mais l'auteur conseille plutôt de se tourner vers d'autres alternatives. »

[scikit_learn, machine_learning]

Lensa AI app causes a stir with sexy “Magic Avatar” images no one wanted [Sébastien]

jeudi 5 janvier 2023

« Une illustration flagrante une nouvelle fois des biais pouvant être induits par les jeux de données utilisés pour l'entraînement: l'AI "Lensa" qui propose de produire des avatars générés à partir de photos données en entrée a une fâcheuse tendance à sexualiser fortement les portraits de femme... et ça peut s'accentuer encore pour certaines catégories de personnes, comme les femmes d'origine asiatique. »

[machine_learning, sexisme, intelligence_artificielle]

An AI found a new and slightly faster way of multiplying matrices [Laurent Steff]

jeudi 1 décembre 2022

« Based on AlphaZero, Alpha Tensor as quoted from the article is "the first artificial intelligence (AI) system for discovering novel, efficient, and provably correct algorithms for fundamental tasks such as matrix multiplication". Deepmind published its discoveries last week in Nature. »

[machine_learning, maths, intelligence_artificielle]

Trends observed on O'Reilly's learning platform [Laurent Steff]

mercredi 2 février 2022

« Insights from data on O'Reilly's learning platform, some quotes that may be of interest:

"We start with an explosion of fantastic achievements that seem like science fiction—imagine, GPT-3 can write stories!"
"We know that C++ dominates game programming, but we suspect that it’s also coming to dominate embedded systems, which is really just a more formal way to say “internet of things.” We also suspect (but don’t know) that C++ is becoming more widely used to develop microservices."

[machine_learning, c++, go, rust, typescript]

How a False Love for AI/ML is Destroying our Engineering Colleges [Christian]

mercredi 26 janvier 2022

« L'article parle de l'Inde, mais le phénomène décrit est suffisamment important pour mériter l'attention de ceux qui se sentent concernés par le développement logiciel en général ... »

[machine_learning, python]

When disruptions are not good: deep learning and HPC challenges for fusion energy [Laurent Steff]

jeudi 7 octobre 2021

« The quest to control nuclear fusion goes on, and the biggest tokamak (toroidal chamber with magnetic coils) yet to come for the ITER project comes with many challenges, that computer science, and more precisely HPC and deep learning tries to tackles. »

[machine_learning, machine_learning, hpc]

Questionning today's AI by a Microsoft Researcher [Laurent Steff]

lundi 7 juin 2021

« In this 'The Guardian' interview, Kate Crawford teases her book 'Atlas of AI', and raise a lot of questions about today's 'AI'. »

[machine_learning, ai, éthique, écologie]

Machine Learning : La mise à l’echelle [Christian]

lundi 19 avril 2021

« Un grand nombre d'algorithmes d'apprentissage machine ne se comportent pas bien si les variables étudiées ont des échelles très différentes. Cette articles fait un tour d'horizon des différentes techniques de mise à l'échelle (feature scaling) disponibles dans scikit-learn. »

[python, machine_learning]

Pour la Journée des droits des femmes, le sexisme des algorithmes expliqué par Angèle [Vincent]

mercredi 10 mars 2021

« Des exemples de biais sexistes et racistes, ses effets pervers, mais aussi des exemples de correction. »

[machine_learning, sexisme]

A Gentle Introduction to Sparse Matrices for Machine Learning [Christian]

lundi 25 janvier 2021

« Les matrices de très grandes dimensions posent généralement des problèmes de traitement importants. Quand elles sont creuses (contiennent principalement des valeurs nulles) certaines difficultés peuvent être souvent surmontées en utilisant des représentations adéquates. Le présent tutoriel fait un tour d'horizon des moyens offerts par SciPy pour travailler avec des matrices creuses (sparse matrix) en mettant l'accent sur les applications dans les champ de l'apprentissage machine (machine learning). »

[machine_learning, python]

19 Best JupyterLab Extensions for Machine Learning [Christian]

jeudi 8 octobre 2020

« Après une courte introduction à la gestion des extensions dans Jupyterlab, l'article présente une vingtaine d'extensions dont le champ d'application dépasse le domaine de l'apprentissage machine (Machine Learning) pour répondre à des besoins aussi divers que le debugging, le monitoring système, gestion de versions (via git) etc. »

[jupyterlab, machine_learning]

How to perform Feature Engineering in Machine Learning? [Christian]

lundi 28 septembre 2020

« La préparation des données pour être utilisées efficacement dans un projet d'apprentissage machine (Machine Learning) n'a rien d'évident et constitue une partie non négligeable de l'effort à fournir sur un projet. Cet article constitue une bonne introduction en matière. »

[python, machine_learning, data_science]

Here’s why Apple believes it’s an AI leader—and why it says critics have it all wrong [Sébastien]

lundi 31 août 2020

« Un échange avec le responsable de l'IA chez Apple, qui explique la position de l'entreprise sur la question; le machine learning est présenté comme très intégré dans leurs process. »

[apple, intelligence_artificielle, machine_learning]

The Making of a Youtube Radical [Romain]

mercredi 12 juin 2019

« Comment une modification de l'algorithme de recommandation de Youtube a fait le jeu de l'alt-right américaine. »

[machine_learning, éthique]

Microsoft open sources algorithm that gives Bing some of its smarts [Sébastien]

jeudi 16 mai 2019

« Microsoft vient de rendre public sur github l'algorithme de machine learning utilisé par son moteur de recherche Bing. »

[microsoft, machine_learning, bing, opensource]

The basics of modern AI—how does it work and will it destroy society this year? [Sébastien]

mercredi 10 avril 2019

« Un article très didactique sur ce que recouvrent les termes intelligence_artificielle, machine_learning et deep learning. »

[intelligence_artificielle, deep_learning, machine_learning]

Kernel Density Estimation [Christian]

mercredi 10 avril 2019

« Ce site démystifie à travers une animation interactive d'une grande qualité la méthode dite d'estimation par noyau (en anglais "Kernel Density Estimation") qui permet de déterminer la densité de probabilité d'une variable aléatoire (voir aussi l'article Wikipédia et le tutoriel Scikit-learn). »

[statistique, machine_learning]

How Microsoft found a Huawei driver that opened systems to attack [Sébastien]

mercredi 27 mars 2019

« Cet article explique comment Microsoft a trouvé une vulnérabilité dans un driver Huawei avec un algorithme de machine learning (cette vulnérabilité est corrigée dans les versions récentes des drivers) »

[sécurité, microsoft, huawei, machine_learning]

NVIDIA JETSON NANO : 128 COEURS CUDA POUR 99 DOLLARS [Romain]

jeudi 21 mars 2019

« nVidia lance sa "raspberry pi" orientée vers l'apprentissage automatique. »

[machine_learning]

Mozilla to use machine learning to find code bugs before they ship [Sébastien]

jeudi 14 février 2019

« Mozilla utilise maintenant pour Firefox un outil CleverCommit utilisant du machine learning pour identifier les commits contenant des bugs. »

[mozilla, firefox, machine_learning]

Mathematics for Machine Learning [Christian]

mercredi 6 juin 2018

« Ce livre, en cours de rédaction, se propose de fournir les outils mathématiques indispensables pour aborder les techniques courantes d'apprentissage machine (machine learning). »

[machine_learning, maths]

Clustering With K-Means in Python [Christian]

mercredi 31 janvier 2018

« Cet article expose brièvement l'algorithme K-Means et propose une implémentation très pédagogique en Python. »

[python, machine_learning]

Detecting fake banknotes using TensorFlow [Christian]

mercredi 17 janvier 2018

« Cet article offre une illustration de l'utilisation de TensorFlow sur un cas concret. »

[machine_learning, python, deep_learning]

WebRTC et TensorFlow [Olivier]

mercredi 13 décembre 2017

« Un guide pour utiliser l'API de reconnaissance d'objet de TensorFlow pour analyser des flux vidéo WebRTC. »

[webrtc, machine_learning]

Pour le moment, le machine learning n’est utilisé que par les gentils, mais il y a un vrai risque [Christian]

mercredi 29 novembre 2017

« Entretien avec Mikko Hypponen, directeur de la recherche chez F-Secure, au sujet des nouveaux défis de la cybersécurité, en particulier le machine learning. »

[machine_learning, sécurité]

Machine Learning, Deep Learning, and AI: What’s the Difference? [Sébastien]

mercredi 15 novembre 2017

« Un article pour expliquer ce que recouvrent précisément ces 3 termes. On trouve beaucoup d'articles différents sur ce thème avec une recherche Google mais la plupart se concentrent trop sur le deep learning sans expliquer clairement ce que recouvre le terme machine learning. »

[intelligence_artificielle, machine_learning, deep_learning]

Deep Learning, le grand trou noir de l’intelligence artificielle [Christian]

mercredi 15 novembre 2017

« Contrairement aux résultats produits par les algorithmes classiques, ceux produits par les réseaux de neurones sont difficiles, parfois impossibles à analyser et à justifier. Cet article se penche sur les implications éthiques et juridiques de cette réalité. »

[intelligence_artificielle, machine_learning, éthique, droit]

Feature Visualization -- How neural networks build up their understanding of images [Romain]

mercredi 8 novembre 2017

« Un article montrant comment la visualisation peut aider à comprendre le comportement des différentes couches d'un réseau de neurones. »

[machine_learning, visualisation]

Python Data Science Handbook [Christian]

mercredi 8 novembre 2017

« Un livre très utile aux développeurs Python confrontés aux défis liés aux données (manipulation, visualisation) et à l'apprentissage machine ("machine learning") »

[python, bigdata, machine_learning]

Intelligence artificielle : toujours plus puissant, AlphaGo apprend désormais sans données humaines [Sébastien]

mercredi 25 octobre 2017

« Une nouvelle version de AlphaGo, à qui on a juste donné les règles du jeu et qui s’est entraînée contre elle-même. Cette version est apparemment plus performante et moins gourmande en ressources que les versions précédentes. »

[machine_learning]

Introduction to the Python Deep Learning Library Theano [Christian]

mercredi 18 octobre 2017

« Cet article est une introduction à Theano, bibliothèque d'apprentissage profond (deep learning) développée à l'Université de Montréal. »

[python, machine_learning]

Tidy data [Sébastien]

mercredi 5 juillet 2017

« Une très intéressante réflexion sur la problématique de préparation des données, qui a été au centre de l'atelier "Préparation des données pour l'analyse statistique et le machine learning" animé par Sébastien Dejean (IMT) lors des JDEV 2017. »

[statistique, machine_learning]

Approaching (Almost) Any Machine Learning Problem [Christian]

mardi 23 mai 2017

« Une excellente présentation des différentes étapes d'un processus d'apprentissage machine (machine learning). »

[machine_learning]

Deep Learning course: lecture slides and lab notebooks [Christian]

jeudi 30 mars 2017

« Ce cours d’apprentissage profond (deep learning) a été présenté par Charles Ollion (Heuritech) et Olivier Grisel (Inria) dans le cadre du Master "Datascience" de l'Université Paris-Saclay. »

[machine_learning, cours, deep_learning]

L'apprentissage profond : une révolution en intelligence artificielle [Christian]

jeudi 2 mars 2017

« Le leçon inaugurale au Collège de France de Yann LeCun, professeur à l’université de New York et directeur du laboratoire de recherche en intelligence artificielle de Facebook (FAIR). »

[machine_learning, intelligence_artificielle]

IBM’s Watson proves useful at fighting cancer—except in Texas [Sébastien]

jeudi 23 février 2017

« Comment Watson d’IBM peut aider à personnaliser les traitements contre le cancer... à condition d’écouter les recommandations des professionnels IT! »

[machine_learning, intelligence_artificielle]

Machine Learning in a Week [Christian]

vendredi 6 janvier 2017

« Ce billet est un témoignage sur une première expérience en apprentissage-machine (machine learning). »

[machine_learning]

TensorKart: self-driving MarioKart with TensorFlow [Alexandre]

vendredi 6 janvier 2017

« Un article où l'auteur nous explique comment il a fait pour entrainer un réseau de neurone avec TensorFlow et pour le faire jouer à Mario Kart. »

[machine_learning]

Deep Learning with Keras [Alexandre]

vendredi 30 septembre 2016

« Un tutoriel pour s'initier au Deep Learning en Python avec Keras. Les exemples sont vraiment bien faits et contiennent les pointeurs vers les ressources permettant de comprendre les concepts du Deep Learning. »

[machine_learning, python]

Demandez le programme! Cloud computing avec Kubernetes et Docker [22-09-2016]

lundi 12 septembre 2016

A Concise Overview of Standard Model-fitting Methods [Christian]

vendredi 3 juin 2016

« Un aperçu rapide des quatre techniques classiques d'ajustement de modèle pour l'apprentissage machine (machine learning). »

[machine_learning]

Predictive modeling, supervised machine learning, and pattern classification [Christian]

vendredi 13 mai 2016

« Une introduction à l'apprentissage supervisé, par Sebastian Raschka. »

[machine_learning]

Deep Learning [Alexandre]

vendredi 29 avril 2016

« Une introduction au deep learning. »

[machine_learning, deep_learning]

Introducing TPOT, the Data Science Assistant [Christian]

vendredi 4 mars 2016

« Elaborer des chaînes de traitement pour l'apprentissage machine (machine-learning), c'est fastidieux. A tel point que ça devient un bon sujet ... d'apprentissage machine. »

[machine_learning]

Getting started with machine learning in Python [Alexandre]

vendredi 23 octobre 2015

« Manipulation de données et machine learning en python »

[algorithme, sécurité, statistique, python, machine_learning]

Machine Learning: Full-Text Search in Javascript [Romain]

vendredi 23 octobre 2015

« Une introduction à la recherche en plein texte. »

[algorithme, machine_learning]

Entry point: Data [Christian]

vendredi 5 juin 2015

« Une introduction aux outils python pour l'analyse des données et en particulier pour le "Machine Learning" »

[python, machine_learning]

How Machine Learning Algorithms Work Part 1 [Christian]

vendredi 24 avril 2015

« Une brève introduction aux concepts de base du "Machine Learning", par Sebastian Raschka, illustrés avec des implémentations en Python. »

[python, machine_learning]