SED Saclay : Pages du mot-clé 'llm'

Every Reason Why I Hate AI and You Should Too [Sébastien]

lundi 4 août 2025

« Un très long post d'un utilisateur très sceptique des LLM qui soulève nombre de points intéressants - dont certains que je n'avais pas encore vus dans d'autres oublications. Je recommande vivement de prendre le temps de le lire! »

[intelligence_artificielle, llm, apple]

Developer survey shows trust in AI coding tools is falling as usage rises [Sébastien]

lundi 4 août 2025

« Le sondage annuel Stack Overflow avait des questions portant sur l'utilisation des LLM par les dev; sans surprise beaucoup ont essayé et ont de ce fait pris conscience de leurs possibilités... et de leurs limitations. L'article évoque très superficiellement un problème que j'ai vu dans plusieurs posts de dev: dans certaines entreprises l'utilisation des LLMs est imposé par les managers alléchés par les promesses mirifiques des entreprises promouvant l'IA. »

[métier, llm, intelligence_artificielle]

But will they? [Ghislain Vaillant]

lundi 4 août 2025

« Jürgen Geuter (a.k.a. "tante") confronte l'idéalisme d'Armin Ronacher, connu pour son influence dans les communautés Python et Rust, au sujet du recours aux IA agentiques pour aider au développement du code. Derrière l'apparence de cette querelle se cache un profond débat sur la valeur de l'apprentissage, de la pratique et de l'expérience dans l'ingénierie logicielle. Le fil de discussion en fin de billet vaut également le coup d'œil. »

[intelligence_artificielle, llm]

Vous pouvez externaliser le sale boulot à un LLM, pas l'expertise. [Ghislain Vaillant]

jeudi 10 juillet 2025

« Un billet de blog sur l'utilisation de grands modèles de langue pour coder. Au delà du constat qu'un LLM n'a d'utilité que pour des tâches que nous sommes nous-mêmes capables d'accomplir, j'aime la pertinence de l'analogie avec le monde du consulting. »

[intelligence_artificielle, llm]

La recherche démontre que certains grands modèles de langue bafouent le droit d'auteur, quelles implications pour le futur ? [Ghislain Vaillant]

jeudi 19 juin 2025

« En partant du constat que plusieurs grands modèles de langue sont capables de régurgiter verbatim une large portion d'œuvres sous droit d'auteur, s'ouvre une discussion plus large sur la faiblesse argumentative du fair use actuellement en vigueur aux États-Unis, et les conséquences délétères (ou pas ?) que pourraient engendrer sa remise en cause. »

[machine_learning, llm, droit]

LLMs Will Not Replace You [Sébastien]

jeudi 5 juin 2025

« Probablement l'explication la plus claire que j'ai lue sur le fonctionnement des LLMs. »

[llm, métier]

AI contributions to Servo [Romain (via le blog de Simon Willison)]

jeudi 22 mai 2025

« Le projet libre Servo a choisi une posture interdisant les contributions utilisant des LLMs, en justifiant celle-ci par des contraintes liées à la criticité du projet, à l'effort demandé aux relecteurs et à des objections éthiques et de propriété intellectuelle. »

[llm, opensource]

Développeurs, attention à l'empoisonnement de vos IA ! [Kim]

vendredi 9 mai 2025

« Attention aux caractères unicodes cachés dans les fichiers de configuration ! Une nouvelle vulnérabilité, appelée "Rules File Backdoor", est décrite dans cet article. »

[intelligence_artificielle, code, llm, sécurité]

Annoyed ChatGPT users complain about bot’s relentlessly positive tone [Sébastien]

vendredi 25 avril 2025

« De plus en plus d'utilisateurs s'agacent des formules obséqieuses utilisées par ChatGPT et Claude dans les interactions avec l'utilisateur. L'article indique des jeux d'instructions qui permettent de limiter le problème. »

[llm]

The Rise of Slopsquatting: How AI Hallucinations Are Fueling a New Class of Supply Chain Attacks [Ioana (Cedar)]

vendredi 25 avril 2025

« Les LLM hallucinent des librairies/paquets imaginaires --> des acteurs malveillants les enregistrent et les arment ! »

[llm, sécurité, cybersécurité]

AI haters build tarpits to trap and trick AI scrapers that ignore robots.txt [Guilaume]

jeudi 17 avril 2025

« Face aux crawlers d'entraînement des LLM peu scrupuleux, des activistes aux motivations diverses trouvent des ripostes. Ces méthodes peu onéreuses essaient de faire plier des entreprises multi-milliardaires en touchant directement à leur portefeuille, car les LLM fonctionnent pour l'instant à perte et sont uniquement financés par une bulle spéculative qui mise sur leur rentabilité et performance futures. Certaines de ces méthodes tentent aussi de fournir des données d'entraînement empoisonnées aux entreprises qui ignorent robots.txt. »

[llm, capitalisme]

Researchers concerned to find AI models hiding their true “reasoning” processes [Sébastien]

jeudi 17 avril 2025

« Des chercheurs s'inquiètent du manque d'« honnêteté » des LLMs, qui donnent difficilement les chaînes de pensée (« chain-of-thought ») ayant conduit à leur réponse même quand ils sont questionnés directement dessus - ils observent même une tendance à donner des arguments plus longs et fallacieux quand leur réponse est mensongère. Un point positif de cet article est que les chercheurs en question sont des employés d'Anthropic (la société derrière le LLM Claude) et n'hésitent pas à montrer que Claude se comporte encore plus mal que DeepSeek sur le phénomène analysé. »

[llm, intelligence_artificielle]

Can we make AI less power-hungry? These researchers are working on it. [Sébastien]

jeudi 3 avril 2025

« Une analyse intéressante du paysage de la consommation énergétique liée à l'IA, et des pistes pour la limiter. On y apprend notamment que le facteur 10 entre la consommation d'une recherche Google et une recherche par LLM est du doigt mouillé : les deux chiffres utilisés sont très indirects (et l'auteur de l'article déplore qu'on ne force pas un peu plus la main aux entreprises pour plus de transparence sur le sujet). »

[llm, développement_durable, intelligence_artificielle]

Can we make AI less power-hungry? These researchers are working on it. [Sébastien]

jeudi 27 mars 2025

« Une analyse intéressante du paysage de la consommation énergétique liée à l'IA, et des pistes pour la limiter. On y apprend notamment que le facteur 10 entre la consommation d'une recherche Google et une recherche par LLM est du doigt mouillé : les deux chiffres utilisés sont très indirects (et l'auteur de l'artciel déplore qu'on ne force pas un peu plus la main aux entreprises pour plus de transparence sur le sujet). »

[llm, développement_durable]

Dad demands OpenAI delete ChatGPT’s false claim that he murdered his kids [Sébastien]

jeudi 20 mars 2025

« Ce n'est peut-être pas une si bonne idée de compter sur l'IA pour la recherche de contenus sur Internet... »

[llm, openai, moteur_de_recherche]

Yes, Claude Code can decompile itself. Here's the source code. [Vincent]

jeudi 20 mars 2025

« L'auteur de ce post a demandé à Claude Code de se désassembler, puis de rendre le code le plus lisible possible. Après quelques itérations, le résultat est assez impressionnant, mais cette expérience pose surtout des questions de propriétés intellectuelles, puisqu'il suffit d'utiliser la même technique sur du code propriétaire pour le proposer en open source. »

[llm, propriete_intellectuelle]

Metric-Driven Development and The Claude Effect [Sébastien]

jeudi 20 mars 2025

« Cet article utilise le cas des LLMs pour une critique plus générale de la confiance aveugle dans des métriques : une imposante majorité des développeurs (78 %) semble préférer utiliser Claude comme LLM, alors que dans les benchmarks sa domination n'est pas si évidente (les deux premiers renvoyés par une recherche Duck Duck Go placent ainsi la version o3 de ChatGPT en tête, certes pas uniquement pour les usages de développement). »

[métrique, métier, llm]

Here's how I use LLMs to help me write code [Romain]

jeudi 13 mars 2025

« Une série de conseils sur l'écriture de code avec des LLMs. Simon Willison, l'auteur, est un programmeur chevronné (co-créateur de Django) et un explorateur curieux des modèles de langages depuis quelques années. Le début de l'article résume bien le problème : "Using LLMs to write code is difficult and unintuitive. It takes significant effort to figure out the sharp and soft edges of using them in this way, and there's precious little guidance to help people figure out how best to apply them." »

[llm, métier, code]

Pourquoi je n’utilise pas ChatGPT [Maxence]

jeudi 6 février 2025

« Florence Maraninchi expose plusieurs arguments pour ne pas utiliser d'IA générative. »

[intelligence_artificielle, llm]

I agree with OpenAI: You shouldn’t use other peoples’ work without permission [Sébastien]

jeudi 6 février 2025

« Le sous-titre résume bien l'article : OpenAI says DeepSeek used its data improperly. That must be frustrating! »

[intelligence_artificielle, propriete_intellectuelle, openai, llm]

A harsh message to LLM users [Maxence]

jeudi 23 janvier 2025

« Un message pour les utilisateurs de LLM. 👍 »

[intelligence_artificielle, llm]

How I program with LLMs [Sébastien]

jeudi 16 janvier 2025

« Un retour d'expérience intéressant de ce que les LLM peuvent apporter à un développeur. »

[llm, métier]

It’s remarkably easy to inject new medical misinformation into LLMs [Sébastien]

jeudi 16 janvier 2025

« Des chercheurs de l'Université de New York ont testé l'impact d'« empoisonnement » de données d'entraînement d'un LLM médical, en ajoutant des données fausses générées par ChatGPT 3.5 dans une base de donnée fréquemment utilisée pour les entraînements et qui a une partie qui n'est pas vérifiée par des êtres humains. Les résultats sont inquiétants: contaminer 0.001 % de la base d'entraînement suffit pour obtenir une baisse de qualité générale sur les réponses à toutes les requêtes, et l'insertion de ces données peut être aussi simple que créer une page Web... avec les vieilles astuces pour tromper le moteur de recherche de Google à ses débuts qui marchent (mettre du contenu noir dans un fond noir par exemple qui ne sera pas vu par les internautes mais sera pris en compte dans l'entraînement). »

[llm]

Recette d'installation de Ollama et OpenWebUI pour expérimenter avec des LLM en local [Ghislain Vaillant]

jeudi 12 décembre 2024

« Un court article de blog pour déployer le nécessaire pour faire tourner des LLM en local en utilisant Ollama, OpenWebUI et Docker sur une infrastructure NVIDIA. »

[docker, llm, nvidia]

Livebench [Romain]

jeudi 12 décembre 2024

« Un benchmark qui compare des LLMs sur des tâches variées. »

[llm]

Introducing the Model Context Protocol [Romain]

jeudi 28 novembre 2024

« Le contexte est un aspect important de l'usage des LLM (en clair, il s'agit de leur donner accès à des données, des outils, des sources d'information...) ; Anthropic, qui développe le modèle Claude, propose un protocole unifié pour l'accès à ces ressources. »

[llm, protocol, outils]

Apple Intelligence notification summaries are honestly pretty bad [Sébastien]

jeudi 21 novembre 2024

« Un retour d'expérience assez négatif de l'« Apple Intelligence » disponible pour les iPhone les plus récents; la conclusion est que le journaliste garde l'option... pour la valeur humoristique de quelques-unes des notes générées! »

[apple, llm, intelligence_artificielle]

How The New York Times is using generative AI as a reporting tool [Sébastien]

vendredi 1 novembre 2024

« Un exemple intéressant d'utilisation intelligente des LLMs en tant qu'outil. Mieux en tout cas que de remplacer des humains par l'outil directement dans un cadre hospitalier où les conséquences pourraient être graves... »

[intelligence_artificielle, llm]

Lawsuit: Chatbot that allegedly caused teen’s suicide is now more dangerous for kids [Sébastien]

vendredi 1 novembre 2024

« Un fait divers absolument glaçant; un chatBot de la société Character.AI a poussé au suicide un adolescent de 14 ans. »

[intelligence_artificielle, llm]

Apple study exposes deep cracks in LLMs’ “reasoning” capabilities [Sébastien]

jeudi 17 octobre 2024

« Cet article mentionne une étude menée par 6 scientifiques d'Apple qui ont montré que de légères modifications aux questions des tests de maths soumis à des LLMs (remplacer un nom par un autre, ajouter des détails inutiles à la résolution du problème) peut faire plonger leurs résultats. »

[llm, intelligence_artificielle]

Open challenges for AI engineering [Romain]

jeudi 4 juillet 2024

« Une keynote de Simon Willison, développeur prolifique (django, datasette...) qui suit de près l'évolution des LLMs, notamment en tant qu'outil de travail. Son intervention fait le point sur l'état de l'écosystème industriel fin juin 2024. Il montre en particulier une animation interactive type "barchart race" générée automatiquement, simplement en fournissant deux copies d'écran d'un modèle et les données. »

[llm, métier]

MusicGPT - Generate music based on natural language prompts using LLMs running locally. [Vincent]

jeudi 6 juin 2024

« Pour les musiciens en panne d'inspiration, ce LLM permet de générer des musiques localement, sur la base d'un prompt utilisateur. »

[llm]

Decomposing Language Models Into Understandable Components [Romain]

jeudi 12 octobre 2023

« Des chercheurs d'Anthropic (qui commercialise le modèle Claude, dont une des caractéristiques est sa grande fenêtre de contexte) présentent une approche permettant de décomposer des réseaux de neurones en unités interprétables. »

[llm, machine_learning]

Dead grandma locket request tricks Bing Chat’s AI into solving security puzzle [Sébastien]

jeudi 5 octobre 2023

« Cet article et un autre illustrent l'importance des prompts dans les consignes données aux logiciels de LLM (Large Language Models): on peut ainsi améliorer les performances de ChatGPT à des tests de maths en lui disant de... respirer profondément (!) et on peut convaincre Bing Chat de lire un captcha (ce que normalement il n'a pas le droit de faire) en lui racontant une histoire inventée... »

[intelligence_artificielle, llm]

Prompt Engineering Guide [Romain]

jeudi 28 septembre 2023

« Les gros modèles de langage (Large Language Models ou LLMs) peuvent accomplir des tâches variées, mais leur donner des instructions n'est pas chose aisée et fait l'objet d'une discipline/appellation spécifique, le prompt engineering. Ce guide propose une entrée en matière. »

[llm, machine_learning, prompt_engineering]

onprem, pour faire tourner facilement des LLM [Vincent]

jeudi 21 septembre 2023

« onprem est un paquet python open source qui permet de télécharger et d'utiliser en local des grands modèles de langages (LLM), voici un billet qui explique pourquoi et comment s'en servir »

[llm, opensource]

llama-gpt [Romain]

jeudi 24 août 2023

« Un outil facile à installer pour faire tourner localement un chatbot basé sur llama2. »

[chatgpt, llm, intelligence_artificielle]

Catching up on the weird world of LLMs [Romain]

mardi 8 août 2023

« Un panorama du fonctionnement, de l'utilisation et de l'actualité récente des LLMs (Large Language Models). »

[llm, machine_learning, intelligence_artificielle]