jeudi 17 avril 2025
« Face aux crawlers d'entraînement des LLM peu scrupuleux, des activistes aux motivations diverses trouvent des ripostes. Ces méthodes peu onéreuses essaient de faire plier des entreprises multi-milliardaires en touchant directement à leur portefeuille, car les LLM fonctionnent pour l'instant à perte et sont uniquement financés par une bulle spéculative qui mise sur leur rentabilité et performance futures. Certaines de ces méthodes tentent aussi de fournir des données d'entraînement empoisonnées aux entreprises qui ignorent robots.txt. »
jeudi 17 avril 2025
« Des chercheurs s'inquiètent du manque d'« honnêteté » des LLMs, qui donnent difficilement les chaînes de pensée (« chain-of-thought ») ayant conduit à leur réponse même quand ils sont questionnés directement dessus - ils observent même une tendance à donner des arguments plus longs et fallacieux quand leur réponse est mensongère. Un point positif de cet article est que les chercheurs en question sont des employés d'Anthropic (la société derrière le LLM Claude) et n'hésitent pas à montrer que Claude se comporte encore plus mal que DeepSeek sur le phénomène analysé. »
jeudi 3 avril 2025
« Une analyse intéressante du paysage de la consommation énergétique liée à l'IA, et des pistes pour la limiter. On y apprend notamment que le facteur 10 entre la consommation d'une recherche Google et une recherche par LLM est du doigt mouillé : les deux chiffres utilisés sont très indirects (et l'auteur de l'article déplore qu'on ne force pas un peu plus la main aux entreprises pour plus de transparence sur le sujet). »
jeudi 27 mars 2025
« Une analyse intéressante du paysage de la consommation énergétique liée à l'IA, et des pistes pour la limiter. On y apprend notamment que le facteur 10 entre la consommation d'une recherche Google et une recherche par LLM est du doigt mouillé : les deux chiffres utilisés sont très indirects (et l'auteur de l'artciel déplore qu'on ne force pas un peu plus la main aux entreprises pour plus de transparence sur le sujet). »
jeudi 20 mars 2025
« Ce n'est peut-être pas une si bonne idée de compter sur l'IA pour la recherche de contenus sur Internet... »
jeudi 20 mars 2025
« L'auteur de ce post a demandé à Claude Code de se désassembler, puis de rendre le code le plus lisible possible. Après quelques itérations, le résultat est assez impressionnant, mais cette expérience pose surtout des questions de propriétés intellectuelles, puisqu'il suffit d'utiliser la même technique sur du code propriétaire pour le proposer en open source. »
jeudi 20 mars 2025
« Cet article utilise le cas des LLMs pour une critique plus générale de la confiance aveugle dans des métriques : une imposante majorité des développeurs (78 %) semble préférer utiliser Claude comme LLM, alors que dans les benchmarks sa domination n'est pas si évidente (les deux premiers renvoyés par une recherche Duck Duck Go placent ainsi la version o3 de ChatGPT en tête, certes pas uniquement pour les usages de développement). »
jeudi 13 mars 2025
« Une série de conseils sur l'écriture de code avec des LLMs. Simon Willison, l'auteur, est un programmeur chevronné (co-créateur de Django) et un explorateur curieux des modèles de langages depuis quelques années. Le début de l'article résume bien le problème : "Using LLMs to write code is difficult and unintuitive. It takes significant effort to figure out the sharp and soft edges of using them in this way, and there's precious little guidance to help people figure out how best to apply them." »
jeudi 6 février 2025
« Florence Maraninchi expose plusieurs arguments pour ne pas utiliser d'IA générative. »
jeudi 6 février 2025
« Le sous-titre résume bien l'article : OpenAI says DeepSeek used its data improperly. That must be frustrating! »
jeudi 23 janvier 2025
« Un message pour les utilisateurs de LLM. 👍 »
jeudi 16 janvier 2025
« Un retour d'expérience intéressant de ce que les LLM peuvent apporter à un développeur. »
jeudi 16 janvier 2025
« Des chercheurs de l'Université de New York ont testé l'impact d'« empoisonnement » de données d'entraînement d'un LLM médical, en ajoutant des données fausses générées par ChatGPT 3.5 dans une base de donnée fréquemment utilisée pour les entraînements et qui a une partie qui n'est pas vérifiée par des êtres humains. Les résultats sont inquiétants: contaminer 0.001 % de la base d'entraînement suffit pour obtenir une baisse de qualité générale sur les réponses à toutes les requêtes, et l'insertion de ces données peut être aussi simple que créer une page Web... avec les vieilles astuces pour tromper le moteur de recherche de Google à ses débuts qui marchent (mettre du contenu noir dans un fond noir par exemple qui ne sera pas vu par les internautes mais sera pris en compte dans l'entraînement). »
[llm]
jeudi 12 décembre 2024
« Un court article de blog pour déployer le nécessaire pour faire tourner des LLM en local en utilisant Ollama, OpenWebUI et Docker sur une infrastructure NVIDIA. »
Livebench [Romain]
jeudi 12 décembre 2024
« Un benchmark qui compare des LLMs sur des tâches variées. »
[llm]
jeudi 28 novembre 2024
« Le contexte est un aspect important de l'usage des LLM (en clair, il s'agit de leur donner accès à des données, des outils, des sources d'information...) ; Anthropic, qui développe le modèle Claude, propose un protocole unifié pour l'accès à ces ressources. »
jeudi 21 novembre 2024
« Un retour d'expérience assez négatif de l'« Apple Intelligence » disponible pour les iPhone les plus récents; la conclusion est que le journaliste garde l'option... pour la valeur humoristique de quelques-unes des notes générées! »
vendredi 1 novembre 2024
« Un exemple intéressant d'utilisation intelligente des LLMs en tant qu'outil. Mieux en tout cas que de remplacer des humains par l'outil directement dans un cadre hospitalier où les conséquences pourraient être graves... »
vendredi 1 novembre 2024
« Un fait divers absolument glaçant; un chatBot de la société Character.AI a poussé au suicide un adolescent de 14 ans. »
jeudi 17 octobre 2024
« Cet article mentionne une étude menée par 6 scientifiques d'Apple qui ont montré que de légères modifications aux questions des tests de maths soumis à des LLMs (remplacer un nom par un autre, ajouter des détails inutiles à la résolution du problème) peut faire plonger leurs résultats. »
jeudi 4 juillet 2024
« Une keynote de Simon Willison, développeur prolifique (django, datasette...) qui suit de près l'évolution des LLMs, notamment en tant qu'outil de travail. Son intervention fait le point sur l'état de l'écosystème industriel fin juin 2024. Il montre en particulier une animation interactive type "barchart race" générée automatiquement, simplement en fournissant deux copies d'écran d'un modèle et les données. »
jeudi 6 juin 2024
« Pour les musiciens en panne d'inspiration, ce LLM permet de générer des musiques localement, sur la base d'un prompt utilisateur. »
[llm]
jeudi 12 octobre 2023
« Des chercheurs d'Anthropic (qui commercialise le modèle Claude, dont une des caractéristiques est sa grande fenêtre de contexte) présentent une approche permettant de décomposer des réseaux de neurones en unités interprétables. »
jeudi 5 octobre 2023
« Cet article et un autre illustrent l'importance des prompts dans les consignes données aux logiciels de LLM (Large Language Models): on peut ainsi améliorer les performances de ChatGPT à des tests de maths en lui disant de... respirer profondément (!) et on peut convaincre Bing Chat de lire un captcha (ce que normalement il n'a pas le droit de faire) en lui racontant une histoire inventée... »
jeudi 28 septembre 2023
« Les gros modèles de langage (Large Language Models ou LLMs) peuvent accomplir des tâches variées, mais leur donner des instructions n'est pas chose aisée et fait l'objet d'une discipline/appellation spécifique, le prompt engineering. Ce guide propose une entrée en matière. »
jeudi 21 septembre 2023
« onprem est un paquet python open source qui permet de télécharger et d'utiliser en local des grands modèles de langages (LLM), voici un billet qui explique pourquoi et comment s'en servir »
llama-gpt [Romain]
jeudi 24 août 2023
« Un outil facile à installer pour faire tourner localement un chatbot basé sur llama2. »
mardi 8 août 2023
« Un panorama du fonctionnement, de l'utilisation et de l'actualité récente des LLMs (Large Language Models). »