vendredi 1 novembre 2024
« Un exemple intéressant d'utilisation intelligente des LLMs en tant qu'outil. Mieux en tout cas que de remplacer des humains par l'outil directement dans un cadre hospitalier où les conséquences pourraient être graves... »
vendredi 1 novembre 2024
« Un fait divers absolument glaçant; un chatBot de la société Character.AI a poussé au suicide un adolescent de 14 ans. »
jeudi 17 octobre 2024
« Cet article mentionne une étude menée par 6 scientifiques d'Apple qui ont montré que de légères modifications aux questions des tests de maths soumis à des LLMs (remplacer un nom par un autre, ajouter des détails inutiles à la résolution du problème) peut faire plonger leurs résultats. »
jeudi 4 juillet 2024
« Une keynote de Simon Willison, développeur prolifique (django, datasette...) qui suit de près l'évolution des LLMs, notamment en tant qu'outil de travail. Son intervention fait le point sur l'état de l'écosystème industriel fin juin 2024. Il montre en particulier une animation interactive type "barchart race" générée automatiquement, simplement en fournissant deux copies d'écran d'un modèle et les données. »
jeudi 6 juin 2024
« Pour les musiciens en panne d'inspiration, ce LLM permet de générer des musiques localement, sur la base d'un prompt utilisateur. »
[llm]
jeudi 12 octobre 2023
« Des chercheurs d'Anthropic (qui commercialise le modèle Claude, dont une des caractéristiques est sa grande fenêtre de contexte) présentent une approche permettant de décomposer des réseaux de neurones en unités interprétables. »
jeudi 5 octobre 2023
« Cet article et un autre illustrent l'importance des prompts dans les consignes données aux logiciels de LLM (Large Language Models): on peut ainsi améliorer les performances de ChatGPT à des tests de maths en lui disant de... respirer profondément (!) et on peut convaincre Bing Chat de lire un captcha (ce que normalement il n'a pas le droit de faire) en lui racontant une histoire inventée... »
jeudi 28 septembre 2023
« Les gros modèles de langage (Large Language Models ou LLMs) peuvent accomplir des tâches variées, mais leur donner des instructions n'est pas chose aisée et fait l'objet d'une discipline/appellation spécifique, le prompt engineering. Ce guide propose une entrée en matière. »
jeudi 21 septembre 2023
« onprem est un paquet python open source qui permet de télécharger et d'utiliser en local des grands modèles de langages (LLM), voici un billet qui explique pourquoi et comment s'en servir »
llama-gpt [Romain]
jeudi 24 août 2023
« Un outil facile à installer pour faire tourner localement un chatbot basé sur llama2. »
mardi 8 août 2023
« Un panorama du fonctionnement, de l'utilisation et de l'actualité récente des LLMs (Large Language Models). »