jeudi 12 octobre 2023
« Des chercheurs d'Anthropic (qui commercialise le modèle Claude, dont une des caractéristiques est sa grande fenêtre de contexte) présentent une approche permettant de décomposer des réseaux de neurones en unités interprétables.  »
jeudi 5 octobre 2023
« Cet article et un autre illustrent l'importance des prompts dans les consignes données aux logiciels de LLM (Large Language Models): on peut ainsi améliorer les performances de ChatGPT à des tests de maths en lui disant de... respirer profondément (!) et on peut convaincre Bing Chat de lire un captcha (ce que normalement il n'a pas le droit de faire) en lui racontant une histoire inventée...  »
jeudi 28 septembre 2023
« Les gros modèles de langage (Large Language Models ou LLMs) peuvent accomplir des tâches variées, mais leur donner des instructions n'est pas chose aisée et fait l'objet d'une discipline/appellation spécifique, le prompt engineering. Ce guide propose une entrée en matière.  »
jeudi 21 septembre 2023
« onprem est un paquet python open source qui permet de télécharger et d'utiliser en local des grands modèles de langages (LLM), voici un billet qui explique pourquoi et comment s'en servir  »
llama-gpt [Romain]
jeudi 24 août 2023
« Un outil facile à installer pour faire tourner localement un chatbot basé sur llama2.  »
mardi 8 août 2023
« Un panorama du fonctionnement, de l'utilisation et de l'actualité récente des LLMs (Large Language Models).  »