jeudi 20 mars 2025
« Cet article utilise le cas des LLMs pour une critique plus générale de la confiance aveugle dans des métriques : une imposante majorité des développeurs (78 %) semble préférer utiliser Claude comme LLM, alors que dans les benchmarks sa domination n'est pas si évidente (les deux premiers renvoyés par une recherche Duck Duck Go placent ainsi la version o3 de ChatGPT en tête, certes pas uniquement pour les usages de développement). »