Est-ce que DeepSeek, Mistral, openai et tous les autres modèles de LLM sont censurés ?
Ce qui est sûr, c’est que certaines réponses ne sont pas fournies par les LLM, pour plein de raisons.
Alors comment ça marche un filtrage ? Dans cette vidéo, je vous montre comment un modèle va pouvoir être filtré sans le modifier.
Lien direct : https://youtu.be/V1EBNHXf1PE
C’est probablement ceci que vous retrouvez dans de nombreux cas où une IA refuse de répondre à une question.
Chapitres:
00:00 Intro
00:16 Example avec open webui
01:46 Pourquoi filtrer
02:57 Filtre simple : un modèle qui ne doit pas parler de dessert !
08:29 Bypass de censure
11:21 Filtre en sortie, le résultat ne devrait pas mentir…
14:20 Modération via mistral, une IA pour filtrer une IA
23:46 Conclusion
Code des exemples : https://codeberg.org/neuronaddict/model-filtering
Liens :
- open-webui : https://docs.openwebui.com/
- ollama : https://ollama.com/
- mistral : https://mistral.ai/
- L’api de modération de mistral : https://mistral.ai/news/mistral-moderation
- Aide pour l’installation des exemples : https://codeberg.org/neuronaddict/model-filtering/src/branch/master/README.md





Laisser un commentaire