Est-ce que DeepSeek, Mistral, openai et tous les autres modèles de LLM sont censurés ?
Ce qui est sûr, c’est que certaines réponses ne sont pas fournies par les LLM, pour plein de raisons.

Alors comment ça marche un filtrage ? Dans cette vidéo, je vous montre comment un modèle va pouvoir être filtré sans le modifier.

Lien direct : https://youtu.be/V1EBNHXf1PE

C’est probablement ceci que vous retrouvez dans de nombreux cas où une IA refuse de répondre à une question.

Chapitres:

00:00 Intro
00:16 Example avec open webui
01:46 Pourquoi filtrer
02:57 Filtre simple : un modèle qui ne doit pas parler de dessert !
08:29 Bypass de censure
11:21 Filtre en sortie, le résultat ne devrait pas mentir…
14:20 Modération via mistral, une IA pour filtrer une IA
23:46 Conclusion

Code des exemples : https://codeberg.org/neuronaddict/model-filtering

Liens :

Laisser un commentaire

Tendances