L’une des plaintes les plus répandues des utilisateurs du monde entier lors de l’utilisation de différentes plateformes d’intelligence artificielle porte sur des éléments liés à la vie privée. Et parfois, ces plateformes exposent plus de données personnelles des utilisateurs que nous le souhaiterions.
Eh bien, il faut garder à l'esprit que l'un des plus grands représentants de cette technologie, OpenAI, vient de lancer Filtre de confidentialité. Nous faisons ici référence à un modèle open source conçu pour masquer nos données personnelles lors de l'utilisation de ces services et applications intelligents.
Nous vous disons tout cela car l'entreprise vient d'annoncer Privacy Filter, son nouveau modèle d'IA conçu pour détecter et masquer les informations personnellement identifiables dans les textes que nous utilisons ici. Cette version de source ouverte propose un modèle compact axé sur les flux de travail axés sur la confidentialité.
Tout cela permet aux développeurs de plateformes d'IA, identifier les informations sensibles dans des documents, des enregistrements et des ensembles de données, avant que tout soit stocké ou partagé avec d’autres. Il convient de noter que le modèle en tant que tel est conçu pour fonctionner comme un élément supplémentaire dans un processus global de protection de la vie privée utilisant l’intelligence artificielle, plutôt que de remplacer les politiques dans les environnements sensibles.
Ainsi, le modèle du filtre de confidentialité peut détecter des données personnelles dans une large gamme de formats de texte non structurés. Il traite de grandes quantités d'informations en un seul passage, identifiant les fragments sensibles et les marquant pour les masquer ou les supprimer sans générer de texte de remplacement.
Avantages du filtre de confidentialité AI par rapport aux méthodes traditionnelles
Il convient de noter que les développeurs peuvent exécuter le filtre de confidentialité directement sur leurs propres systèmes, permettant ainsi de filtrer le texte sensible avant qu'il ne quitte les ordinateurs. Cela signifie que votre exécution locale réduit le besoin de transmettre des données non filtrées à des services externes. Comme vous pouvez l'imaginer, tout cela facilite les flux de travail où des contrôles de confidentialité doivent être appliqués avant le stockage, l'indexation ou l'enregistrement.
Il faut savoir que les outils traditionnels de détection de données personnelles reposent généralement sur des règles de correspondance de modèles. Bien que ces règles fonctionnent bien pour les formats fixes comme numéros de téléphone et adresses e-mailils peuvent manquer des données sensibles et dépendantes du contexte.
Désormais, le nouveau modèle Privacy Filter AI applique une analyse contextuelle du langage pour identifier les données personnelles dans le texte. Cela permet au modèle de détecter les cas où les informations deviennent sensibles lorsqu'elles sont interprétées dans une phrase ou dans l'ensemble d'un document.
Pour être plus efficace que les méthodes précédentes de préservation de la confidentialité, le nouveau modèle utilise une structure de tri des jetons qui étiquette les jetons dans une séquence d'entrée. Les jetons sont évalués ensemble au cours d'un seul passage et ne sont pas traités étape par étape. Cela permet une analyse plus rapide des documents longs et prend en charge des longueurs de contexte allant jusqu'à 128 000 jetons.
Il convient de noter que le modèle contient 1,5 milliard de paramètres au total, dont 50 millions de paramètres actifs. Tout cela lui permet de maintenir la visibilité tout en étant suffisamment petit pour fonctionner localement sans problème.
Pour finir, nous vous dirons que identifie les informations sensibles dans huit catégories telles que les adresses, les e-mails, les numéros de téléphone, les URL, les dates privées, les numéros de compte ou les mots de passe. À son tour, le filtre de confidentialité est disponible sous la licence Apache 2.0 et les développeurs peuvent le télécharger à partir du Plateforme GitHub et exécutez-le localement.
FAQ sur le logiciel de confidentialité IA