Il est fort probable qu’au cours des derniers mois, vous soyez nombreux à avoir utilisé l’un des nombreux assistants d’intelligence artificielle désormais disponibles. Un exemple clair de tout cela se trouve dans ChatGPT d'OpenAI, qui est peut-être l'une des propositions les plus connues et les plus utilisées.
Nous utilisons ces plateformes en ligne pour effectuer toutes sortes de requêtes, générer automatiquement du contenu, notamment des photos ou des vidéos, demander des conseils et même pour discuter amicalement. Mais l’une des plus grandes plaintes de nombreux utilisateurs réguliers de l’IA concerne tout ce qui concerne le confidentialité. C'est donc dans ces mêmes lignes que nous allons vous parler d'un projet personnel développé par un passionné de technologie appelé Simone Marzulli.
Plus précisément, nous faisons référence à un assistant IA personnalisé et le sien, qu'il a appelé Max Headbox et que nous décrirons ci-dessous au cas où vous souhaiteriez vous lancer dans quelque chose de similaire. De plus, c'est quelque chose que chacun d'entre nous peut réaliser de manière simple, même si cela nécessite certaines connaissances techniques, et pour un coût assez faible. Par conséquent, nous allons parler ci-dessous des composants de base dont vous aurez besoin pour mener à bien l’ensemble du processus de développement.
Composants essentiels pour l'assistant d'IA fait maison
Pour commencer, nous vous dirons que l'assistant en tant que tel est basé sur une mini carte Framboise Pi 5. Vous êtes sûrement nombreux à connaître ces composants qui peuvent être utilisés pour plusieurs projets et qui se sont enrichis au fil des années. Ainsi, Marzulli a créé son propre assistante intelligence artificielle qui fonctionne de manière autonome sur un Raspberry Pi 5. De plus, l'une de ses principales caractéristiques, qui plaira à beaucoup, est qu'il fonctionne entièrement localement.
Toutes les informations sont traitées au sein de l'équipe elle-même sans avoir à partager quoi que ce soit ni à envoyer de données à serveurs externes. Ainsi, des modèles de langage intelligents ouverts ont été utilisés, le tout directement sur la carte susmentionnée. Pour vous donner une idée plus précise du logiciel utilisé, utilisez Qwen3 1.7b pour la section agent de l'ensemble. C'est la partie qui prend les décisions et exécute les tâches correspondantes.
En revanche, il a installé Gemma3 1b être en charge de la section conversationnelle, le tout pour obtenir des réponses naturelles et émotionnelles. Au niveau matériel, en externe ce développeur a utilisé un boîtier avec un écran, et bien sûr, avec son système de ventilation correspondant. Et pas seulement, puisque pour interagir au mieux avec cet assistant intelligent, l'écran tactile monté intègre un visage animé ce qui donne une plus grande spectaculaireté au projet. Ce n'est rien de plus qu'un emoji animé de Microsoft Fluent.
Parallèlement, d'autres solutions logicielles essentielles que nous devrions installer sont Ruby 3.3.0, Noeud 22, Python 3 et Ollama. Une fois entièrement assemblé, l’assistant IA est formé pour reconnaître les commandes vocales. Bien sûr, pour cela, comme nous le dit son créateur, il utilise l'API Vosk pour détecter les mots-clés, en plus du chuchotement plus rapide qui permet de retranscrire ce que l'utilisateur dit à l'assistant lui-même.
Pour finir, nous vous dirons que plus tard nous pourrons installer des outils logiciels supplémentaires pour Caisse d'arrivée maximale sous forme de modules JavaScript pour effectuer plusieurs tâches dans le futur.
FAQ sur la HeadBox Max C'est le nom d'un projet visant à construire un assistant personnel d'intelligence artificielle qui fonctionne localement sur une mini carte Raspberry Pi 5.
Exécutés localement, tous les traitements de données et conversations se déroulent au sein de l’appareil. Aucune information n'est envoyée aux serveurs externes de l'entreprise.
Oui, le projet intègre l'API Vosk pour la détection de mots clés et l'outil plus rapide pour transcrire les commandes vocales des utilisateurs.
Qu’est-ce que la boîte à tête Max ?
Pourquoi un assistant local est-il meilleur pour la confidentialité ?
Cet assistant peut-il comprendre les commandes vocales ?