Interpol va recourir à l’empreinte vocale pour identifier les criminels

Interpol va recourir à l’empreinte vocale pour identifier les criminels

Interpol procédera prochainement à la mise en activité d’une nouvelle plateforme de logiciels qui vise à identifier les contrevenants à la loi en utilisant, pour la première fois dans l’histoire de la police, des empreintes vocales. Ce dispositif technologique permettra à Interpol de reconnaître les criminels à leur voix téléphonique et autres enregistrements sonores.

Le plus grand réseau de police au monde est entré dans l’ère des technologies vocales. Il a mis en exécution expérimentale un ensemble de logiciels qui permettraient de faire correspondre des échantillons de voix au téléphone ou des messages vocaux tirés des réseaux sociaux, à des enregistrements vocaux de criminels stockés dans une très grande base de données partagée par les organismes gouvernementaux d’application de la loi. Baptisée SIIP (Speaker Identification Integrated Project), en 2014, à l’initiative de la Commission européenne, avec la collaboration d’Interpol, la plateforme des logiciels vocaux, telle que décrite par ses développeurs, fait appel à des algorithmes d’analyse de la parole pour filtrer les échantillons vocaux selon le sexe, l’âge, la langue et l’accent.

Il s’agit de la programmation d’une approche algorithmique qui permettra l’identification de suspects par un processus de mise en relation d’une solution de reconnaissance d’un locuteur, qui compare une voix enregistrée lors d’écoutes téléphoniques, d’enregistrements sur des scènes de crime ou à partir de fichiers sonores issus des réseaux sociaux, avec celles figurant dans la base de données.

Les développeurs ont accompli avec succès les tests de performance du SIIP, effectués sur le terrain, au mois de mars 2017, à Lisbonne, au Portugal. Des chercheurs, spécialistes de la police scientifique, enquêteurs de la police judiciaire et experts dans le domaine de la reconnaissance de locuteurs ont pu assister à des démonstrations de recoupement avec succès d’enregistrements vocaux tirés des réseaux sociaux à l’aide d’identifiants clés, tels que le sexe, l’âge, la langue et l’accent. La prochaine étape concernera la présentation du projet en juin prochain à Bruxelles.

«ADN» vocale

La plateforme SIIP sera gérée par Interpol au niveau de son siège à Lyon, en France, dans le but d’accroître la précision des données vocales et d’améliorer ses fiabilité et recevabilité judiciaires. Alors que le système d’identification vocale SIIP peut traiter n’importe quel son «légalement intercepté», y compris les conversations ambiantes, son utilisation prévue serait de faire correspondre les voix recueillies à une base de données représentant une «liste noire» vocale. Une sorte de fichier d’empreintes vocales de criminels et terroristes archivés par les services de sécurité. Les échantillons peuvent provenir d’enregistrements effectués sur les réseaux téléphoniques mobiles, fixes ou mobiles, et via des applications VoIP (Voice over Internet Protocol), comme Viber, Skype ou Whatsapp, ou carrément tirés de données audio collectées à partir de vidéos de recrutement ou de propagande postées sur les réseaux sociaux. Ces données enregistrées deviennent essentiellement un widget activé sur une ligne de production. Ce fichier sonore, peut déjà inclure certaines métadonnées descriptives ajoutées par les responsables de l’application de la loi qui l’ont initialement sécurisé. Le logiciel assurera par la suite l’étiquetage de ce fichier en ajoutant de nouvelles informations sur l’âge ou l’accent du locuteur, par exemple.

Pour faciliter cette tâche, SIIP crée un modèle d’enregistrement d’un appel téléphonique effectué par la police, indiquant les paramètres acoustiques qui caractérisent les signaux vocaux du fichier. Ces caractéristiques sont appelées vecteurs d’identité, qui sont utilisés pour tenter une recherche de correspondances dans la «liste noire vocale».

Algorithmes

Pour réaliser la plateforme SIIP, les développeurs ont réalisé des programmes sur la base d’algorithmes spécifiques destinés à traiter des requêtes liées au traitement mathématique des sons de la parole naturelle. Ainsi, des échantillons vocaux nouvellement enregistrés peuvent être triés de manière à les rendre plus intelligibles en faisant appel à des techniques de filtrage du bruit de fond, de l’amélioration de la clarté de la voix et de l’isolement des sons utiles. Le but visé par ces traitements hautement technologiques est de parvenir, dans les meilleures conditions, à la correspondance mathématique des vecteurs acoustiques du fichier sonore enregistré avec ceux contenus dans la base de données d’échantillons sonores de la «liste noire» qui peut contenir jusqu’à un million de fichiers vocaux. L’accès à ces «empreintes vocales» est géré par Interpol en collaboration avec des organismes d’application de la loi issus de 192 pays. Selon des résultats des tests réels effectués sur le terrain par les experts d’Interpol, les performances de la plateforme SIIP sont exceptionnelles. Elle peut faire correspondre des échantillons vocaux provenant de plateformes de réseaux sociaux, notamment Twitter, Google+, LinkedIn, YouTube et Facebook. En combinant le contenu multimédia en fonction de critères de recherche tels que la géolocalisation du langage, le système va étiqueter et traiter ce matériel, et trouver des fichiers similaires dans la base de données.

F. F.