Publicité

à LA UNE

ENVIRONNEMENT
Efficacité énergétique: quand les bénéfices se mettent au vert
 
INGENIERIE
Le tourisme en version scénarisée et interactive
EMPLOI
Les robots, ces voleurs de travail
 
HISTOIRE
Le mythe du nombre d'or
SUISSE
Ami-ami? Faut voir
 
SECURITE
Comment la blockchain fait évoluer la notion de confiance

AFFAIRES à Suivre
SUISSE  PARU DANS REFLEX
PARU DANS L'HEBDO  INNOVATION
INVESTIR  PARU DANS HéMISPHèRES

LES PLUS LUS depuis un mois
1
SECURITE
Comment la blockchain fait évoluer la notion de confiance
 2
RESEAUX
Rotary, Lions Club: derrière la philanthropie, le réseautage
3
INNOVATION
Sciences humaines: pourvoyeuses de travail à haut potentiel
 4
TECHNOLOGIE
Le son mis en nombres
5
SANTE
L’échelle du mal
 6
SCIENCES
Les fleurons de la science de demain

Réseaux sociaux
 

TECHNOPHILE

Commenter  Imprimer  Envoyer
innovationMARDI 27 JUIN 2017
L’intelligence artificielle exploite la richesse du son
Le traitement du son par des algorithmes est en plein essor.
Par Robert Gloy

Le principe du machine learning s’applique désormais à la sphère de l’acoustique. Il s’agit d’alimenter un algorithme avec une grande quantité de données, à partir desquelles il sera capable de reconnaître un objet ou un système. Sur cette base, il va pouvoir apprendre et faire des prévisions de manière indépendante. «Ce principe est maintenant appliqué au domaine du son. Les géants informatiques comme Google ou Microsoft affichent un intérêt très marqué pour ce domaine depuis quelques années», explique Sebastian Tschiatschek, chercheur à l’Institute for Machine Learning à l’ETH de Zurich. Trois innovations s’avèrent particulièrement intéressantes:

Prédire la personnalité
Il suffit d’enregistrer une personne qui parle pendant quinze minutes pour déterminer si elle est optimiste ou qu’elle a confiance en elle. L’algorithme développé par la société allemande Precire se base sur plus de 5′000 échantillons de voix pour réaliser une prédiction sur le caractère d’une personne. Pour l’instant, une vingtaine d’entreprises utilisent Precire pour filtrer les bonnes candidatures lors de leur processus de recrutement. Par conséquent, le nombre d’échantillons de voix enregistrés augmente de façon constante, affirme le CEO Dirk Gratzel. Selon lui, son invention n’en est qu’à ses débuts: elle pourrait également être utilisée dans la publicité lorsqu’il s’agit de s’adresser au public cible dans un certain ton donné. Mais est-ce vraiment fiable? Une étude récente et plusieurs experts semblent le confirmer. L’outil de Precire est même capable de filtrer le changement du timbre de la voix lié au stress.

Une meilleure orientation pour les robots
Une innovation récente du MIT pourra aider les robots à mieux s’orienter dans leur environnement. Les chercheurs ont alimenté un algorithme avec 1′000 vidéos contenant 46′000 sons, pour la plupart des objets sur lesquels on a frappé avec un bâton. En lui présentant une vidéo sans son, l’algorithme était ensuite capable de trouver le son qui va avec. «Prédire les propriétés acoustiques d’un objet peut permettre à un robot de mieux comprendre les caractéristiques des choses qui l’entourent. Il pourra mieux adapter ses interactions avec son environnement», estime Sebastian Tschiatschek.

Imiter la voix d’une autre personne
Le GPS qui vous dirige, le smartphone qui vous lit vos messages et le frigo intelligent qui vous met au courant de l’état de vos aliments — le tout au son de votre voix de prédilection. Cela sera sans doute bientôt possible grâce à CandyVoice, une start-up française qui développe un tel algorithme en partenariat avec Microsoft. A condition d’avoir assez d’échantillons vocaux, il sera possible d’emprunter la voix de n’importe qui.

Pour Matthias Althoff, expert en informatique à la Technische Universität München, cette innovation a beaucoup de potentiel: «La technologie derrière n’est pas très compliquée. Et surtout, il y a une vraie demande: le facteur fun est très élevé.» Sebastian Tschiatschek évoque néanmoins un risque d’abus: grâce à cet outil, il sera par exemple possible de prendre l’identité de quelqu’un d’autre au téléphone. «Il faut espérer que les usages positifs prédomineront.» La start-up proposera également de reproduire sa propre voix: pour cela, il faudra lire à voix haute 160 petites phrases pour que l’algorithme ait assez de matériel pour vous imiter sur différents supports. Le service pourrait aussi aider des personnes qui perdent leur voix suite à un accident ou une opération (pour autant qu’elles créent un fichier vocal avant). D’autres applications proposant le même type de service existent déjà: Voxal Voice Changer et MorphVOX.
_______

Une version de cet article est parue dans le magazine Technologist (no 12).

Pour souscrire un abonnement à Technologist au prix de CHF 45.- (42 euros) pour 8 numéros, rendez-vous sur technologist.eu.



Commentaires via Facebook



  

© 1999 - 2017 Largeur.com, toute reproduction interdite