Je suis
FR FR
Citoyen / Grand public
Chercheur
Étudiant / Futur étudiant
Entreprise
Partenaire public
Journaliste
Enseignant / Elève

Détection et classification des signaux sismo-volcaniques de la Soufrière de Guadeloupe par apprentissage supervisé

Début : 01 octobre 2018

Fin : 14 avril 2022

Équipes liées :
Sismologie

Statut : Soutenue

L’activité sismique du volcan de la Soufrière de Guadeloupe se compose de différents signaux transitoires qui sont classés manuellement par l’Observatoire Volcanologique et Sismologique de Guadeloupe (OVSG-IPGP) en visualisant les formes d’ondes enregistrées sur plusieurs stations. Trois principales classes d’événements facilement identifiables sur les traces sont considérés durant le protocole journalier de classification : les événements Volcano-Tectonique, les événements Longue-Période et les événements Emboîtés, chacune reliées à des processus physiques distincts.
La détection et la classification automatique des signaux sismo-volcaniques de la Soufrière ont été réalisées en utilisant une méthode basée sur l’apprentissage supervisé, disponible sur github.com/malfante/AAA. Les formes d’ondes sismiques sont transformées en un jeu de descripteurs (34 pour chaque domaine de représentation) calculés à partir de trois domaines de représentation des signaux (temps, fréquence, quéfrence). Le vecteur descripteur obtenu est alors utilisé pour construire le modèle. Nous utilisons le Random Forest Classifier disponible dans la bibliothèque scikit-learn.
Dans un premier temps, nous avons entraîné le modèle avec un jeu de données construit par l’OVSG se composant de 845 événements labélisés disponibles (542 VT, 217 Emboîtés et 86 LP) enregistrés sur la période 2013-2018. Nous avons obtenu un taux de classification moyen de 72%. Nous avons déterminé que la classe VT comprenait une variété de signaux recouvrant les classes VT, LP et Emboîtés. Après avoir manuellement revu en détails les formes d’ondes et les caractéristiques spectrales de ces signaux, nous avons introduit les classes d’événements Hybride et Longue-Période Monochromatique (également appelée Tornillo) correspondant à la description des signaux présenté par Moretti et al. (2020).
Ensuite, en utilisant ces nouvelles informations, un nouveau modèle a été construit avec 5 classes et testé. Nous avons obtenu un bien meilleur taux de classification de 84%. La classification est excellente pour les événements Emboîtés (93% de recall et precision) et Tornillos (93% de recall et precision). La classification des VT (90% recall, 89% precision) et des LP (86% recall, 82% precision) sont également très bonnes. La classe la plus difficile à reconnaître est la classe Hybride (64% recall, 69% precision). Les séismes Hybrides sont souvent confondu avec les signaux LP et VT. Cela peut être expliqué par la nature même de cette classe et le processus physique qui inclut à la fois de la fracturation mais également une composante de résonance avec différents mode de fréquence.
De plus, en utilisant un modèle d’apprentissage supervisé pour distinguer les événements du bruit de fond, nous avons été capable de détecter trois fois plus d’événements que l’observatoire avec une mèthode de STA/LTA.
Le machine learning est un outil très puissant pour traiter de grands jeux de données . Nous avons été capable d’améliorer la catalogue, corriger quelques erreurs de classification et détecter plus d’événements.

A lire aussi
Thèses de l'équipe Sismologie
Thèses de l'équipe Sismologie
Aucune thèse pour le moment.
Sismologie
Sismologie
Présentation générale  Avant propos Les ondes sismiques offrent une fenêtre d’observation privilégiée de notre planète. La sismologie est une science ...