Détection de fraude


Aujourd’hui, les paiements électroniques par carte bancaire se sont généralisés sur la planète grâce à l’internet. Ces paiements représentent un volume toujours en augmentation de plus de 500 milliards de dollars annuels, et les fraudes constituent moins de 0,5% du nombre de ces transactions. Au niveau mondial, cela représente environ 25 milliards de dollars de pertes estimées par an et cette perte est en augmentation.

Indépendamment du montant de cette fraude, il faut bien entendu mettre en oeuvre toutes les mesures de détection possibles pour en limiter l’extension. C’est pourquoi de nombreux travaux de recherche ont vu le jour depuis les 20 dernières années sur cette problématique.

En tant qu’éditeur d’une plateforme transactionnelle à haute performance pour les systèmes de paiements, LUSIS est donc intéressée au premier chef par les contre-mesures à la fraude. Dans le cadre de la chaire LUSIS, nous souhaitons étudier la détection de fraude à la fois sous l’angle de la performance des algorithmes, mais également avec une contrainte de réalisme de mise en oeuvre et ce sur des données réelles.

D’un point de vue technique, les difficultés et verrous se situent à différents niveaux :

  • jeux de données très déséquilibrées, il y a moins de 0,5% de transactions frauduleuses,
  • nécessité d'éviter à tout prix les faux positifs,
  • apparition de nouvelles stratégies de fraude,
  • détection online plus difficile que offline,
  • évolution des habitudes de consommation des clients (concept drift),
  • besoin d’expliquer le refus d’une transaction/

Trading automatique


Les systèmes de trading automatisés cherchent à passer des ordres sur les marchés financiers de façon à faire fructifier un capital tout en limitant le risque inhérent. Les cours des produits financiers sont des séries temporelles qui varient au gré de nombreux paramètres qui ne sont pas tous observables. Au sein du machine learning les séries temporelles sont des données très particulières qui nécessitent l’usage de méthodes spécifiques

Une des caractéristiques des approches par apprentissage automatique réside dans l'évaluation qui est faite de la performance. Le plus souvent, l'évaluation réside dans la seule précision de l’orientation du marché (hausse ou baisse). Or, sur une série de prédictions, une grande précision peut aussi résulter dans une forte perte puisque l’amplitude n’est pas prise en compte. Un modèle à forte précision peut résulter dans un gain négatif.

Dans le cadre de la chaire, nous étudions :

  • les métriques d’exploitabilité réelle au-delà de la précision
  • l’utilisation du backtesting pour la construction de modèles plus performants
  • l’apprentissage par renforcement pour la construction de modèles robuustes