La transformation numérique entamée ces deux dernières décennies a permis de transférer tous les services classiques sur le web, du shopping jusqu’aux services bancaires. Si cela a permis d’offrir des services innovants, accessibles partout et à n’importe quel moment, cette transformation a également été accompagnée par l’augmentation de menaces de plus en plus sophistiquées dans le cyber espace.
Comme l’ont montré les nombreuses attaques enregistrées cette année contre le réseau interbancaire SWIFT, le secteur bancaire est une cible de premier choix pour les cybercriminels. Mais au lieu d’attaquer les banques directement, les malfaiteurs préfèrent la plupart du temps cibler les clients qui interagissent en ligne avec leurs banques, parce que les postes des utilisateurs sont moins protégés que les SI bancaires. Ils sont donc une cible plus facile.
Assurer la protection des clients est donc une priorité, qui passe par la mise en place de systèmes robustes fondés sur l’exploitation de grandes quantités de données, et c’est là que le Big data et le machine learning entrent en scène. Mais à quoi le Big data peut-il servir exactement ?
Définition du Big data
De manière simpliste, on peut dire que le Big data fait allusion aux ensembles très volumineux de données qu’on ne peut pas analyser ou traiter avec les outils classiques. Derrière le Big data, se trouvent des technologies de traitement telles que Hadoop et Spark.
Il faut noter que la diversité des sources de données disponibles (internes et externes), leur grande dimension et leur volumétrie rendent souvent inopérantes les méthodes statistiques traditionnelles. C'est pourquoi le Big data fait souvent appel au Machine learning ou apprentissage automatique. Point d'intersection entre les mathématiques appliquées et l’informatique, le Machine learning permet le traitement statistique de ces masses de données. Il vise à élaborer et étudier des algorithmes permettant à des machines d’apprendre automatiquement à partir des données et effectuer des tâches de façon performante.
Comment le Big data et le Machine learning peuvent-ils donc permettre de lutter contre la cybercriminalité ?
Pour détecter en temps réel les nombreuses menaces qui guettent leurs clients en ligne, les entreprises doivent analyser leur trafic, de grandes quantités d’informations générées par des dizaines - voire des centaines - de millions d’événements enregistrés sur leur site web chaque jour.
Seuls les outils Big data permettent aujourd’hui d’analyser ces volumes massifs de données en temps réel, pour détecter, entre autres, les tentatives de fraude, les comportements suspects, les anomalies du trafic, etc.
D’après Léa, experte en sécurité SI, chez Société Générale, le Big data -- avec le Machine Learning -- est au coeur de la lutte contre la cybercriminalité dans le domaine bancaire et, en particulier, dans la détection de la fraude dans la banque à distance.
Concrètement, les outils et techniques de Big data et Machine learning permettent aux équipes Sécurité SI des Réseaux de banque de détail en France de traiter 60 à 120 millions de nouveaux événements par jour, issus des actions des clients (clics, connexions, etc.). Ils permettent notamment d’explorer de nouvelles approches pour la détection dynamique des attaques de banque en ligne les plus complexes.
Léa explique également que l’utilisation des outils Big data permet une étude comportementale des clients, afin de détecter de nouveaux scénarios d'attaques. Les cybercriminels sont de plus en plus forts, car l’activité est largement rentable, dit-elle. « Nous avons donc construit sur une infrastructure Big data basée sur la technologie de traitement de données Hadoop et MapReduce, un certain nombre d'algorithmes d'intelligence artificielle, plus précisément de Machine learning, nous permettant de modéliser toutes les habitudes des clients, afin de "scorer" les opérations et détecter celles qui sont suspicieuses », a-t-elle ajouté. Les variables modélisées chez le client incluent, entre autres, les habitudes de navigation sur la page Web de banque à distance, les habitudes de connexion (informations de poste de connexion, IP, dispositifs utilisés, etc.) et les habitudes de transaction (virements, pays de destination, etc.). Léa souligne que cette approche permet d'anticiper les futurs scénarios de fraude en temps réel.
En plus de l’étude comportementale des clients, « les outils Big data permettent aussi d’analyser les risques bancaires liés aux différents scénarios d'attaques de la banque en ligne, notamment grâce au profilage des clients pour une meilleure estimation de l'impact de l'attaque ou encore au calcul de complexité des chemins d'attaques pour une meilleure estimation de la vraisemblance d'attaque », dit-elle. « Le Machine learning permet en plus d’automatiser et gérer les réponses face aux scénarios d'attaques de la banque en ligne. »
En dépit des craintes exprimées par certains sur la collecte de données massives, les outils Big data permettent donc une révolution positive qui s’impose de plus en plus dans la stratégie de cybersécurité des entreprises. Comme Léa l’a expliqué, dans le domaine bancaire, il trouve sa place au coeur de la lutte contre la cybercriminalité et la fraude de banque à distance : une des raisons pour lesquelles ce domaine d'activités a une demande croissante de profils Big data au sein des équipes IT.
Découvrez les offres d'emploi IT de Société Générale
Le Big data et le Machine learning sont au cœur de la lutte contre la cybercriminalité,
Estime Léa, experte en sécurité SI chez Société Générale
Le Big data et le Machine learning sont au cœur de la lutte contre la cybercriminalité,
Estime Léa, experte en sécurité SI chez Société Générale
Le , par Michael Guilloux
Une erreur dans cette actualité ? Signalez-nous-la !