Des chercheurs de WVU créent un modèle qui détecte le trafic de drogue sur les réseaux sociaux

MORGANTOWN, W.Va (WDTV) – Des chercheurs de l’Université de Virginie-Occidentale ont découvert que les plateformes de réseaux sociaux peuvent servir d’outil de marketing direct aux consommateurs pour que les trafiquants de drogue vendent des drogues illicites.

Le professeur Xin Li, du département d’informatique et de génie électrique de Lane, et Chuanbo Hu, chercheur postdoctoral, ont déclaré que la détection du trafic de drogue en ligne est devenue essentielle pour lutter contre le trafic de drogue sur les cyberplateformes.

“Le commerce illicite de la drogue a co-évolué avec la technologie au cours des dernières décennies”, a déclaré Li. “Les médias sociaux sont devenus un outil exploité non seulement par les gens ordinaires, mais aussi par les trafiquants de drogue.”

Un service populaire que les trafiquants de drogue ont exploité est Instagram, qui, selon Li, a remplacé Twitter comme principale plate-forme de trafic de drogue vers 2019.

Par rapport à d’autres plateformes de médias sociaux, y compris Tik-Tok, les algorithmes associés à Instagram permettent d’adresser directement un contenu plus personnalisé aux personnes exprimant leur intérêt pour certains messages et hashtags.

Quiconque suit le compte d’un revendeur ou aime la publication d’un revendeur demandera à l’algorithme Instagram de remplir le flux de la personne avec davantage de ces publications pour les médicaments.

Pour lutter contre cela, Li, Hu et leur équipe ont mené la première étude systématique sur la détection fine des événements de trafic de drogue illicite sur Instagram.

Ils ont proposé une approche d’apprentissage multimodal multilabel profond pour détecter les IDTE et démontrer son efficacité sur un ensemble de données nouvellement construit appelé IDTE multimodal.

Ce modèle utilise des données texte et image comme entrée et combine des informations multimodales pour prédire plusieurs étiquettes de drogues illicites.

“L’IDTE multimodal est le modèle d’IA conçu pour détecter automatiquement le trafic de drogue illicite sur Instagram”, a déclaré Hu. “Par rapport aux travaux précédents, cette méthode considère pleinement les indices de trafic de drogue fournis par les images et le texte et réalise la classification fine des événements de trafic de drogue.”

Selon Li et Hu, les trafiquants de drogue utilisent généralement des hashtags sur Instagram pour étendre leur portée et engager leur public, qui peuvent être attachés aux publications. Les dealers associent presque toujours de nombreux hashtags liés à la drogue pour améliorer la visibilité de leurs publications.

La détection précise des IDTE à partir des médias sociaux est devenue de plus en plus difficile en raison de l’incohérence de la législation sur les drogues, de l’immensité des médias sociaux et de l’ambiguïté quant aux médicaments qui sont affichés et pour quelle raison.

“Ils promeuvent le commerce illicite de drogues de deux manières : en publiant un message, comme une publicité pour une certaine drogue, et en répondant à un message existant”, a déclaré Li. “Ils utilisent l’argot, les noms de rue des drogues ou d’autres moyens comme la faute d’orthographe, pour éviter d’être pris.”

“Certains comptes de trafiquants de drogue ne publient jamais d’images, mais ne commentent que certains messages chauds pour améliorer la visibilité de leurs publicités”, a déclaré Hu.

Li a déclaré que détecter IDTE, c’est comme trouver une aiguille dans une botte de foin en raison de l’énorme taille des données des médias sociaux.

“Les trafiquants de drogue utilisent diverses astuces pour échapper à la détection”, a déclaré Li. « La frontière entre l’IDTE et les événements réguliers n’est pas toujours claire. Par exemple, la grand-mère de quelqu’un pourrait utiliser un certain opioïde comme médicament d’ordonnance pour la gestion de la douleur.

Contrairement aux travaux existants sur la détection des trafiquants de drogue ou la détection de la consommation de drogue à partir d’informations agrégées, Li et Hu se concentrent sur la détection des activités liées aux IDTE suspects. Leur travail se concentre également sur une approche qui détecte non seulement les drogues illicites, mais également leurs types spécifiques chez chaque suspect IDTE.

Plus précisément, le modèle de Li et Hu prend en compte les données textuelles et images associées aux IDTE suspects et compose les informations multimodales pour prédire plusieurs étiquettes d’une drogue illicite.

“Nous avons affiné la classification des IDTE en neuf catégories, où la plupart d’entre elles contiennent des drogues illégales largement utilisées”, a déclaré Hu. “En prenant un message avec une image et une légende ou un commentaire comme entrée, le modèle proposé peut apprendre les caractéristiques de la drogue sur la base d’une analyse multimodale pour déterminer s’il est lié à une drogue illicite et à quelle catégorie il appartient.”

Les chercheurs ont construit manuellement un ensemble de données IDTE multimodal à grande échelle (MM-IDTE) dans le but de détecter les drogues illicites. L’ensemble de données MM-IDTE, contenant près de 4 000 messages et plus de 6 000 commentaires, représente le plus grand ensemble de données de détection de drogues illicites multimodal (texte et image) à ce jour.

Pour construire un tel ensemble de données à grande échelle, les chercheurs ont conçu un système d’exploration automatique des données pour Instagram qui utilise conjointement les informations de hashtag et d’image pour guider la collecte de données.

“La collecte manuelle des données Instagram est une tâche impossible”, a déclaré Li. “Mon équipe a développé un système d’exploration de données pour télécharger automatiquement toutes les données (textes et images publiés) d’Instagram. Il collecte des matières premières pour soutenir nos recherches sur l’exploration de données.

“Le système d’exploration automatique des données est conçu pour collecter de nombreux échantillons d’apprentissage, qui sont très utiles pour aider le modèle à apprendre automatiquement des représentations discriminantes pour la classification”, a déclaré Hu. « En d’autres termes, plus les données sont volumineuses et diversifiées, plus le modèle sera précis et robuste.

“Ce système d’exploration de données récupère automatiquement les messages des trafiquants de drogue en fonction des hashtags liés à la drogue collectés”, a déclaré Hu. “Pour améliorer l’efficacité de la récupération, le système filtre automatiquement certaines publications non pertinentes via le modèle d’IA.”

L’ensemble de données MM-IDTE nouvellement construit sera mis à la disposition du public pour soutenir la recherche liée aux activités de trafic de drogue illicite.

Li et Hu proposent un cadre d’apprentissage multimodal et multilabel (DMML) profond pour détecter les événements de trafic de drogue illicite, car il peut réaliser une classification fine des IDTE en tenant compte des différences de légalisation des drogues.

“La méthode proposée peut automatiquement apprendre des caractéristiques discriminantes à partir de données multi-modèles, et elle peut détecter différents modèles de trafic de drogue en fonction de l’unité de détection basée sur les commentaires proposée”, a déclaré Hu.

Li et Hu ont déclaré que leur méthode pouvait identifier avec succès certains cas difficiles pour des yeux non avertis, tels que des symboles spéciaux et des changements de style tentant d’échapper à la détection. Le système développé pourrait également faciliter la perturbation du commerce illicite de drogues par les forces de l’ordre.

Li et Hu pensent que leurs recherches peuvent aider à identifier différents types d’événements de trafic de drogue sur les plateformes de médias sociaux.

“Notre approche ne se limite pas à Instagram”, a déclaré Hu. « Il s’agit d’un outil général pour détecter les événements de trafic illicite de drogue en fusionnant des données multimodales, telles que des images et du texte. La raison de cette conception est de s’étendre de manière flexible à d’autres plates-formes. »

“D’autres extensions dans le trafic de ressources humaines, naturelles et de produits virtuels sont possibles”, a déclaré Li.

Copyright 2022 WDTV. Tous les droits sont réservés.

Leave a Comment