1. Page d'accueil
  2. Les mathématiques et théories abordées
  3. Par discipline
  4. Probabilités et Statistiques

"Profil Géographique" (Geographic Profiling)


Dans l'épisode 1 de la première saison, Charlie propose à son frère de retrouver le domicile de l'assassin à partir du lieu des meurtres. L'idée est que les lieux des meurtres répondent à un certain nombre de contraintes provoquées par le comportement inconscient du tueur. Parmi celles-ci, on peut citer :

On peut noter que cet épisode se base sur un cas ayant réellement eu lieu [1] et que la formule qu'on peut lire sur le tableau noir, ainsi que sur l'écran du portable de Charlie, est celle qui a été utilisée pour résoudre le cas réel. [2]

Dans ce qui suit, je vais vous montrer comment on peut construire un tel système. Nous n'aboutirons cependant pas à la formule réelle. Celle-ci est plus complexe et est très bien expliquée dans le livre "The numbers behind Numb3rs" .

Vous pourrez tester vous-même le programme de calcul des lieux de plus forte probabilité avec le programme ci-dessous.

En statistique, on utilise souvent une courbe particulière : la courbe de Gauss. Par exemple, prenons un marchand de chaussures qui regarderait ses ventes de l'année en fonction de la pointure des chaussures vendues. S'il fait une courbe pour les hommes et une courbes pour les femmes, il obtiendrait deux courbes gaussiennes centrées sur les pointures les plus demandées. C'est la raison pour laquelle les hommes trouvent beaucoup de 41-44 et peu de 47-48 ou de 37-38 dans les rayons : le marchand va adapter son stock à la répartition des pointures dans la population de son quartier, qui en général n'est pas loin de la répartition nationale.

Concernant notre tueur, on a supposé qu'il habitait à une certaine distance des meurtres. On va appeler cette distance moyenne B. Si on prend l'analogie du tuyau d'arrosage de Charlie, il est peu probable que l'au tombe directement à côté du tuyau et à l'inverse l'eau ne va pas aller trop loin : l'eau couvre une certaine bande de gazon autour du tuyau, avec une distance moyenne B entre l'eau et le tuyau. Si on prend une goutte d'eau, on sait donc que le tuyau se trouve également quelque part autour d'une distance B de cette goutte. On va donc définir une fonction gaussienne centrée sur B autour des meurtres ( = goutte d'eau). Avec un meurtre, cela donne ceci :

Figure 1

(jaune = plus de 98% ; orange = plus de 95% ; rouge = plus de 90% ; etc.)

On appelle P(x,y) la probabilité en un point (x,y) du dessin. Pour rappel (application du théorème de Pythagore ), la distance entre un lieu de meurtre de coordonnées (xn, yn) et un point quelconque de coordonnées (x,y) est :

Formule 1

On peut donc écrire pour un lieu de meurtre n :

Formule 2

Sigma permet de régler la pente ou l'épaisseur de la courbe en cloche (plus sigma est petit, plus on arrive vite vers 0).

Cependant, comme le fait remarquer Don à la 11ème minute, un tueur peut couvrir une région large, mais tue rarement près de chez lui : il y a une zone tampon. Nous l'avions appelée B. Corrigeons donc la formule en conséquence :

Formule 3

Les différents meurtres étant considérés comme indépendants (bien que fait par le même tueur, un meurtre n'a pas été provoqué par l'un des autres), la probabilité de trouver le domicile du tueur à un point (x,y) peut être calculé en faisant la moyenne des probabilités induites par chaque meurtre :

Formule 4

(Avec c le nombre de meurtres)

On aboutit donc à la formule finale :

Formule 5

Sur le programme fourni, cliquez sur la surface pour ajouter une série de points : ce seront les lieux des meurtres.

Figure 2

Vous verrez que la zone de probabilité se recalcule à chaque point ajouté. Attention cependant à laisser la zone s'afficher avant de recliquer : cela peut prendre quelques secondes lorsqu'il y a beaucoup de points.

Dans l'exemple ci-dessus, la zone indiquée montre que notre formule n'est pas mauvaise : en partant de meurtres se trouvant à peu près sur un cercle, la zone de plus forte probabilité se trouve au centre du cercle. Si on reprend l'analogie de Charlie sur les gouttelettes d'eau et l'arrosage automatique, nous avons retrouvé l'arrosage !

Maintenant, amusez-vous à répartir les meurtres différemment, et constatez l'effet sur les zones de probabilité.

Faites également varier sigma et B pour constater leur effet. Dans la formule utilisée dans la série, il y a 4 variables (f, g, phi et B). Il a fallut jouer avec ces variables pour trouver des valeurs qui correspondent aux meurtres, de la même manière que vous testez les valeurs de sigma et B.

Bien sûr, notre modèle mathématique est simpliste. Cependant, le principe est là et il suffit d'améliorer la fonction P pour tenir compte d'autres paramètres et ainsi obtenir éventuellement de meilleures zones.

Programme d'application

Note : Pour s'afficher, l'interface a besoin que le logiciel Java soit installé sur votre ordinateur.

Un clic dans la zone blanche ajoutera un point pour le calcul. Pour modifier les valeurs de sigma et B, entrer celles de votre choix dans les champs respectifs et valider.
La commande RAZ réinitialisera le traçage en supprimant tous les points.

Attention, couleurs vives. ;)



Article et Programme par BubuLeMag. >> Réagir


[1] http://www.maa.org/devlin/devlin_02_05.html (En anglais)
[2] Cette formule a été écrite par Kim Rossmo. Captures : 101_072.jpg et 101_092.jpg


Rédigé initialement par BubuLeMag.
Dans Probabilités et Statistiques et Par nom
Dernière modification de la page le 03/08/2008 à 23h48.