La chroniqueuse du magazine Slaw, Sarah Sutherland
La chroniqueuse du magazine Slaw, Sarah Sutherland
C'est ce que demande la chroniqueuse du magazine Slaw, Sarah Sutherland, dans une récente analyse des limites inhérentes auxquelles la technologie se heurte.

L'utilisation de l'intelligence artificielle—où des algorithmes sophistiqués tentent de résoudre des problèmes complexes avec des données incomplètes—à certains domaines du droit est limitée par l'absence de grands échantillons de données. Et par la complexité inhérente du droit.

Ainsi, un juge rendra au plus quelques centaines de décisions dans sa carrière, dans différents domaines. « Ce ne sont pas suffisamment de données pour arriver à des prévisions statistiques de ses prochaines décisions », comme on s'y attend pourtant.

Il y a plus : lorsqu'il est question de litige, les moyens sont bien plus importants que la fin. Un procès qui se termine par une entente hors cours est difficilement analysable en termes statistiques, croit Sarah Sutherland, qui est gestionnaire de contenus pour l'Institut canadien d'information juridique (Canlii) à Vancouver.

Ce sont là des situations complexes, estime-t-elle, dont une partie seulement se retrouve dans les documents publics qui peuvent être analysées et converties en statistiques utiles et pertinentes.

Conjugué au fait qu'une part substantielle des décisions judiciaires est publiée et accessible pour l'analyse, on a vite fait de se heurter à un mur.

Cela expliquerait en partie pourquoi les start-ups technologiques spécialisées dans la statistique prévisionnelle tendent à diversifier leur offre : celle-ci est trop difficile à rentabiliser, car très difficile à produire.

Citant des experts en IA, Sarah Sutherland relate que la technologie « a atteint les limites de ce qui peut être fait en termes d’analyse de contenu, parce que les algorithmes n'ont tout simplement pas la connaissance du contexte des textes qu'ils analysent ». Un algorithme ne sait pas ce qu'est une pomme, il sait seulement qu'elle est associée avec une tarte ou un arbre.

Alors que le jargon juridique est obscur, et plein de nuances difficiles à intégrer aux algorithmes.

Des ratés aussi pour l’analytique juridique

Cela dit, le petit cousin de l'intelligence artificielle, l'analytique, reste intéressant. Mais ce domaine aussi connaît des contraintes.

Par exemple, lorsqu’il s’agit de déterminer la probabilité d'un quantum de dommages. Mais voilà, « les données disponibles ne permettent pas de la faire. D'une part parce que l'immense majorité des montants accordés n'est pas rendue publique », poursuit Sarah Sutherland.

Sans compter que l'analytique s'établit à partir de postulats, notamment que les données sont normalement distribuées. Sauf que les décisions judiciaires ne suivent pas la courbe statistique normale. Il y a trop d'extrêmes, et pas assez de données disponibles. On n'a ainsi pas accès à des échantillons aléatoires, qui permettraient d'avoir un portrait plus juste, statistiquement, d'une situation précise. On n'a qu'à penser à l'imprécision de plus en plus avérée des sondages pour avoir une idée des ratés potentiels de l'analytique juridique.

« Mais que tout cela soit difficile ne veut pas dire qu'il ne faut pas essayer de résoudre ces problèmes », conclut Sarah Sutherland.