Musing in a world of technology: April 2010

Dans la première partie de ce billet, j’ai tenté de décrire les paradigmes d’interfaces homme / machine, présents ou à venir, sous l’angle de 2 propriétés mécaniques : la dimension de l’interface et le nombre de degrés de liberté associés aux interactions avec les objets de l’interface.

Voyons maintenant pourquoi nous intéresser à ces considérations mécaniques et quels enseignements ou inspirations nous pouvons tirer de tout cela.

Pourquoi s’intéresser à des considérations mécaniques ?

Finalement peu d’utilisateurs finaux en sont conscients, mais nombre de caractéristiques des interfaces GUI que nous utilisons couramment résultent de travaux portant sur des considérations physiologiques et mécaniques. S’il ne faut citer qu’un exemple, on pensera aux travaux de Paul Fitts dont résulte la loi du même nom.

Une deuxième raison pour s’intéresser à ces aspects est qu’un nouveau système n’est jamais construit ex-nihilo, mais s’appuie sur des concepts ou des métaphores provenant de systèmes existants. Si vous pensez qu’il convient de bâtir de nouvelles interfaces, vous devez au préalable vous demander quels sont les présupposés (conscients ou inconscients) qui ont servi à bâtir les interfaces existantes et pourquoi ils ne sont plus adaptés à certains cas d’utilisation.

Quelles inspirations tirer de tout ceci?
Une « pente naturelle »…

Le premier enseignement de cette courbe est que les interfaces homme / machine de nos systèmes suivent une « pente naturelle » qui tend à les rapprocher de notre expérience quotidienne (1 univers à 3 dimensions avec 6 degrés de libertés). On perçoit dans l’évolution de nos interfaces (existantes comme CLI, GUI/WIMP et NUI ou entrevues comme XUI) une aspiration à reproduire en l’enrichissant, notre expérience quotidienne. Je ne me lancerai pas dans des considérations philosophiques, mais il me parait peu probable que ce mouvement s’inverse ou s’arrête.

NUI ou la 2D enfin complétée

Le deuxième enseignement que l’on peut tirer de cette courbe est que le paradigme GUI/WIMP, tel que nous le connaissons, ne permet pas de profiter totalement d’une interface à 2 dimensions, puisqu’il lui manque un degré de liberté (la rotation suivant l’axe perpendiculaire) supporté par les interfaces NUI telles que nous les avons considérées.

Présenté aussi abruptement, la conséquence peut paraître faible, surtout si l’on se réfère à l’usage individuel d’un moniteur de bureau. Considérons cependant la possibilité apportée par certains dispositifs multitouch de supporter les interactions simultanées de plusieurs utilisateurs. (Note : C’est une des « bizarreries » de l’informatique collaborative, qu’elle aura d’abord permis de travailler ensemble mais séparément (à distance) avant de permettre de travailler vraiment ensemble, mais là n’est pas le sujet…)

Si nous considérons donc ces systèmes de tables collaboratives, nous voyons que le mouvement de rotation devient un « ingrédient » important, permettant aux utilisateurs de se positionner tout autour de la table, comme nous le faisons naturellement autour d’une table de réunion. Mais il se pose alors tout un ensemble de nouvelles questions : Comment orienter les contenus sur un tel dispositif alors que l’endroit d’un utilisateur est l’envers d’un autre? Sur un écran vertical, la question de l’orientation n’a pas vraiment de sens mais ici tout devient différent.

Certaines réponses commencent à être apportées. Par exemple, en terme de design les formes circulaires tiennent une place importante, ce qui est somme toute logique puisque le cercle ne favorise pas de direction particulière. On notera également l’utilisation de contenus en rotation lorsqu’ils ne s’adressent à aucun utilisateur en particulier (cas des menus d’invite). Il est évident que les problèmes à résoudre vont bien au-delà de ces 2 exemples très simples.

Soit dit en passant, je suis toujours amusé par les vidéos de tables multitouch dans lesquelles le démonstrateur réalise toutes ses manipulations à l’envers. Je comprends les contraintes de prise de vue obligeant à cet exercice mais il me semble que c’est une bien mauvaise manière de vanter l’aspect naturel de ces interfaces.

NUI et interfaces 3D

Même si le paradigme XUI me semble être le seul, parmi ceux considérés dans ce post, que l’on puisse considérer comme supportant réellement un univers 3D, il est inévitable que les moyens d’interaction des dispositifs NUI soient utilisés pour interagir avec des interfaces 3D, comme c’est déjà le cas pour le clavier ou la souris. Et d'ailleurs, les premiers systèmes multitouch de navigation 3D s’avèrent plutôt prometteurs.

Des interfaces à réinventer

Les systèmes que nous concevons s’appuient souvent (consciemment ou inconsciemment) sur des concepts ou des métaphores provenant d’éléments existants. Prendre conscience de ces principes permet d’en définir les limitations et d’envisager les améliorations que peut apporter un nouveau système.

Ainsi, je suis intimement convaincu (mais simple avis personnel) que bien qu’étant visuelles, graphiques et à 2 dimensions, nos interfaces GUI/WIMP sont profondément marquées par l’influence de ce que Marshall Mc Luhan appelait notre univers mécaniste et typographique et dont les principales caractéristiques sont la linéarité et la répétition. En soit, cela n’est pas étonnant si on se réfère à l’histoire de nos machines et de nos interfaces. L’idée n’est pas de rejeter en bloc cette conception mais d’essayer d’en voir les limites dans certains cas d’utilisation. Pour l’exemple, penchons nous plus en détail sur deux cas concrets.

Les moteurs de recherche

Si vous lancez une recherche Google.com sur le terme « multitouch » vous obtenez en résultat une liste séquentielle de plus de 6 millions de résultats.

Tentons le coup avec quelque chose d’un peu plus people comme « Obama » et nous obtenons une liste séquentielle de plus de 100 millions de résultats (200 millions il y a quelques mois).

Faisons une pause. Imaginez vous en pionnier de la ruée vers l’or. Votre activité consiste d’abord à prélever au meilleur endroit de la rivière un fragment des matériaux se trouvant au fond de l’eau (la saisie des critères et le lancement de la recherche). Ceci fait, tenteriez vous d’inspecter chaque grain un à un, pour voir s’il s’agit d’un gravier ou d’or (quand bien même une main invisible aurait aimablement rangé chaque fragment en fonction de la probabilité qu’il vous intéresse et ait d'ailleurs intéressé les autres chercheurs d’or précédemment passés par là) ? Il y a fort à parier que vous feriez comme tout le monde et utiliseriez plutôt un outil permettant de tamiser le tout en profitant des 3 dimensions spatiales et des 6 degrés de liberté.

Prospecteur d’or (Dessin de Tony Oliver – Wikipedia)

Certains d’entre vous objecteront que cet exemple est biaisé car si un grain d’or ne peut appartenir qu’à une seule personne, l’information peut être « consommée » sans préjudice par plusieurs personnes, et que finalement seuls les premiers résultats remontés par le moteur de recherche ont réellement l’importance puisque identifiés comme centraux et populaires par le moteur de recherche. Cela ne me semble pas tout à fait exact dans la mesure où ce qui fonde en partie la valeur d’une information est sa rareté. Une information pertinente apparaissant en 50ème page des résultats de recherche a plus de valeur qu’une information apparaissant en première page. Posséder cette information vous donne de fait un avantage.

A une époque où la recherche et l’accès à l’information pertinente est de plus en plus prépondérant (notamment dans la vie des entreprises), à une époque où cette information est souvent morcelée et noyée dans un volume de données important, l’approche linéaire et répétitive des interfaces de nos moteurs de recherche n’est plus vraiment adaptée.

La recherche d’information est une activité nomade (comme la cueillette ou la chasse l’étaient pour nos ancêtres) nécessitant des qualités de souplesse, d’agilité et de rapidité qui font défaut au monde mécaniste et typographique de nos interfaces GUI.

Cavalier Scythe (image de Wikipedia)

Il va de soi que changer l’interface de nos moteurs de recherche ne suffira pas à résoudre à lui seul toutes les limitations dont nous venons de parler, mais les moteurs de recherche auront beaucoup à gagner à utiliser un nouveau modèle d’IHM facilitant la manipulation des données [1].

La navigation sur le web

Prenons maintenant le cas de la navigation sur internet. On ne peut pas vraiment définir de méthode type de navigation mais assez usuellement on rencontrera :

des utilisateurs qui, à partir d’une page de départ, vont suivre un lien hypertexte en ouvrant la nouvelle page dans la même fenêtre (et le même onglet) puis utiliseront le bouton « Back » pour revenir à la page précédente, ou iront sur un niveau de profondeur supplémentaire en ouvrant une nouvelle page toujours dans la même fenêtre (et le même onglet). Ainsi de suite…
des utilisateurs qui, à partir d’une page de départ, vont suivre un lien hypertexte en ouvrant la nouvelle page dans un nouvel onglet du navigateur. Cette nouvelle page est consultée immédiatement ou lue plus tard lorsque la lecture de la première page est terminée. Et ainsi de suite sur différents niveaux de profondeur.

Dans le premier scénario de navigation, l’utilisateur se place dans un schéma d’interface à 0 dimension (la fenêtre et l’onglet de navigation unique). Dans le deuxième scénario, l’utilisateur se place dans un schéma d’interface à 1 dimension (la ligne formée par les différents onglets).

N’avez-vous jamais été étonné par le fait que la navigation sur internet soit une activité s’apparentant à la navigation dans un arbre et que l’interface proposée pour supporter cette activité soit au mieux linéaire ?

Nous avons là ce que j’appellerai un exemple d’interface conçue en fonction de présupposés découlant d’une métaphore (le classement des documents à l’aide de signets) non adaptée à l’activité réelle. Un exemple d’interface prenant en compte les caractéristiques de l’activité de navigation est l’addon Firefox TabViz développé par Jakob Hilden, Liz Blankenship and Kerry Kao (University of Michigan School of Information).

Poster de présentation de TabViz

L’imbrication croissante du matériel et du logiciel

Un dernier enseignement que nous pouvons tirer de cette courbe est que l’évolution des interfaces tend à prendre en compte de plus en plus de paramètres mécaniques (comme les degrés de liberté). Plus nos interfaces seront évoluées, plus elles devront s’adapter aux caractéristiques physiologiques et mécaniques de l’utilisateur.

De fait, il est probable que les aspects matériels et logiciels de nos dispositifs seront de plus en plus imbriqués, chaque dispositif matériel nécessitant une interface qui lui est adaptée. D’une certaine façon, cette notion est née avec le concept de multicanal et les téléphones portables offrant un accès internet.

Identiquement, dans une approche centrée sur l’utilisateur, nous devrions considérer que chaque cas d’usage doit trouver le dispositif matériel (téléphone, tablette, table, mur, …) et l’interface associée qui répondent le mieux au besoin présent.

(1) : Pour ceux qui ne connaitraient pas déjà cette application, je vous recommande de jeter un œil à Pivot des laboratoires Microsoft. Il s’agit d’un bon exemple d'application destinée à adresser cette problématique.

Musing in a world of technology

18 April 2010

Quelques considérations purement mécaniques (2)