Pointeur (programmation)

En programmation informatique, un pointeur est un objet qui contient l'adresse mémoire d'une donnée ou d'une fonction. C'est l'outil fondamental de l'adressage dit « indirect ».

Utilité

Le pointeur a pointe sur la variable b. On peut noter que b contient un nombre (en hexadécimal 00000011 = en décimal 17), et que a contient l'adresse de b en mémoire (en hexadécimal 1008). Dans ce cas précis, l'adresse et la donnée sont contenues dans 32 bits.

La notion de pointeur reflète l'utilisation différente que l'on peut faire d'un entier naturel, à savoir indiquer une adresse mémoire. Cette utilisation est très différente d'une utilisation arithmétique, d'où la création de registres de processeurs spécifiques (les registres d'adresse) et d'un type de donnée spécifique dans les langages de programmations.

Les pointeurs « typés », le type le plus répandu de pointeur actuellement, sont apparus avec le langage Algol 68, sous le vocable de "référence". Le langage C y a ajouté l'arithmétique des pointeurs : quand on incrémente un tel pointeur, il n'est en fait pas forcément incrémenté de un, mais de la taille du type pointé.

L'utilisation des pointeurs permet d'avoir accès à la couche basse de l'ordinateur, à savoir la mémoire. On peut se déplacer de case mémoire en case mémoire. Cette technique permet au programmeur d'effectuer des optimisations sur l'utilisation de la mémoire ou la performance.

Les pointeurs sont entre autres utilisés pour stocker les adresses des zones mémoires allouées dynamiquement par l'application. Si on alloue un bloc de taille T et qu'on reçoit l'adresse A en retour, cela veut dire que le bloc occupe la mémoire à partir de l'adresse A jusqu'à l'adresse A+T-1.

Dans les langages de plus haut niveau, l'utilisation des pointeurs est supprimée, au profit des références et des tableaux dynamiques gérés par le compilateur. Les références remplissent certaines fonctions des pointeurs en supprimant l'accès à la mémoire. Cela évite beaucoup de problèmes, en contrepartie certaines utilisations et optimisations ne sont plus possibles, tandis que d'autres le deviennent.

Complexification

L'utilisation des pointeurs est très puissante dans certains langages. Cette puissance (et surtout le fait que l'on touche directement à la mémoire sans aucun contrôle) complexifie le développement d'une application.

Si l'on ne fait pas attention et que le programme accède à une zone mémoire qui ne lui est pas allouée, le processeur via le système d'exploitation engendrera une erreur de segmentation qui provoquera une exception voire plantera l'application. De plus, comme les allocations mémoire sont réalisées en partie par le développeur, il doit également se charger de la libération de la mémoire lorsqu'il n'en a plus besoin, au risque de voir une fuite de mémoire apparaître.

Tous ces inconvénients obligent le développeur à prendre en charge des tâches supplémentaires, compliquant ainsi l'application et pouvant ajouter des bugs.

Pour toutes ces raisons, les pointeurs sont regardés avec une certaine méfiance. 01 Informatique les a qualifiés d'« aussi puissants qu'ils sont dangereux »^[1], en expliquant les atouts du langage D. En effet, au vu des avantages et inconvénients des pointeurs, ce langage a été conçu pour en autoriser l'usage aux programmeurs appréciant leur efficacité, tout en fournissant constamment des solutions alternatives à ceux qui s'en méfient.

Arithmétique des pointeurs

On appelle arithmétique des pointeurs la possibilité de faire des opérations arithmétiques (incrémentation, décrémentation, addition et soustraction) sur les pointeurs. Cela revient à effectuer un déplacement en mémoire.

La particularité de cette utilisation des pointeurs est que l'on se déplace par saut de la taille mémoire du type de donnée pointé par le pointeur et non par byte (la plus petite unité de mémoire adressable).

Langages sans pointeurs

Certains langages ne permettent pas l'utilisation explicite de pointeurs. La majorité des langages de programmation utilisent (ou au moins permettent) le passage de paramètres par valeur. Typiquement, si n est un entier, alors l'appel de fonction f(n) ne pourra pas modifier n même si dans le code de la fonction, l'argument est incrémenté ; la raison est que la valeur de la variable n est d'abord copiée, si bien que la fonction f peut lire et écrire cette copie de la variable n, mais ne peut pas modifier la variable n originale.

Avec les pointeurs, il devient possible de passer en argument d'une fonction l'adresse d'une variable, et ainsi d'accéder en lecture et en écriture à la variable originale, et ce dans le code de la fonction.

Dans la plupart des langages de programmation sans pointeurs, par exemple Python, Java ou JavaScript/ActionScript, les variables ou objets sont toujours passés par valeur, mais l'accès aux champs de ces objets se fait par référence ou par adresse. Typiquement, si o est un objet, alors f(o) ne pourra modifier o, mais pourra modifier (s'ils existent) les champs de o, par exemple s'il existe le champ o.taille de l'objet o original pourra être incrémenté dans le code de la fonction. Ainsi, en passant par référence / adresse les champs des objets, c'est-à-dire en modélisant un objet comme étant une liste de références / pointeurs sur ses champs, il devient possible d'implémenter toutes les structures de données qui nécessitent des pointeurs tels que les arbres, les listes chaînées, etc. Pour ce qui est des tableaux, tout fonctionne comme si les tableaux étaient des objets possédant un opérateur [], l'écriture tab[i] donnant accès au champ i de l'objet tab. Dans une fonction prenant en argument un tableau, il est donc (uniquement) possible de modifier les éléments du tableau.

Mais certains langages fonctionnent différemment. En PHP, les variables ou objets peuvent être au choix passés par valeur/copie ou par référence/adresse, en utilisant au choix la syntaxe f(&$n) au lieu de f($n).

Langages utilisant les pointeurs

Les pointeurs sont, entre autres, utilisés par les langages suivants (liste non exhaustive) : C, C++, Pascal, Ada, FreeBasic, Fortran, C#, D, Modula-2, Oberon, Go et, bien sûr, tous les assembleurs.

Assembleur

Exemple : le pointeur p à l'adresse C10A pointe vers l'adresse a qui contient la valeur 55.

Un assembleur (langage d'assemblage) ne connaît en fait que deux notions pour stocker des données : les registres, et les adresses mémoire. Un pointeur est une adresse mémoire qui contient une autre adresse mémoire. Ce qui fait que pour accéder à une donnée pointée par un pointeur (en lecture ou écriture), il faut deux accès mémoire : le premier pour lire l'adresse elle-même, le second pour l'accès à la donnée qui y est stockée.

Un assembleur dispose presque toujours d'une instruction permettant d'indiquer l'accès à une donnée via un pointeur : en général, le pointeur est entre parenthèses, ce qui indique de traiter la donnée à l'adresse indiquée par le pointeur, au lieu de l'adresse elle-même. Le double accès-mémoire est alors implicite. Un tel langage est tellement proche de la machine qu'il est quasiment impossible de se passer de la notion de pointeur, en particulier pour stocker des données de taille variable.

C et C++

Les deux principaux langages utilisant énormément les pointeurs sont le C et le C++ (même si, dans ce dernier, ils tendent à être remplacés par des alternatives plus « sécuritaires »).

Dans ces langages, l'étoile « * » est un opérateur préfixe qui dénote le déréférencement d'un pointeur, c'est-à-dire l'accès à la donnée dont l'adresse est dans le pointeur. Suivant la logique des déclarations en C, la déclaration d'une variable se conforme à son usage. Exemple en C :

struct Point { 
   float x, y;
};
struct Point *p;    //  lire :  *p   est un "struct Point"

Ce pointeur peut ensuite être affecté, à partir de l'adresse d'une donnée existante en utilisant l'opérateur esperluette "&" (address-of), ou l'allocation dynamique, ou encore l' "arithmétique des pointeurs"

struct Point unPoint, 
             autrePoint,
             * q;
...
p = & unPoint;                        // adresse d'une donnée existante
q = malloc(sizeof(struct Point));    // allocation dynamique

Il peut ếtre déréférencé

*q = unPoint;                        // copie
autrePoint = *p;

et l'opérateur -> est une abréviation commode (sucre syntaxique) pour accéder à ses membres

q -> x  =   12.3;    // équivaut à   (*q).x = 12.3;
q -> y  =   -5.6;

COBOL

Les diverses implémentations du langage comportent la notion de pointeur en COBOL. Bien que rarement employé, il n'en demeure pas moins un outil d'interface avec des programmes écrits en C ou en assembleur.

Un pointeur constitue en COBOL une variable déclarée en DATA DIVISION :

     05  POINTEUR-1       USAGE IS POINTER.
     05  POINTEUR-NUL     USAGE IS POINTER VALUE NULL.

Il est ensuite utilisé en PROCEDURE DIVISION.

Le pointeur stocke l'adresse mémoire d'une donnée ou d'une structure de données. Le mot réservé SET permet de l'initialiser. Il est possible de procéder à des comparaisons.

 DATA DIVISION.
     05  POINTEUR-1            USAGE IS POINTER.
     05  POINTEUR-DEBRANCH1    USAGE IS POINTER.
*
 PROCEDURE DIVISION.
*
     ADD COEFF-1 TO MONTANT GIVING TOTAL.
     SET ADDRESS OF TOTAL  TO POINTEUR-1.
     PERFORM UNTIL POINTEUR-1 = POINTEUR-DEBRANCH1
        ADD 1 TO NBRLUS
     END-PERFORM.
*

Il est également possible de passer en paramètre le pointeur vers un autre programme.

     CALL "CALCUL-TVA" USING POINTEUR-1.

Pascal

La syntaxe en Pascal est très similaire à celle en C et C++, à l'exception notable que les symboles diffèrent et leur position sont inversées par rapport au C et C++. Les pointeurs typés sont déclarés avec un chapeau « ^ » préfixé au type pointé. L'adresse d'une variable est récupérée avec une arobase « @ » préfixée à la variable. Le chapeau sert également à déréférencer un pointeur, mais alors il est postfixé à la variable.

var n: integer;    { Déclaration de la variable n de type entier. }
    p: ^integer;   { Déclaration de la variable p de type pointeur d'entier. }
 
begin
    n := 2;        { Initialisation de la variable n à la valeur 2. }
    p := @n;       { Initialisation de la variable p à la valeur « adresse de la variable n ». }
    p^ := 5;       { Déréférencement de la variable p pour affecter la valeur 5 à la variable n. }
end;

Certains types de pointeurs peuvent être prédéfinis dans certaines implémentations du Pascal, comme Delphi :

type
    pchar = ^char;
    pinteger = ^integer;

C

char t[] = {'t', 'a', 'b', '\0'};
char* p = &t[0];

Ici le pointeur p, contient l'adresse du premier élément du tableau de caractères t (ce qui est équivalent à char* p = t;). Si l'on déréférence p, nous aurions donc le caractère « t ».

p = p + 1;

En faisant cela, p ne pointe plus sur le caractère « t », mais sur « a ». Dans cet exemple, le déplacement en mémoire est d'un byte (car le type char vaut toujours un byte). Mais si le tableau avait contenu des données de type long, le déplacement aurait été de plusieurs bytes. Le déplacement se fait ainsi par saut de la taille mémoire du type de donnée pointé par le pointeur.

Pascal

Encore une fois, la syntaxe en Pascal est très proche.

const
    t: array[0..3] of char = ('T', 'A', 'B', #0);
var
    p: ^char;
 
begin
    p := @t[0];  { La variable p pointe sur le caractère 'T' de la variable t. }
    inc(p);      { La variable p pointe sur le caractère 'A' de la variable t. }
end.

Une différence importante pourtant reste, c'est qu'on ne peut qu'incrémenter et décrémenter un pointeur typé. Pour faire une addition proprement dite, il faut convertir en entier d'abord :

begin
    p := @t[0];                { La variable p pointe sur le caractère 'T' de la variable t. }
    p := ptr(integer(p) + 2);  { La variable p pointe sur le caractère 'B' de la variable t. }
end.

Dans ce cas-là, il faut prendre soi-même en charge la multiplication éventuelle par la taille du type des données pointées.

Pointeur sur une fonction

Les pointeurs peuvent également contenir l'adresse d'une fonction. Cette dernière peut ainsi être passée en paramètre à une autre fonction et être appelée.

C

Voici un exemple en C de la déclaration d'un pointeur de fonction f qui pointe successivement vers les fonctions f1() et f2() :

#include<stdio.h>
void f1() {
    printf("Affichage de f1.\n");
}
void f2() {
    printf("Affichage de f2.\n");
}
int main() {
    void (*f) ();
    f = f1;
    f();
    f = f2;
    f();
    return 0;
}

Ce code va produire la sortie suivante :

Affichage de f1.

Affichage de f2.

Pascal

procedure f1;
begin
    writeln('Affichage de f1.\n');
end;
 
procedure f2;
begin
    writeln('Affichage de f2.\n');
end;
 
var
    f : procedure;
 
begin
    @f := @f1;
    f;
    @f := @f2;
    f;
end.

Voir aussi

Liens externes

Vidéo en Stop Motion sur les pointeurs

Références

↑ Philippe Davy, « Le langage D rénove la programmation systèmes », 01 Informatique, 19 janvier 2007 (consulté le 21 mars 2010).

Utilité

Complexification

Arithmétique des pointeurs

Langages sans pointeurs

Langages utilisant les pointeurs

Assembleur

C et C++

COBOL

Pascal

C

Pascal

Pointeur sur une fonction

C

Pascal

Voir aussi

Articles connexes

Liens externes

Références