MOOC:Compagnon Act12

From Livre IPv6


Activité 12  : La notation des adresses IPv6

Introduction

La notation des adresses IPv6 traite du problème de leur représentation textuelle. Il s'agit de définir des règles pour leur affichage, leur manipulation, leur saisie par un utilisateur humain. Le RFC 4291 a posé les principes de la notation d'une adresse IPv6. Le RFC 5952 est venu le compléter pour poser des règles. La notation est importante. Mal maitrisée, elle peut entrainer des problèmes d'interopérabilité comme le montre cet article[1].

Principes

IPv6 a abandonné la notation décimale pointée, en usage pour les adresses IPv4 (sur 32 bits, soit 4 octets, on indique la valeur décimale de chaque octet séparée par un point décimal. Exemple : l'adresse IPv4 192.168.0.1). Cette notation est en effet inadaptée pour des chaînes binaires de 16 octets. IPv6 a adopté la notation hexadécimale couramment utilisée dans le monde informatique pour représenter des octets par des couples de chiffres.


Les 16 octets (128 bits) de l'adresse IPv6 suivante se notent en binaire :

00100000 00000001 00001101 10111000 00000000 00000000 00000000 00000000 00000000 00001000 00001000 00000000 00100000 00001100 01000001 01111010

et s'écrivent en hexadécimal sous la forme suivante :

20 01 0d b8 00 00 00 00 00 08 08 00 20 0C 41 7A

couramment précédés par le préfixe 0x pour indiquer que la chaine qui suit est en notation hexadécimale :

0x20010db80000000000080800200C417A

La représentation "textuelle" des adresses IPv6 se fait en segmentant le mot de 128 bits en 8 champs de 16 bits (2 octets) séparés par le caractère ":". Chacun de ces champs est transcrit en 4 chiffres hexadécimaux. L'adresse précédente se note donc :

2001:0db8:0000:0000:0008:0800:200C:417A

Par convention, il n'est pas nécessaire d'écrire les zéros de poids fort placés en tête de champ (dans chaque mot de 16 bits, les zéros de poids fort ne sont pas significatifs). L'adresse peut donc prendre une notation plus compacte :

2001:db8:0:0:8:800:200C:417A

Plusieurs champs nuls consécutifs peuvent être "abrégés" par l'abréviation " :: " (2 caractères ':' successifs, sans espace). Attention : pour éviter toute ambiguïté, cette abréviation ne peut être utilisée qu'une seule fois par adresse !

Exemple l'adresse peut également s'écrire
Une adresse unicast 2001:0db8:0:0:0:800:200c:417a 2001:db8::800:200c:417a
Une adresse multicast ff01:0:0:0:0:0:0:101 ff01::101
Adresse de bouclage (loopback address) 0:0:0:0:0:0:0:1 ::1
Adresse non spécifiée (unspecified address) 0:0:0:0:0:0:0:0 ::

Notation canonique pour l'affichage

Les adresses IPv6 peuvent donc avoir plusieurs représentations valides possibles. Le RFC 5952 fournit les recommandations pour une forme de représentation canonique des adresses. Cette forme est destinée aux procédures d'affichage ; par les programmes, les appels systèmes inscrivant des événements dans les fichiers journaux (logs). Cette recommandation ne porte donc que sur les sorties d'adresses (affichage). En entrée (configuration d'équipement, passage de paramètres...), un logiciel devrait toujours accepter les différentes formes valides. La saisie reste donc libre.

Concrètement, selon ce RFC 5952, une adresse devrait être affichée selon la forme suivante :

  • Les zéros initiaux (non significatifs) doivent être supprimés.
  • L'indication d'une suite de champs nuls consécutifs « :: » doit être utilisée au maximum (sur la série nulle la plus longue). En cas d'égalité, on l'applique sur la première. Exemples :
    • 2001:db8:0:42:0:0:0:1 → 2001:db8:0:42::1
    • 2001:db8:0:0:42:0:0:1 → 2001:db8::42:0:0:1
  • Les chiffres hexadécimaux doivent être en minuscules.
  • Si le numéro de port (TCP ou UDP) doit être indiqué, l'usage de crochets encadrant l'adresse devient obligatoire. Auparavant, cet usage ne l'était que pour les URL. Plus de détails en fin de chapitre.

Notation des préfixes

La notation des préfixes définie par CIDR [RFC 1519] pour IPv4 est conservée pour IPv6. Le préfixe indique le nombre de bits de poids fort de l'adresse (la partie haute de l'adresse ; c'est-à-dire, dans le sens de lecture occidentale, les chiffres à gauche de l'adresse) communs à toutes les adresses appartenant à ce préfixe.

La notation du préfixe d'adresse se fait en séparant l'adresse du nombre de bits du préfixe par un caractère « / » (le caractère « diviseur » du pavé numérique de votre clavier).

Adresse-IPv6/longueur-en-bits-du-préfixe

Par exemple, le préfixe suivant:

2001:0db8:0024:a1a0:0000:0000:0000:0000/60

définit 60 bits (affichés ici en caractères gras) qui seront communs à toutes les adresses lui appartenant. Un préfixe peut donc être utilisé pour désigner une plage d'adresse :

Préfixe : 2001:0db8:0024:a1a0::/60
Première adresse : 2001:0db8:0024:a1a0:0000:0000:0000:0000
Dernière adresse : 2001:0db8:0024:a1af:ffff:ffff:ffff:ffff

Les préfixes permettent donc d'agréger en une notation plusieurs adresses possédant les mêmes bits de poids forts. Un préfixe permet aussi d'agréger plusieurs préfixes plus spécifiques, c'est à dire définissant un nombre plus large de bits communs à un ensemble d'adresses. Ainsi le préfixe /60 donné dans l'exemple précédent agrège 16 préfixes de largeur 64 bits (/64) :


2001:0db8:0024:a1a0::/60 2001:0db8:0024:a1a0::/64 Première adresse : 2001:0db8:0024:a1a0:0000:0000:0000:0000
Dernière adresse : 2001:0db8:0024:a1a0:ffff:ffff:ffff:ffff
2001:0db8:0024:a1a1::/64 Première adresse : 2001:0db8:0024:a1a1:0000:0000:0000:0000
Dernière adresse : 2001:0db8:0024:a1a1:ffff:ffff:ffff:ffff
2001:0db8:0024:a1a2::/64 Première adresse : 2001:0db8:0024:a1a2:0000:0000:0000:0000
Dernière adresse : 2001:0db8:0024:a1a2:ffff:ffff:ffff:ffff
... (14 préfixes de 2001:0db8:0024:a1a3::/64 à 2001:0db8:0024:a1ae::/64) ...
2001:0db8:0024:a1af::/64 Première adresse : 2001:0db8:0024:a1af:0000:0000:0000:0000
Dernière adresse : 2001:0db8:0024:a1af:ffff:ffff:ffff:ffff

Un préfixe peut être utilisé par exemple par la fonction de routage d'un équipement pour désigner la destination d'une route vers un ensemble de machines ou de réseaux (cf. notion de routage du MOOC "Principes des Réseaux de Données").

Cette notation peut être aussi reprise lors de la désignation d'une adresse pour spécifier le réseau auquel elle appartient. Ainsi dans l'exemple suivant,

Le noeud d'adresse 2001:db8:24:a1a1:8:800:200C:417a
appartenant au sous-réseau 2001:db8:24:a1a0::/60
peut se noter 2001:db8:24:a1a1:8:800:200C:417a/60

Cette notation est utilisée notamment lorsque l'on configure une interface réseau avec une adresse, permettant de définir en une notation son adresse ainsi que le réseau auquel elle est connectée (qui est représenté par le netmask en IPv4).

On notera une petite difficulté dans cette convention de notation pour les préfixes qui ne sont pas alignés sur une frontière de mots de 16 bits, d'octet ou de demi-octet,

L'adresse IPv6 2001:db8:7654:2003::cafe/51
appartient au réseau 2001:db8:7654:2000::/51
La plage d'adresses démarre en 2001:db8:7654:2000:0000:0000:0000:0000
et se termine avec 2001:db8:7654:3fff:ffff:ffff:ffff:ffff

Notation des URL

Une autre difficulté provient du fait que le caractère ":" est significatif dans certains contextes, ce qui peut créer des ambiguïtés. C'est le cas des URL où il est utilisé comme séparateur entre l'adresse et le numéro de port. Les adresses de niveau transport sont des numéros de port TCP ou UDP, cf. MOOC "Principes des Réseaux de Données".

Exemple : l'URL suivante est ambiguë : http://2001:db8:12::1:8000/ ; en effet, elle peut être interprétée de deux manières :

  • le service web à l'écoute sur le port http par défaut (le port TCP 80 est le port implicite d'écoute du protocole HTTP) sur la machine d'adresse 2001:db8:12::1:8000
  • les services web (protocole HTTP) à l'écoute sur le port TCP 8000 de la machine d'adresse 2001:db8:12::1

Pour lever cette ambiguïté, le RFC 3986 propose d'inclure l'adresse IPv6 entre "[ ]" (crochets ouvrant et fermant). Ainsi, dans le premier cas, l'URL sera notée http://[2001:db8:12::1:8000]/ et dans le second, http://[2001:db8:12::1]:8000/

Les adresses IPv6 unicast embarquant une adresse IPv4

Intégration de l'espace d'adressage IPv4 dans l'espace IPv6

Compte tenu de son étendue, l'espace d'adressage IPv6 peut facilement intégrer l'espace d'adressage IPv4. En conséquence une adresse IPv4 peut être imbriquée dans une adresse IPv6. Les mécanismes d'interopérabilité IPv6 et IPv4 développés dans la séquence 4 de cette présentation en font usage. Chacun de ces mécanismes d'interopérabilité a fait l'objet d'implémentations diversifiées entraînant des variantes d'imbrication de tout ou partie d'une adresse IPv4 dans une adresse IPv6. Ces variantes seront présentées en détail dans les activités de la séquence 4.

Notation d'une adresse IPv4 dans une adresse IPv6

L'adresse IPv4 est notée sous forme hexadécimale en deux mots de 16 bits séparés par le caractère ":". Ainsi l'adresse IPv4 192.168.10.5 sera notée c0a8:a05 dans l'adresse IPv6.

Exemples :

  • 2002:c0a8:a05:624:5054:1ff1fe12:3456
  • 2001:db8:900d:cafe::c0a8:a05

Lorsque l'adresse IPv4 occupe la partie basse de l'adresse IPv6, les 32 bits de poids faible (bits 96 à 127), la notation décimale pointée traditionnelle d'IPv4 est tolérée comme l'indique le RFC 4291. Autrement dit, la notation décimale n’est valide qu’à la fin de l’adresse IPv6. Ainsi l'adresse 2001:db8:900d:cafe::c0a8:a05 peut être notée 2001:db8:900d:cafe::192.168.10.5 lors d'une saisie (configuration manuelle d'interface ou passage de paramètre en ligne de commande, ...). Cependant elle sera affichée sous sa forme canonique (RFC 5952) 2001:db8:900d:cafe::c0a8:a05 dans le journal de bord (log système) de la machine. Dans ce cas si la saisie peut nous sembler familière, la correspondance entre l'adresse IPv6 et l'adresse IPv4 embarquée est moins évidente à l'affichage.

Conclusion

Nous venons d'introduire la notation des adresses IPv6. Sa maîtrise est importante, sinon cela peut entraîner des problèmes d'interopérabilité. Dans les activités suivantes, nous allons approfondir les règles de notations, leurs affectations, et le rôle des différents types d'adresses.

Références bibliographiques

  1. Huston, G. (2013) The ISP Column. March. Literally IPv6

Pour aller plus loin

RFC et leur analyse par S. Bortzmeyer :

Annexe : Vadémécum de notation hexadécimale

Cet aide mémoire, librement inspiré de l'article "Système hexadécimal" de Wikipedia, est destiné à l'accompagnement des auditeurs qui ne sont pas familiers avec cette notation concise des nombres binaires.

Le système hexadécimal est un système de numération en base 16. Il utilise ainsi 16 symboles, en général les chiffres arabes pour les dix premiers chiffres et les lettres "a" à "f" pour les six suivants (en majuscules ou en minuscules, sans importance en principe, mais il vaut mieux par cohérence adopter l'un ou l'autre pour la notation). Ce système est couramment utilisé en informatique et en électronique numérique pour représenter des codes binaires utilisés par les ordinateurs, car il est :

  • commode : conversion facile binaire <=> hexadécimal du fait que 16 (nombre de chiffres dans la base hexadécimale) est lui-même une puissance de 2 (nombre de chiffres de la base binaire) ;
  • facilement lisible par les opérateurs humains car compact (il réduit le nombre de signes d'un facteur 4 par rapport au binaire). L'unité d'information couramment utilisée en informatique, à savoir l'octet (8 bits), se note ainsi sous forme de 2 chiffres hexadécimaux.

La conversion de binaire en hexadécimal se fait en regroupant les chiffres binaires (les bits) par groupes de quatre, également appelés "quartets" (ou nibbles). Le mot binaire doit donc avoir une longueur multiple de quatre. Au besoin, on le complète par des zéros à gauche (0 de poids fort non significatifs). À chacune des 16 combinaisons binaires d'un quartet (2 puissance 4 = 16) correspond un chiffre hexadécimal.

binaire Hexadécimal décimal
0 0 0 0 0 0
0 0 0 1 1 1
0 0 1 0 2 2
0 0 1 1 3 3
0 1 0 0 4 4
0 1 0 1 5 5
0 1 1 0 6 6
0 1 1 1 7 7
1 0 0 0 8 8
1 0 0 1 9 9
1 0 1 0 a 10
1 0 1 1 b 11
1 1 0 0 c 12
1 1 0 1 d 13
1 1 1 0 e 14
1 1 1 1 f 15

Conversion

Ainsi, le nombre binaire 0010101011010101 composé de 4 quartets (nibbles) 0010 1010 1101 0101 se note 2ad5 en hexadécimal ( 0010 => 2, 1010 => a, 1101 => d, 0101 => 5).

Inversement, le nombre hexadécimal 7c8f20 se traduit par la chaîne binaire 0111 1100 1000 1111 0010 0000 (7 => 0111, c => 1100, 8 => 1000, f => 1111, 2 => 0010, 0 => 0000) et correspond au code binaire 011111001000111100100000.

Notation

Des notations sont utilisées, notamment dans les langages informatiques, pour différencier sans ambiguïté les chiffres hexadécimaux des autres :

  • notation préfixée : 0x123 (langage C et dérivés), &h123 (BASIC), $123 (en Pascal et dérivés comme le VHDL en électronique), mais aussi #123 (Common Lisp), 0h123 (Texas Instruments) ou X'123' (COBOL) ;
  • notation suffixée : 123h, 123(16) (arithmétique)

(Nota : pour l'anecdote, le chanteur et humoriste Boby Lapointe a inventé en 1968 un système de représentation hexadécimale, appelé système bibi-binaire à la fois drôle et cohérent, basé sur des symboles graphiques convenus en lieu et place des chiffres arabes et lettres (de 'a' à 'f').

Pour aller plus loin

Personal tools