Transmission Control Protocol

Informations
Sigle	TCP
Date de création	1973
Auteur(s) / Autrice(s)	Vint Cerf et Bob Kahn
RFC	RFC 9293^[1]

Transmission Control Protocol (littéralement, « protocole de contrôle de transmissions »), abrégé TCP, est un protocole de transport fiable, en mode connecté, documenté dans la RFC 9293^[2] de l’IETF.

Dans le modèle Internet, aussi appelé modèle TCP/IP, TCP est situé au-dessus de IP. Dans le modèle OSI, il correspond à la couche transport, intermédiaire de la couche réseau et de la couche session. Les applications transmettent des flux de données sur une connexion réseau. TCP découpe le flux d’octets en segments dont la taille dépend de la MTU du réseau sous-jacent (couche liaison de données).

TCP a été développé en 1973 puis adopté pour Arpanet en 1983, remplaçant NCP (RFC 801^[3]).

Fonctionnement

Une session TCP fonctionne en trois phases :

l'établissement de la connexion ;
les transferts de données ;
la fin de la connexion.

L'établissement de la connexion se fait par un handshaking en trois temps. La rupture de connexion, elle, utilise un handshaking en quatre temps. Pendant la phase d'établissement de la connexion, des paramètres comme le numéro de séquence sont initialisés afin d'assurer la transmission fiable (sans perte et dans l'ordre) des données.

Structure d'un segment TCP

En bits

0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	24	25	26	27	28	29	30	31
Port Source 2 octets																Port destination 2 octets
Numéro de séquence
Numéro d'acquittement
Taille de l'en-tête				Réservé			ECN / NS	CWR	ECE	URG	ACK	PSH	RST	SYN	FIN	Fenêtre
Somme de contrôle																Pointeur de données urgentes
Options																						Remplissage
Données

Signification des champs :

Port source : numéro du port source
Port destination : numéro du port destination
Numéro de séquence : numéro de séquence du premier octet de ce segment
Numéro d'acquittement : numéro de séquence du prochain octet attendu
Taille de l'en-tête : longueur de l'en-tête en mots de 32 bits (les options font partie de l'en-tête)
Indicateurs ou Flags :
- Réservé : réservé pour un usage futur
- ECN/NS : signale la présence de congestion, voir RFC 3168^[4] ; ou Nonce Signaling, voir RFC 3540^[5]
- CWR : Congestion Window Reduced : indique qu'un paquet avec ECE a été reçu et que la congestion a été traitée
- ECE : ECN-Echo : si SYN=1 indique la capacité de gestion ECN, si SYN=0 indique une congestion signalée par IP (voir RFC 3168)
- URG : Signale la présence de données urgentes
- ACK : signale que le paquet est un accusé de réception (acknowledgement)
- PSH : données à envoyer tout de suite (push)
- RST : rupture anormale de la connexion (reset)
- SYN : demande de synchronisation ou établissement de connexion
- FIN : demande la fin de la connexion
Fenêtre : taille de fenêtre demandée, c'est-à-dire le nombre d'octets que le récepteur souhaite recevoir sans accusé de réception
Somme de contrôle : somme de contrôle calculée sur l'ensemble de l'en-tête TCP et des données, mais aussi sur un pseudo en-tête (extrait de l'en-tête IP)
Pointeur de données urgentes : position relative des dernières données urgentes
Options : facultatives
Remplissage : zéros ajoutés pour aligner les champs suivants du paquet sur 32 bits, si nécessaire
Données : séquences d'octets transmis par l'application (par exemple : +OK POP3 server ready...)

Établissement d'une connexion

Même s'il est possible pour deux systèmes d'établir une connexion entre eux simultanément, dans le cas général, un système ouvre une 'socket' (point d'accès à une connexion TCP) et se met en attente passive de demandes de connexion d'un autre système. Ce fonctionnement est communément appelé ouverture passive, et est utilisé par le côté serveur de la connexion. Le côté client de la connexion effectue une ouverture active en 3 temps :

Le client envoie un segment SYN au serveur,
Le serveur lui répond par un segment SYN/ACK,
Le client confirme par un segment ACK.

Durant cet échange initial, les numéros de séquence des deux parties sont synchronisés :

Le client utilise son numéro de séquence initial dans le champ "Numéro de séquence" du segment SYN (x par exemple),
Le serveur utilise son numéro de séquence initial dans le champ "Numéro de séquence" du segment SYN/ACK (y par exemple) et ajoute le numéro de séquence du client plus un (x+1) dans le champ "Numéro d'acquittement" du segment,
Le client confirme en envoyant un ACK avec un numéro de séquence augmenté de un (x+1) et un numéro d'acquittement correspondant au numéro de séquence du serveur plus un (y+1).

Transferts de données

Pendant la phase de transferts de données, certains mécanismes clefs permettent d'assurer la robustesse et la fiabilité de TCP. En particulier, les numéros de séquence sont utilisés afin d'ordonner les segments TCP reçus et de détecter les données perdues, les sommes de contrôle permettent la détection d'erreurs, et les acquittements ainsi que les temporisations permettent la détection des segments perdus ou retardés.

Numéros de séquence et d'acquittement

Grâce aux numéros de séquence et d'acquittement, les systèmes terminaux peuvent remettre les données reçues dans l'ordre à l'application destinataire.

Les numéros de séquence sont utilisés pour décompter les données dans le flux d'octets. On trouve toujours deux de ces nombres dans chaque segment TCP, qui sont le numéro de séquence et le numéro d'acquittement. Le numéro de séquence représente le propre numéro de séquence de l'émetteur TCP, tandis que le numéro d'acquittement représente le numéro de séquence du destinataire. Afin d'assurer la fiabilité de TCP, le destinataire doit acquitter les segments reçus en indiquant qu'il a reçu toutes les données du flux d'octets jusqu'à un certain numéro de séquence.

Le numéro de séquence indique le premier octet des données.

Par exemple, dans le cas d'un échange de segments par Telnet :

L'hôte A envoie un segment à l'hôte B contenant un octet de données, un numéro de séquence égal à 43 (Seq = 43) et un numéro d'acquittement égal à 79 (Ack = 79),
L'hôte B envoie un segment ACK à l'hôte A. Le numéro de séquence de ce segment correspond au numéro d'acquittement de l'hôte A (Seq = 79), et le numéro d'acquittement au numéro de séquence de A tel que reçu par B, augmenté de la quantité de données en bytes reçue (Ack = 43 + 1 = 44),
L'hôte A confirme la réception du segment en envoyant un ACK à l'hôte B, avec comme numéro de séquence son nouveau numéro de séquence, à savoir 44 (Seq = 44) et comme numéro d'acquittement le numéro de séquence du segment précédemment reçu, augmenté de la quantité de données reçue (Ack = 79 + 1 = 80).

Les numéros de séquence sont des nombres entiers non signés sur 32 bits, qui reviennent à zéro après avoir atteint (2^32)-1. Le choix du numéro de séquence initial est une des clefs de la robustesse et de la sécurité des connexions TCP.

Une amélioration de TCP, nommée acquittement sélectif (selective acknowledgement ou SACK), autorise le destinataire TCP à acquitter des blocs de données reçus dans le désordre.

Somme de contrôle

Une somme de contrôle sur 16 bits, constituée par le complément à un de la somme complémentée à un de tous les éléments d'un segment TCP (en-tête et données), est calculée par l'émetteur, et incluse dans le segment émis. Le destinataire recalcule la somme de contrôle du segment reçu, et si elle correspond à la somme de contrôle reçue, on considère que le segment a été reçu intact et sans erreur.

Temporisation

La perte d'un segment est gérée par TCP en utilisant un mécanisme de temporisation et de retransmission. Après l'envoi d'un segment, TCP va attendre un certain temps la réception du ACK correspondant. Un temps trop court entraîne un grand nombre de retransmissions inutiles et un temps trop long ralentit la réaction en cas de perte d'un segment.

Dans les faits, le délai avant retransmission doit être supérieur au RTT moyen d'un segment, c'est-à-dire au temps que prend un segment pour effectuer l'aller-retour entre le client et le serveur. Comme cette valeur peut varier dans le temps, on "prélève" des échantillons à intervalle régulier et on en calcule une moyenne pondérée :

RTT moyen = (1- $\alpha$ ) * RTT moyen +  $\alpha$  * RTT échantillon

Une valeur typique pour $\alpha$ est 0.125. L'influence des échantillons diminue de manière exponentielle dans le temps.

Le délai à utiliser est obtenu à partir de cette estimation du RTT moyen et en y ajoutant une marge de sécurité. Plus la différence entre un échantillon et la moyenne est grande, plus la marge de sécurité à prévoir est importante. Le calcul se fait à partir de la variance pondérée entre l'échantillon et la moyenne :

Variance RTT = (1- $\beta$ ) * Variance RTT +  $\beta$  * |RTT échantillon - RTT moyen|

Une valeur typique pour $\beta$ est 0.25. Le délai à utiliser est finalement donné par la formule suivante :

Délai = RTT moyen + 4 * Variance RTT

L'Algorithme de Karn permet de mieux évaluer le délai en présence d'acquittements ambigus. En effet, si un segment envoyé a été perdu, les segments ultérieurs provoqueront des acquittements où figurera le numéro du premier octet manquant, et on ne sait donc plus à quel segment envoyé correspondent ces acquittements.

Parfois, quand le délai est trop long, il est avantageux de ne pas attendre avant de retransmettre un segment. Si un hôte reçoit 3 ACKs pour le même segment, alors il considère que tous les segments transmis après le segment acquitté ont été perdus et les retransmet donc immédiatement (Fast retransmit).

Contrôle de flux

Chaque partenaire dans une connexion TCP dispose d'un tampon de réception dont la taille n'est pas illimitée. Afin d'éviter qu'un hôte ne surcharge l'autre, TCP prévoit plusieurs mécanismes de contrôle de flux. Ainsi, chaque segment TCP contient la taille disponible dans le tampon de réception de l'hôte qui l'a envoyé. En réponse, l'hôte distant va limiter la taille de la fenêtre d'envoi afin de ne pas le surcharger.

D'autres algorithmes comme Nagle ou Clarck facilitent également le contrôle du flux.

Contrôle de congestion

La congestion intervient lorsque trop de sources tentent d'envoyer trop de données trop vite pour que le réseau soit capable de les transmettre. Ceci entraîne la perte de nombreux paquets et de longs délais.

Les acquittements des données émises, ou l'absence d'acquittements, sont utilisés par les émetteurs pour interpréter de façon implicite l'état du réseau entre les systèmes finaux. À l'aide de temporisations, les émetteurs et destinataires TCP peuvent modifier le comportement du flux de données. C'est ce qu'on appelle généralement le contrôle de congestion.

Il existe une multitude d'algorithmes d'évitement de congestion pour TCP.

Autres

TCP utilise un certain nombre de mécanismes afin d'obtenir une bonne robustesse et des performances élevées. Ces mécanismes comprennent l'utilisation d'une fenêtre glissante, l'algorithme de démarrage lent (slow start), l'algorithme d'évitement de congestion (congestion avoidance), les algorithmes de retransmission rapide (fast retransmit) et de récupération rapide (fast recovery), etc. Des recherches sont menées actuellement afin d'améliorer TCP pour traiter efficacement les pertes, minimiser les erreurs, gérer la congestion et être rapide dans des environnements très haut débit.

Slow Start (démarrage lent)

Le démarrage lent TCP (Slow start) est un algorithme qui équilibre la vitesse d'une connexion réseau. Le démarrage lent augmente progressivement la quantité de données transmises jusqu'à ce qu'il trouve la capacité de transport maximale du réseau.

Le démarrage lent du TCP est l'une des premières étapes du processus de contrôle de la congestion. Il permet d'équilibrer la quantité de données qu'un émetteur peut transmettre (appelée fenêtre de congestion) et la quantité de données que le récepteur peut accepter (appelée fenêtre de réception). La plus faible des deux valeurs devient la quantité maximale de données que l'expéditeur est autorisé à transmettre avant de recevoir un accusé de réception du récepteur.

L'un des moyens les plus courants d'optimiser la vitesse d'une connexion est d'augmenter la vitesse de la liaison (c'est-à-dire d'augmenter la quantité de bande passante). Cependant, toute liaison peut devenir surchargée si un appareil tente d'envoyer trop de données. La sursaturation d'un lien est connue sous le nom de congestion et peut entraîner un ralentissement des communications, voire la perte de données.

Fast retransmit (retransmission rapide)

La retransmission rapide (Fast retransmit) est une amélioration du TCP qui réduit le temps d'attente d'un expéditeur avant de retransmettre un segment perdu. Un expéditeur TCP utilise normalement un simple timer pour reconnaître les segments perdus. Si un accusé de réception n'est pas reçu pour un segment particulier dans un délai déterminé (fonction du délai estimé aller-retour), l'expéditeur supposera que le segment a été perdu dans le réseau et le retransmettra.

L'acquittement en double (Duplicate acknowledgement) est la base du mécanisme de retransmission rapide. Après réception d'un paquet, un accusé de réception est envoyé pour le dernier octet de données reçu dans l'ordre. Pour un paquet en ordre, il s'agit en fait du numéro de séquence du dernier paquet plus la longueur de la charge utile du paquet actuel. Si le paquet suivant dans la séquence est perdu mais qu'un troisième paquet dans la séquence est reçu, le récepteur ne peut accuser réception que du dernier octet de données en ordre, qui a la même valeur que celle de l'accusé de réception du premier paquet. Le deuxième paquet est perdu et le troisième paquet n'est pas en ordre, de sorte que le dernier octet de données en ordre reste le même qu'avant. Il y a donc un double acquittement. L'expéditeur continue à envoyer des paquets, et un quatrième et un cinquième paquet sont reçus par le destinataire. Là encore, le deuxième paquet est absent de la séquence, de sorte que le dernier octet de données en ordre n'a pas changé. Des accusés de réception en double sont envoyés pour ces deux paquets.

Lorsqu'un expéditeur reçoit trois accusés de réception en double, il peut être raisonnablement certain que le segment portant les données qui ont suivi le dernier octet de commande spécifié dans l'accusé de réception a été perdu. Un expéditeur avec retransmission rapide retransmettra alors ce paquet immédiatement sans attendre son expiration. À la réception du segment retransmis, le récepteur peut accuser réception du dernier octet de données reçu. Dans l'exemple ci-dessus, cela permettrait d'accuser réception jusqu'à la fin de la charge utile du cinquième paquet. Il n'est pas nécessaire d'accuser réception des paquets intermédiaires, puisque TCP utilise par défaut des accusés de réception cumulatifs.

Terminaison d'une connexion

La phase de terminaison d'une connexion utilise un handshaking en quatre temps, chaque extrémité de la connexion effectuant sa terminaison est de manière indépendante. Ainsi, la fin d'une connexion nécessite une paire de segments FIN et ACK pour chaque extrémité.

Ports TCP

TCP, comme UDP, utilise le numéro de port pour identifier les applications. À chaque extrémité (client/serveur) de la connexion TCP est associé un numéro de port sur 16 bits (de 0 à 65535) assigné à l'application émettrice ou réceptrice. Ces ports sont classés en trois catégories :

Les ports bien connus sont assignés par l'IANA (Internet Assigned Numbers Authority) dans la plage 0-1023, et sont souvent utilisés par des processus système ou ayant des droits privilégiés. Les applications bien connues qui fonctionnent en tant que serveur et sont en attente de connexions utilisent généralement ces types de ports. Exemples : FTP (21), SSH (22), Telnet (23), SMTP (25), HTTP (80), POP3 (110).
Les ports enregistrés sont généralement utilisés par des applications utilisateur comme ports sources éphémères pour se connecter à un serveur, mais ils peuvent aussi identifier des services non enregistrés par l'IANA.
Les ports dynamiques/privés peuvent aussi être utilisés par des applications utilisateur, mais plus rarement. Ils n'ont pas de sens en dehors d'une connexion TCP particulière.

Développement de TCP

C'est le ministère américain de la Défense (DoD) qui à l'origine a développé le modèle de référence TCP/IP, car il avait besoin d'un réseau pouvant résister à toutes les situations^[6].

TCP est un protocole assez complexe, et en évolution. Même si des améliorations significatives ont été apportées au cours des années, son fonctionnement de base a peu changé depuis le RFC 793, publié en 1981. Le RFC 1122^[7] (Host Requirements for Internet Hosts), a clarifié un certain nombre de prérequis pour l'implémentation du protocole TCP. Le RFC 2581^[8] (TCP Congestion Control), l'un des plus importants de ces dernières années, décrit de nouveaux algorithmes utilisés par TCP pour éviter les congestions. En 2001, le RFC 3168 a été écrit afin de présenter un mécanisme de signalisation des congestions (explicit congestion notification ou ECN), et s'ajoute à la liste des RFC importants qui complètent la spécification originale.

Utilisations de TCP

Au début du XXI^e siècle, TCP est utilisé approximativement pour 90 % de tout le trafic Internet^[9]. Les applications les plus courantes qui utilisent TCP sont HTTP/HTTPS (World Wide Web), SMTP/POP3/IMAP (messagerie) et FTP (transfert de fichiers). Youtube et Netflix utilisent également TCP pour leurs fluxs de streaming^[10].

Alternatives à TCP

De nombreuses applications en temps réel n'ont pas besoin, et peuvent même souffrir, des mécanismes complexes de transport fiable de TCP : applications de diffusion multimédia (audio, vidéo, jeux multi-joueurs) en temps réel, échanges de fichiers, etc. Dans ce type d'applications, il est souvent préférable de gérer les pertes, erreurs ou congestions, plutôt que d'essayer de les éviter.

Pour ces besoins particuliers, d'autres protocoles de transport ont été créés et déployés.

UDP (User datagram protocol) est souvent utilisé lorsque le temps-réel est privilégié sur la fiabilité. Tout comme TCP, ce protocole propose un multiplexage applicatif à travers la notion de ports, mais fonctionne en mode non connecté.
SCTP (Stream Control Transmission Protocol), protocole fournissant des services similaires à TCP (fiabilité, remise en ordre des séquences, et contrôle de congestion), tout en offrant la possibilité de communications multi-cibles comme avec UDP.

MPTCP (Multipath TCP) est une surcouche à TCP qui rassemble diverses connexions TCP (à travers différentes interfaces réseau: GSM, Wifi, etc.), au sein d'une même méta-connexion (RFC 6824). Ce fonctionnement permet d'exploiter tous les chemins disponibles en parallèle, et donc améliorer significativement les performances et la fiabilité d'une connexion.

Références

↑ (en) Request for comments n^o 9293
↑ (en) « Transmission Control Protocol (TCP) », Request for comments n^o 9293, août 2022
↑ (en) Jon Postel, « NCP/TCP TRANSITION PLAN », Request for comments n^o 801, novembre 1981
↑ (en) « The Addition of Explicit Congestion Notification (ECN) to IP », Request for comments n^o 3168, septembre 2001
↑ (en) « Robust Explicit Congestion Notification (ECN) Signaling with Nonces », Request for comments n^o 3540, juin 2003
↑ « DARPA / ARPA -- Defense / Advanced Research Project Agency », livinginternet.com (consulté le 19 janvier 2011)
↑ (en) « Requirements for Internet Hosts -- Communication Layers », Request for comments n^o 1122, octobre 1989
↑ (en) « TCP Congestion Control », Request for comments n^o 2581, avril 1999
↑ « Packet-level traffic measurements from the Sprint IP backbone » (consulté le 5 juin 2020)
↑ « Network Characteristics of Video Streaming Traffic » (consulté le 5 juin 2020)

Voir aussi

Liens externes

(en) RFC 793 - Transmission Control Protocol
(fr) Traduction Française de la RFC 793
(en) IANA assignation des ports
(en) Sally Floyd's homepage
(en) La vision de John Kristoff sur TCP
(en) When The CRC and TCP Checksum Disagree
(en) Introduction à TCP/IP - avec des images
(en) Open Source TCP/IP library