Contenu principal
Cours : Sécurité sur Internet > Chapitre 1
Leçon 11: Protocoles Internet sécurisésHTTP et HTML
Le fondateur de Tumblr, David Karp, et la gestionnaire du programme XBOX, Jasmine Lawrence, donnent une description détaillée de la façon dont les fichiers et les pages web sont envoyés et reçus à l'aide de HTTP et HTML.
Vous souhaitez rejoindre la discussion ?
Pas encore de posts.
Transcription de la vidéo
- Je suis Jasmine Lawrence et je suis responsable de programme pour l'équipe technique de la Xbox One. L'une de nos plus grandes fonctionnalités
est appelée le Xbox Live. C'est un service en ligne
qui connecte les joueurs à travers le monde, et nous avons besoin d'Internet
pour que cela fonctionne. C'est une mission difficile, et beaucoup de choses
se trament en coulisse. Internet est en train de changer la façon dont on interagit et communique. Comment cela fonctionne-t-il ? Comment les ordinateurs
à travers le monde arrivent-ils à communiquer
les uns avec les autres ? Jetons un œil à la navigation sur le web. D'abord, on ouvre le navigateur. C'est l'application utilisée
pour accéder à des pages web. Ensuite, on tape l'adresse, ou URL qui veut dire en anglais
Uniform Resource Locator, d'un site que tu veux consulter,
par exemple Tumblr.com. - Salut, je suis David Karp,
le fondateur de Tumblr, et aujourd'hui on va parler du fonctionnement de
ces navigateurs web qu'on utilise tous les jours. Tu t'es sans doute déjà demandé ce qui se passe quand tu tapes une adresse dans ton navigateur
et que tu appuies sur "enter". Et c'est aussi fou que tu l'imagines. Donc, à ce moment-là, ton ordi commence à
parler à un autre ordinateur, qu'on appelle serveur, et qui est souvent
à des milliers de kilomètres. En quelques millisecondes, ton ordinateur demande un site web à ce serveur, et celui-ci lui répond dans un langage qu'on appelle HTTP. HTTP veut dire, en anglais,
Hypertext Transfer Protocol. Tu peux le voir comme une langue
qu'un ordinateur utilise pour demander un document
à un autre ordinateur. C'est en fait assez simple. Si tu devais intercepter la conversation entre ton ordinateur et un serveur web sur Internet, tu verrais principalement des requêtes appelées "GET". Tu vas alors avoir "GET",
soit "OBTENIR" en français, suivi du nom du document que tu demandes. Donc, si tu essaies de te connecter
sur la page d'accueil de Tumblr, en fait, tu envoies une requête GET au serveur de Tumblr qui dit "GET/connexion" et qui dit au serveur de Tumblr que tu veux tout le code HTML pour la page de connexion. HTML veut dire HyperText Markup Language, et tu peux le voir comme
étant le langage utilisé pour expliquer à un navigateur
à quoi la page doit ressembler. Donc, prenons l'exemple de Wikipédia. C'est en fait un grand
document assez simple, et le langage HTML permet de rendre un titre grand et gras, de choisir la police correcte, de relier certains textes
à d'autres pages, de rendre du texte gras, ou italique, de mettre une image
au centre de la page, d'aligner l'image à droite, ou d'aligner l'image à gauche. - Le texte d'une page web est inclus directement dans le code HTML, mais d'autres éléments, images ou vidéos, sont indépendants et ont leur propre URL, qui doit être demandé également. Le navigateur envoie des
requêtes HTTP distinctes pour chaque élément,
et les affiche au fur et à mesure. Si une page web comporte
beaucoup d'images différentes, chacune d'elles requiert
une requête HTML distincte et la page charge plus lentement. Toutefois, quand tu navigues sur le web, il ne s'agit pas toujours
de demander des pages avec des requêtes GET. Parfois, tu envoies une information, comme quand tu remplis
un formulaire ou tapes une recherche. Ton navigateur envoie cette info en texte brut au serveur grâce à une requête HTTP POST. - Disons que tu te connectes à Tumblr. La première chose que tu fais,
c'est une requête "POST". C'est-à-dire, un "POST" sur
la page de connexion de Tumblr auquel des données sont rattachées. Ton adresse e-mail,
ton mot de passe. Ces infos vont au serveur de Tumblr. Ce serveur établit que,
en effet, tu es David. Il envoie une page web
en retour à ton navigateur, laquelle dit "Super ! Bienvenue, David." Mais, en même temps
que cette page web il y a également quelques
données de cookies invisibles que ton navigateur voit et sauvegarde. Ceci est vraiment important, car c'est la seule manière pour un site de retenir qui tu es. Tous ces données de cookies sont comme une carte d'identité sur Tumblr. C'est un numéro qui
t'identifie comme David. Ton navigateur retient ce numéro, et la prochaine fois que
tu rafraichis la page ou que tu te rends sur Tumblr.com, ton navigateur peut automatiquement relier ce numéro d'identification à la demande envoyée sur le serveur de Tumblr. Donc, quand le serveur de Tumblr voit la requête venant de ton navigateur,
accompagnée du numéro d'identification, il sait que c'est une requête de David. - Internet est complètement ouvert, toutes les connections sont partagées, et les infos envoyées en texte brut. Cela permet aux pirates d'espionner les données personnelles que tu envoies sur Internet. Mais les sites sécurisés empêchent cela en demandant à ton navigateur de communiquer sur un canal sécurisé grâce à ce qu'on appelle
le protocole sécurisé de cryptage (SSL) et son successeur, le protocole
de sécurité de la couche transport (TLS). Tu peux imaginer le SSL et le TLS
comme des couches de sécurité enroulées autour de tes
communications pour les protéger de l'espionnage ou de la falsification. Le SSL et le TLS sont activés
quand tu vois un petit cadenas dans la barre d'adresse de ton navigateur à côté du HTTPS. Les protocoles HTTPS garantissent que les requêtes HTTP soient
sécurisées et protégées. Lorsqu'un site demande à ton navigateur de procéder à une connexion sécurisée, il fournit d'abord un certificat numérique, qui ressemble à une carte d'identité prouvant que le site
est bien celui qu'il prétend être. Les certificats numériques sont publiés par les autorités de certification, qui sont des autorités fiables
vérifiant l'identité des sites et qui émet les certificats pour eux, tout comme un gouvernement
émettrait une carte d'identité. Maintenant, si un site web
essaie d'établir une connexion sans avoir correctement
émis le certificat numérique, ton navigateur t'en informera. C'est un des principes de base
de la navigation sur le web, la partie d'Internet
que l'on voit tous les jours. Pour résumer, le HTTP et le DNS contrôlent l'envoi et la réception de l'HTML, de fichiers multimédias,
ou de tout ce qui est sur le web. Tout cela est rendu possible grâce aux TCP/IP et réseaux de routeur qui
décomposent et transportent l'information dans de petits paquets. Ces paquets sont eux-mêmes composés de séquences binaires de uns et zéros physiquement envoyés
grâce à des câbles électriques, des câbles de fibre optique
et des réseaux sans fil. Heureusement, une fois
que tu as compris comment une couche d'Internet fonctionne,
tu peux lui faire confiance sans retenir tous les détails. On peut faire confiance à toutes
ces couches qui travaillent ensemble pour livrer avec succès des données à grande échelle et en toute sécurité.