If you're seeing this message, it means we're having trouble loading external resources on our website.

Si vous avez un filtre web, veuillez vous assurer que les domaines *. kastatic.org et *. kasandbox.org sont autorisés.

Contenu principal

HTTP et HTML

Le fondateur de Tumblr, David Karp, et la gestionnaire du programme XBOX, Jasmine Lawrence, donnent une description détaillée de la façon dont les fichiers et les pages web sont envoyés et reçus à l'aide de HTTP et HTML.

Vous souhaitez rejoindre la discussion ?

Pas encore de posts.
Vous comprenez l'anglais ? Cliquez ici pour participer à d'autres discussions sur Khan Academy en anglais.

Transcription de la vidéo

- Je suis Jasmine Lawrence et je suis responsable de programme pour l'équipe technique de la Xbox One. L'une de nos plus grandes fonctionnalités est appelée le Xbox Live. C'est un service en ligne qui connecte les joueurs à travers le monde, et nous avons besoin d'Internet pour que cela fonctionne. C'est une mission difficile, et beaucoup de choses se trament en coulisse. Internet est en train de changer la façon dont on interagit et communique. Comment cela fonctionne-t-il ? Comment les ordinateurs à travers le monde arrivent-ils à communiquer les uns avec les autres ? Jetons un œil à la navigation sur le web. D'abord, on ouvre le navigateur. C'est l'application utilisée pour accéder à des pages web. Ensuite, on tape l'adresse, ou URL qui veut dire en anglais Uniform Resource Locator, d'un site que tu veux consulter, par exemple Tumblr.com. - Salut, je suis David Karp, le fondateur de Tumblr, et aujourd'hui on va parler du fonctionnement de ces navigateurs web qu'on utilise tous les jours. Tu t'es sans doute déjà demandé ce qui se passe quand tu tapes une adresse dans ton navigateur et que tu appuies sur "enter". Et c'est aussi fou que tu l'imagines. Donc, à ce moment-là, ton ordi commence à parler à un autre ordinateur, qu'on appelle serveur, et qui est souvent à des milliers de kilomètres. En quelques millisecondes, ton ordinateur demande un site web à ce serveur, et celui-ci lui répond dans un langage qu'on appelle HTTP. HTTP veut dire, en anglais, Hypertext Transfer Protocol. Tu peux le voir comme une langue qu'un ordinateur utilise pour demander un document à un autre ordinateur. C'est en fait assez simple. Si tu devais intercepter la conversation entre ton ordinateur et un serveur web sur Internet, tu verrais principalement des requêtes appelées "GET". Tu vas alors avoir "GET", soit "OBTENIR" en français, suivi du nom du document que tu demandes. Donc, si tu essaies de te connecter sur la page d'accueil de Tumblr, en fait, tu envoies une requête GET au serveur de Tumblr qui dit "GET/connexion" et qui dit au serveur de Tumblr que tu veux tout le code HTML pour la page de connexion. HTML veut dire HyperText Markup Language, et tu peux le voir comme étant le langage utilisé pour expliquer à un navigateur à quoi la page doit ressembler. Donc, prenons l'exemple de Wikipédia. C'est en fait un grand document assez simple, et le langage HTML permet de rendre un titre grand et gras, de choisir la police correcte, de relier certains textes à d'autres pages, de rendre du texte gras, ou italique, de mettre une image au centre de la page, d'aligner l'image à droite, ou d'aligner l'image à gauche. - Le texte d'une page web est inclus directement dans le code HTML, mais d'autres éléments, images ou vidéos, sont indépendants et ont leur propre URL, qui doit être demandé également. Le navigateur envoie des requêtes HTTP distinctes pour chaque élément, et les affiche au fur et à mesure. Si une page web comporte beaucoup d'images différentes, chacune d'elles requiert une requête HTML distincte et la page charge plus lentement. Toutefois, quand tu navigues sur le web, il ne s'agit pas toujours de demander des pages avec des requêtes GET. Parfois, tu envoies une information, comme quand tu remplis un formulaire ou tapes une recherche. Ton navigateur envoie cette info en texte brut au serveur grâce à une requête HTTP POST. - Disons que tu te connectes à Tumblr. La première chose que tu fais, c'est une requête "POST". C'est-à-dire, un "POST" sur la page de connexion de Tumblr auquel des données sont rattachées. Ton adresse e-mail, ton mot de passe. Ces infos vont au serveur de Tumblr. Ce serveur établit que, en effet, tu es David. Il envoie une page web en retour à ton navigateur, laquelle dit "Super ! Bienvenue, David." Mais, en même temps que cette page web il y a également quelques données de cookies invisibles que ton navigateur voit et sauvegarde. Ceci est vraiment important, car c'est la seule manière pour un site de retenir qui tu es. Tous ces données de cookies sont comme une carte d'identité sur Tumblr. C'est un numéro qui t'identifie comme David. Ton navigateur retient ce numéro, et la prochaine fois que tu rafraichis la page ou que tu te rends sur Tumblr.com, ton navigateur peut automatiquement relier ce numéro d'identification à la demande envoyée sur le serveur de Tumblr. Donc, quand le serveur de Tumblr voit la requête venant de ton navigateur, accompagnée du numéro d'identification, il sait que c'est une requête de David. - Internet est complètement ouvert, toutes les connections sont partagées, et les infos envoyées en texte brut. Cela permet aux pirates d'espionner les données personnelles que tu envoies sur Internet. Mais les sites sécurisés empêchent cela en demandant à ton navigateur de communiquer sur un canal sécurisé grâce à ce qu'on appelle le protocole sécurisé de cryptage (SSL) et son successeur, le protocole de sécurité de la couche transport (TLS). Tu peux imaginer le SSL et le TLS comme des couches de sécurité enroulées autour de tes communications pour les protéger de l'espionnage ou de la falsification. Le SSL et le TLS sont activés quand tu vois un petit cadenas dans la barre d'adresse de ton navigateur à côté du HTTPS. Les protocoles HTTPS garantissent que les requêtes HTTP soient sécurisées et protégées. Lorsqu'un site demande à ton navigateur de procéder à une connexion sécurisée, il fournit d'abord un certificat numérique, qui ressemble à une carte d'identité prouvant que le site est bien celui qu'il prétend être. Les certificats numériques sont publiés par les autorités de certification, qui sont des autorités fiables vérifiant l'identité des sites et qui émet les certificats pour eux, tout comme un gouvernement émettrait une carte d'identité. Maintenant, si un site web essaie d'établir une connexion sans avoir correctement émis le certificat numérique, ton navigateur t'en informera. C'est un des principes de base de la navigation sur le web, la partie d'Internet que l'on voit tous les jours. Pour résumer, le HTTP et le DNS contrôlent l'envoi et la réception de l'HTML, de fichiers multimédias, ou de tout ce qui est sur le web. Tout cela est rendu possible grâce aux TCP/IP et réseaux de routeur qui décomposent et transportent l'information dans de petits paquets. Ces paquets sont eux-mêmes composés de séquences binaires de uns et zéros physiquement envoyés grâce à des câbles électriques, des câbles de fibre optique et des réseaux sans fil. Heureusement, une fois que tu as compris comment une couche d'Internet fonctionne, tu peux lui faire confiance sans retenir tous les détails. On peut faire confiance à toutes ces couches qui travaillent ensemble pour livrer avec succès des données à grande échelle et en toute sécurité.