le web

le Web et les moteurs de recherche

Le world wide web, ou toile en français, est un service construit sur l’infrastructure du reseau internet pour mettre à la disposition des utilisateurs des documents repartis au niveau mondial.

Lors de sa navigation, l’usager d’internet va suivre des liens qui connectent les pages entre-elles (ce que l’on appelle surfer sur le Web).

Historique du 3w

Le “World Wide Web”, plus communément appelé “Web” a été développé au CERN (Conseil Européen pour la Recherche Nucléaire) par le Britannique Sir Timothy John Berners-Lee et le Belge Robert Cailliau au début des années 90. À cette époque les principaux centres de recherche mondiaux étaient déjà connectés les uns aux autres, mais pour faciliter les échanges d’information Tim Berners-Lee met au point le système hypertexte. Le système hypertexte permet, à partir d’un document, de consulter d’autres documents en cliquant sur des mots clés. Ces mots “cliquables” sont appelés hyperliens et sont souvent soulignés et en bleu. Ces hyperliens sont plutôt connus aujourd’hui sous le simple terme de “liens”.

Cette première page est d’ailleurs encore en consultation sur le lien suivant : http://info.cern.ch/hypertext/WWW/TheProject.html

Normalisation de la présentation de l’information (w3c)

Le bon fonctionnement du www nécessite le respect de normes et de formats de fichiers et de protocoles entre serveurs et clients.

Le World Wide Web Consortium, abrégé par le sigle W3C, est un organisme de standardisation à but non lucratif, fondé en octobre 1994 chargé de promouvoir la compatibilité des technologies du World Wide Web telles que HTML, CSS, JS, …

W3C®_Icon

W3C: un organisme qui définit les standarts du web

Le web fonctionne avec : le protocole HTTP (HyperText Transfert Protocol), les URL (Uniform Resource Locator) et le langage de description HTML (HyperText Markup Language).

La lecture et l’usage des hyperliens d’une page html nécessite d’utiliser un navigateur.

Adresse d’une page web: URL

Uniform Ressource Locator: où est la page?

Une URL (Uniform Resource Locator) est l’adresse d’une page web. Voir la page le web: modele client-serveur

On peut entrer dans une page directement en saisissant son URL.

On peut alors se demander: Comment est tissée la toile du web? C’est à dire, comment sont reliées ces pages les unes aux autres…

Tout d’abord, il y a les liens hypertext. Ces liens permettent la navigation de page en page, et c’est comme cela que l’on peut utiliser le Web.

Ensuite, il y a l’entrée par un moteur de recherche.

Trouver une page: moteurs de recherche

Avant l’usage généralisé des moteurs de recherche, les sites étaient référencés par dans des annuaires web: répertoire web, annuaire Internet ou répertoire Internet est un site web proposant une liste classée de sites Web.

Le classement se fait typiquement dans une arborescence de catégories, censée couvrir tout ou partie des centres d’intérêt des visiteurs.

Aujourd’hui, ils ont perdu de l’interêt face à la facilité d’utilisation des moteurs de recherche, et ne sont plus utilisés que dans des cas particuliers voir article

dernière page de l'annuaire Yahoo avant sa fermeture en 2014

dernière page de l'annuaire Yahoo avant sa fermeture en 2014

Un moteur de recherche: Logiciel qui dispose d’une indexation des pages internet. L’indexation est un traitement qui consiste à analyser des pages pour y detecter des mots clés utilisés fréquemment par les internautes.

L’utilisateur va alors cliquer sur le lien de son choix parmi les propositions du moteur de recherche. Et se retrouver sur la page proposée, sans avoir à connaitre et mémoriser son URL.

Les moteurs de recherche – Mediaprovence (juin 2019) https://www.youtube.com/watch?v=Y8l4hKNQOEY

moteurs de recherche : fonctionement

video: Fonctionnement du moteur de recherche – FenetresurWordpress

Un moteur de recherche, c’est une entreprise, qui doit faire des profits. Ses revenus viennent des annonceurs (sites commerçants) qui sont mis en avant par des publicités ciblées. C’est un mode de référencement payant, par opposition à celui naturel, réalisé à partir des contenus redactionnels (SEO). Les moteurs de recherche mettent en avant une expérience plus personnalisée de l’internaute. Et ils ont besoin pour cela de récupérer vos données.

moteurs de recherche : fonctionement

video: Les moteurs de recherche – Mediaprovence (juin 2019)

 target=

Article: des moteurs de recherche alternatifs à Google

sécurité et confidentialité

Ce que le moteur de recherche appelle des données échangées (entre services de la même entreprise), sont vos données personnelles. Votre identité, vos contacts, la durée desappels, date, titres de vidéos, musiques consultées, historique des coord GPS, adresse IP, données des capteurs de l’appareil, requete lors des recherches, historique de navigation…

Pour limiter ses traces sur le Web, et reduire cette collecte de données qui vous concernent, vous pouvez:

  • dans le navigateur Mozilla : effacer les traces : bouton bibliothèqe, Historique, marques pages et plus encore > Historique > Effacer l’historique recent (cocher au choix : historique, historique des formulaires et des recherches, cookies et câche) ET Données > préférence des sites
  • paramétrer le navigateur : menu > Options > Vie privée et sécurité (Il y a plusieurs niveaux de sécurité). Dans Identifiants et mots de passe > afficher les mots de passe. Dans cookies et données > recherche la présence d’un cookie de connexion au site du lycée…
  • et Vie privée : blocage de contenus : toujours, afin de bloquer les contenus tiers qui peuvent ralentir la navigation ou distraire.

Impacts sur les pratiques humaines

  • Le web permet à chacun de publier des informations sans contrôle préalable par une autorité. Cette revolution democratique amène la présence de fausses nouvelles (fake news) et le besoin de verification. Libération (désintox) et Le Monde (le blog des decodeurs) possèdent des espaces dédiés à la pratique, dédiant des journalistes à cette seule tâche.
  • Wikipedia est un exemple d’encyclopedie libre et participative, où des centaines d’internautes publient et relisent et effectuent des milliers de changement par heure.
  • Le web et le droit d’auteur, licences creatice commun
  • Les traces laissées de manière voulue ou non lors de sa navigation

bigdataiswatchingyou
D’où l’importance d’un cadre juridique permettant de protéger les usagers, préoccupation à laquelle répond le règlement général sur la protection des données (RGPD).

Exercice

Construire une URL (Uniform Ressource Locator)

Pour accéder aux documents d’un serveur, il faut saisir une URL (une adresse) dans un navigateur.

Un ordinateur serveur héberge des dossiers et des fichiers. Le chemin vers un document est mis après l’adresse du nom de domaine dans l’URL.

Par exemple, pour atteindre fichier1.css, il faut saisir l’adresse :

http://nom_du_domaine.fr/dossier2/fichier1.css

exercice inspiré de la page web du site pixees.fr/informatiquelycee

exercice inspiré de la page web du site pixees.fr/informatiquelycee

  • Quelle est l’URL à saisir pour atteindre fichier4.js ?
  • Quelle est l’URL à saisir pour atteindre fichier6.html ?

Liens

article binaire blog le Monde : Le www a 30 ans