Les traces que nous laissons en naviguant

, par  Alain Laponche --- ---

Les composants d’une liaison Internet :
 votre appareil (pc, tablette, ...)
 la ligne vous reliant à votre FAI
 votre FAI
 le réseau Internet
 le serveur (l’ordinateur qui vous répond)

Réseau Internet  : c’est finalement là où on laisse le moins de trace. C’est un réseau sans chef, totalement décentralisé. Contrairement au réseau téléphone, il n’y a pas un circuit précis entre 2 abonnés. Le chemin emprunté par les informations bouge sans arrêt. Vraiment Internet est la hantise des dictatures ! La NSA surveillerait peut-être les câbles océaniques.

Votre FAI en revanche, voit tout passer. Et légalement, il doit conserver la correspondance entre votre nom et vos adresses ip (fluctuantes) pendant plusieurs mois. Ce qui permettra une enquête si la police s’intéresse à un trafic mettant en cause une adresse donnée.
La ligne entre vous et votre FAI constitue un point faible : capture possible par un pirate. On peut sécuriser en cryptant ses échanges, par exemple en vérifiant que lors d’une transmission de données personnelles, on est bien en https (valide aussi l’identité du serveur). Et pour échanger des mails en toute quiétude, Telegram !

Votre ordinateur.
En principe peu de dangers (hors vos proches, ou si PC non à vous). Mais dépendant de vous, vous pouvez effacer toute trace !
Quelles sont les traces laissées par votre navigateur ?

  • l’historique : objectifs (retrouver une page déjà lue) et consultation (chercher dans le menu du navigateur ; sur Chrome PC, accès par ctrl/H ; sur Chrome mobile, les 3 points, puis historique ; sur Safari, icône livre, puis lunette).
    Mis en oeuvre quand on clique ’page précédente’ ou ’page suivante’ et les serveurs savent quelle était votre page précédent, juste avant le 1er appel.
    L’historique est normalement inaccessible depuis l’extérieur, mais constitue un enjeu important sur un plan marketing. Et peut intéresser un employeur !
  • les pages et images en cache : objectif (accélérer, réduire trafic internet)
    Exemple : sur W10 pour Chrome, ils sont sous C : > Utilisateurs > Alapo > AppData > Local > Google > Chrome > Usr Data > Defaults > Cache
  • les cookies : il s’agit de petits fichiers déposés par un site sur votre appareil donnant un identifiant provisoire à votre pc, la date de passage, toute info que le site souhaite retrouver lorsque vous le consulterez de nouveau (par ex le choix de la langue, votre adresse de livraison, ...). Cela facilitera la connexion suivante.
    Il existe des cookies persistants et des cookies dit de session (indispensables si mis en œuvre). Le choix d’interdire les cookies peut rendre un site inaccessible.
    Consultation et paramétrage sur Chrome : "paramètres" + "paramètres avancées" + "paramètres du site + cookies et données de site + afficher l’ensemble des cookies + choisir un site + ouvrir l’un des cookies. En supprimer quelques uns.
    Autant de fichiers cookies que de navigateur et d’appareil !
    Emplacement physique des coockies sur un PC avec Chrome : répertoire ci-dessus, puis Defaults / fichier "Cookies". On peut tenter de le lire avec Bloc-notes
  • les enregistrements des réponses aux formulaires : objectif (des facilités apportées), mais danger (par ex quand il s’agit d’un code CB saisi sur un ordinateur en libre-service)

Effacement de ces traces sur votre ordinateur : c’est prévu dans votre navigateur
Sur Chrome : Plus d’outils / effacer les données de navigation ; choix des "traces" effacées et sur quelles périodes.
Pour d’autres navigateurs, cf https://fr.wikihow.com/voir-les-cookies
Et sur Android : https://blogosquare.com/comment-supprimer-lhistorique-et-cookies-sur-android/

Info sur https://connect.ed-diamond.com/MISC/MISC-081/Detecter-et-analyser-les-cookies-et-autres-traceurs
Et un outil développé par la CNIL : Cookieviz

A savoir, mettre un navigateur en Mode privé supprimera toute trace sur l’appareil quand vous quitterez le mode privé. On repart donc à zéro avant chaque consultation. Ex : sur Clio, il vous faudra vous reconnecter à chaque fois.

Les serveurs consultés
Ce sont eux qui posent le plus de problèmes au niveau des traces laissées par notre navigation, car nos moyens d’intervention sur eux sont naturellement limités.

  • les logs  : objectifs, contenu (votre adresse, la date, la page demandée, le type de navigateur, la taille de l’écran, le système d’exploitation, ...)
    Cf https://kb.webtrends.com/articles/Information/Sample-Log-File-Apache-Extended-Log-File-Format
    Ils sont exploités par les propriétaires du site avec des outils de dépouillement souvent très sophistiqués (ex origine des appels, cheminement dans le site, erreurs de navigation, ...) ou par la justice (qui s’est intéressé à telle information ?)
    On ne peut rien y faire, sauf à passer par des VPN ou autre dispositif cachant votre adresse IP.
    A savoir : votre box dispose elle-aussi d’un fichier log. Souvent inaccessible à vous, il ne l’est pas à la police (et parfois à un hacker).
  • les marqueurs / traceurs /mouchards
    Principe : une image affichée dans une page web n’est jamais transmise avec le code (langage html) de la page ; en revanche, il y a au sein de ce code, de quoi réserver une place pour l’image, et indiquer où elle est stockée. Cette image :
     peut être stockée sur un serveur différent de celui de la page (un serveur tiers)
     n’est pas forcément visible pour le lecteur.
    Ce serveur tiers, en délivrant l’image demandée, saura quelle adresse ip l’a demandée, quelle page a été affichée au lecteur, à quelle heure, etc .... Il peut s’agir de :
     une régie publicitaire (elle pourra recouper ces informations avec tous les mouchards qu’il aura placé dans d’autres sites, et dresser ainsi un profil de cet internaute)
     un site d’analyse de trafic comme Xiti et surtout Google Analytics, ceci à la demande du propriétaire du site
    Des plugins comme Ghostery permettent de les identifier, voire les supprimer.
    Démo de Ghostery (aller sur ghostery.com, choisir le navigateur visé et installer, choisir version de base gratuite)
    Un mouchard ne présente aucun effet nuisible (contrairement à un virus) et on peut les supprimer sans aucun effet visible (contrairement aux cookies)
    Mais laisser les analyses de trafic (cela améliore la qualité des sites), sauf peut-être ceux de Google Analytics qui va sans doute rapprocher cette information d’autres choses qu’il connait déjà sur vous
  • les enregistrements dans les comptes clients
    Les entreprises enregistrent dans des bases de données
     des données nominatives vous concernant (à l’ouverture du compte en particulier)
     les informations numériques que vous leur avez confié (commandes, mail, stockage icloud, ..)
     des informations sur votre navigation quand vous consultez leur site
    Le rapprochement de ces informations peut révèler beaucoup de choses sur vous.
    La RGPD s’applique pour tous en France. Le notre (non accessible). En théorie, permet la consultation et la suppression de toutes nos "traces".
    Limiter les infos nominatives fournies. Malheureusement l’adresse mail est souvent obligatoire (d’où l’intérêt des adresses mail "poubelle").
    Attention à Google qui dans son compte client enregistre toutes les consultations de son moteur de recherche. Mais aussi les mails Gmail, toutes les opérations faites avec vos téléphones Androïd, les consultations de page avec leur marqueur Google analytics (cf plus haut), l’utilisation de Youtube, Google Images, Google Docs, votre localisation, etc ... (ex : un compte Google ; "gérer votre compte client" ; "données et personnalisation" ; vos recherches ou vos trajets)
    Ces enregistrements sont bien protégés dans les organismes officiels (dossier médical, fisc, banque, ...), mais ils sont l’obsession des pirates. Heureusement, même s’ils parviennent parfois à récupérer le contenu de nos comptes clients, cela ne signifie pas qu’ils puissent piller nos données dans les sites "cloud" ou récupérer nos fonds dans une banque (les identifiants d’accès sont généralement bien codés) ! Exemple : Dropbox (stockage de fichiers dans le Cloud) a été piraté, nos comptes clients divulgués, mais pas nos données entreposées sur leurs serveurs.

Sachez que le simple fait de consulter un site donne au propriétaire du site des informations sur votre matériel. Démo

On est suivi à la trace !
Le simple fait d’allumer son ordinateur ou son smartphone suffit à le localiser
Notre opérateur est avisé de notre position :
 par l’adresse de la ligne fixe utilisée (là où est installé la box)
 par "triangulation" du téléphone mobile capté par plusieurs antennes relais
Mais d’autres "pisteurs" ont une information sur votre localisation par :
 l’adresse IP utilisée (plage par région et opérateur) démo localisation approximative
 les adresses des antennes wifi à proximité (programme Google associé à Street View), même si vous ne les utilisez pas !
 les programmes qui, en arrière plan sur les smartphones, calculent plus ou moins en permanence, votre position, surtout si vous avez laissé en marche le GPS
Les concepteurs d’iOs et Android, à savoir Apple et Google, connaissent ainsi la position de leurs smartphones, souvent avec plus de précision que les opérateurs de téléphonie. Cf un service comme « localiser son smartphone » en cas de perte ou vol.

Pour "leurrer" certains serveurs, on peut mettre en oeuvre un VPN. Ils verront alors une adresse IP qui n’est pas la votre. Objectifs :
 ne pas être pisté par les publicitaires
 contourné des restrictions qui s’appliqueraient en France
 "trafiquer" incognito