Identifier et formuler un sujet de recherche

 Etapes de recherche d’information. Identifier dans un premier temps le sujet délimité puis dans un second temps reformuler le sujet.

Identification d'un sujet de recherche

Etape 1 : Définir le contexte de la recherche

A quelle situation se rapporte cette recherche ? Pourquoi dois-je faire cette recherche ?

Exemple : Je fais une étude sur la commercialisation des miroirs connectés sur la zone Amérique du Nord.

Etape 2 : Identifier l’objet de la recherche

Sur quoi porte l’information recherchée ? Qu’est-ce qui m’intéresse ? Quelles sont mes connaissances actuelles sur le sujet ?

Exemple : Je recherche de l’information sur le nombre de miroirs connectés vendus en Amérique du Nord.

Etape 3 : Délimiter la recherche

Dans quelles limites linguistiques, géographiques et temporelles se situera la recherche ?

Exemple : Depuis les deux dernières années, au Canada et aux Etats-Unis.

Etape 4 : Préciser le genre de réponse désiré

Quel est le format de la réponse ou le type d’information souhaités ?

Exemple : Je recherche de l’information statistique sous forme de références ou de texte intégral.


Formulation du sujet :

Ensuite, une fois le sujet identifié, sa formulation consiste ensuite à établir un ensemble de mots clés pertinents qui seront soumis au moteur de recherche dans le but d’obtenir une réponse adéquate.

Formulation du sujet

Etapes de la formulation du sujet :

 

  • Dégager les concepts du contexte : Quels mots ou expressions précisent le mieux les concepts de la recherche ? Exemple : Etude sur l’industrie des miroirs connectés au Canada; nombre de miroirs connectés vendus en Amérique du Nord; au Canada. Information statistique sous forme de références ou de texte intégral.

 

  • Traduire les concepts en mots-clés : Quels mots traduisent le plus adéquatement les concepts ? Constituer le vocabulaire du domaine : Thésauri, champ lexical, synonymes.                          Exemple : « miroir(s) connecté(s) », « écran connecté », « objet connecté », « technologie connectée », « industrie domotique »

 

  • Déterminer les équivalences : Quels sont les synonymes et les équivalences ? Exemple : vente, industrie ou marché, market, statistics

 

  • Regrouper les mots-clés et les équivalences : Quels sont les liens entre les différents mots-clés ? Exemple : (miroir connecté ou objet connecté); (vente ou industrie, ou marché); (sales ou market); (statistiques ou statistics).

L’identification et la formulation d’un sujet ou d’une problématique de recherche feront ainsi gagner un temps énorme lors de la prochaine phase de collecte d’information. Cette étape est nécessaire pour s’approprier le sujet et les directions que l’on doit prendre pour traiter le sujet.

Mantra du jour

L'instant présent

Mon mantra aujourd’hui serait de penser le plus possible au moment et à l’instant présent dans nos vies quotidiennes.

Il est parfois difficile d’adopter ce mantra dans notre société actuelle mais c’est pourtant nécessaire pour un bien-être global.

Mantra du jour

L'échec

 

L’échec :

Cette citation me fait penser à un livre lu sur l’échec que chacun peut connaître une fois dans sa vie. Après l’avoir lu vous comprendrez que l’échec n’est pas un gage de faiblesse mais un gage d’introspection, de créativité et d’audace. Bref, je vous le conseille fortement.

« Les vertus de l’échec », Charles Pépin

Voir aussi l’émission « Philosophie » sur Arte avec Charles Pépin et Laurent Dupont qui répondront à la question « Comment trouver dans un échec le fondement d’une réussite future ? »

Enfin, petite citation qui résume bien le fait que l’échec soit nécessaire dans un parcours de vie professionnelle ou personnelle.

« En Europe, l’échec, c’est très grave. Si, en sortant de l’université, vous loupez votre coup, cela vous suit toute votre vie. Alors qu’en Amérique, à Silicon Valley, on passe son temps à échouer ! Quand on se casse la figure, on se relève et on recommence. » Steve Jobs, 1984

Guide d’autodéfense numérique

Guide d’autodéfense numérique pour comprendre et agir en conséquence.

 

Guide d'autodéfense numérique

Ce guide est  l’oeuvre d’un collectif anonyme de personnes qui travaillent depuis plus de 10 ans sur les questions liées à la surveillance numérique et aux moyens de la contourner par une autodéfense numérique.

Ainsi, dans le premier tome, les auteurs donnent quelques bases sur le fonctionnement des ordinateurs hors ligne afin de mettre en lumière ce qu’ils peuvent dévoiler sur les personnes qui les utilisent. Ensuite, focus sur quelques cas concrets  et outils.

Sommaire du Tome 1 : « Hors connexions »

I Comprendre

  • Quelques bases sur les ordinateurs
  • Traces à tous les étages
  • Malware, mouchards et autres espions
  • Quelques illusions de sécurité
  • La cryptographie

II Choisir des réponses adaptées

  • Evaluation des risques
  • Définir une politique de sécurité
  • Un nouveau départ
  • Travailler sur un document sensible
  • Archiver un projet achevé

III Outils

  • Utiliser un terminal
  • Choisir une phrase de passe
  • Démarrer sur un CD, DVD, clé USB
  • Utiliser un système live
  • Installer un système chiffré
  • Choisir, vérifier et installer un logiciel
  • Effacer des données « pour de vrai »
  • Partitionner et chiffrer un disque dur
  • Sauvegarder des données
  • Partager un secret
  • Utiliser les sommes de contrôle
  • Installer et utiliser un système virtualisé
  • Garder un système à jour
  • Nettoyer les métadonnées d’un document

Le second tome se penche quant à lui sur l’utilisation des ordinateurs en ligne et met ainsi en avant les risques et les limites liés à l’utilisation d’Internet.

Sommaire du Tome 2 : « En ligne »

I Comprendre

  • Bases sur les réseaux
  • Traces sur toute la ligne
  • Surveillance et contrôle des communications
  • Web 2.0
  • Identités contextuelles
  • La cryptographie asymétrique
  • Le routage en oignon

II Choisir des réponses adaptées

  • Consulter des sites web
  • Publier un document
  • Echanger des messages
  • Dialoguer
  • Partager des documents sensibles

III Outils

  • Installer et configurer le navigateur Tor
  • Naviguer sur le web avec Tor
  • Choisir un hébergement Web
  • Vérifier un certificat électronique
  • Utiliser un clavier virtuel dans Tails
  • Utiliser le client mail Thunderbird
  • Utiliser OpenPGP
  • Utiliser la messagerie instantanée avec OTR
  • Gérer des mots de passe
  • Utiliser OnionShare

Le même guide existe également en version papier. On pourra ainsi le trouver au prix de 15 euros auprès des éditions Tahin Party. Bonne idée pour tous ceux qui peuvent difficilement lire plus de 100 pages au format électronique. Le format papier peut en outre être bien utile pour l’avoir toujours auprès de soi et revenir très vite dessus à tout moment.

Un guide à lire donc et à partager dans son entourage sans modération car nous sommes tous concernés.

Enfin, voici un petit extrait qui résume bien cette problématique de conscience de protection numérique à acquérir pour tout un chacun :

« Chanterions-nous sous la douche si l’on savait que des micros y sont installés ? Apprendrions-nous à danser si des caméras étaient pointées sur nous ? Écririons-nous une lettre intime aussi librement si une personne lisait par dessus notre épaule ? Avoir des choses à cacher n’est pas seulement une question de légalité, mais aussi d’intimité.

Ainsi, à l’époque des sociétés de contrôle de plus en plus paranoïaques, de plus en plus résolues à traquer la subversion et à voir derrière chaque être humain un terroriste en puissance qu’il faut surveiller de près, se cacher devient un enjeu politique et de fait collectif. Ne serait-ce que pour mettre des bâtons dans les roues de ceux qui nous voudraient transparentes et repérables en permanence.

Tout ça peut amener à se dire que nous n’avons pas envie d’être contrôlables par quelque « Big Brother » que ce soit. Qu’il existe déjà ou que l’on anticipe son émergence, le mieux est sans doute de faire en sorte qu’il ne puisse pas utiliser, contre nous, tous ces merveilleux outils que nous offrent — ou que lui offrent — les technologies modernes.

Alors, ayons aussi quelque chose à cacher, ne serait-ce que pour brouiller les pistes ! »

Le web de données

Récemment s’est terminé le MOOC sur le Web sémantique et de données, conduit par l’INRIA. Sept semaines denses et riches en connaissances.

La première semaine était consacrée au « web de données liées ». Comme pour toute introduction sur un sujet donné, il est bien de revenir au passé pour comprendre le présent. Nous avons donc eu un retour sur l’histoire du web :

  • Vannevar Bush (1890-1974) : son article « As we may think »  décrit quelque chose qui ressemble beaucoup au World Wide Web d’aujourd’hui. Il imagine le memex (memory extension) pour lire et consulter des documents et faire des liens d’association entre eux. cf la version en français de son article.
Memex, Life Magazine, 10 septembre 1945

 

  • Ted Nelson : Utilisera le memex et proposera une structure de fichiers qui permettra de découper les fichiers en morceaux, de les relier entre eux afin de pouvoir naviguer entre les morceaux. On parlera d’hypertexte et d’hypermedia.
Complex information processing: a file structure for the complex, the changing and the indeterminate, T. H. Nelson, ACM, 1965

 

  • Tim Berners-Lee : Permettra à ce qu’on n’utilise plus l’hypertexte sur une seule machine. On distribue les documents sur le réseau de façon à ce qu’un document puisse pointer vers un autre document. On parlera de Web.  cf le rapport de Tim Berners-Lee à ce sujet.
Information Management: A Proposal. Tim Berners-Lee, CERN, March 1989, May 1990

 

Ensuite, petit retour sur les 3 principes architecturaux du Web. Le premier principe, celui de l’identification ou de la localisation avec ce que l’on appelle les adresses Web ou URL.

Le second principe, celui du protocole, c’est-à-dire la façon dont les machines vont parler sur le Web, la façon dont le navigateur interrogera le serveur à distance et recevoir une représentation de la page qu’il a demandée. Ce protocole s’appelle HTTP.

Enfin, le dernier principe est le langage de représentation et notamment le langage de représentation des pages du Web. On l’appelle HTML (Hypertext Markup Langage).

Mis ensemble, chacun de ces composants va interagir avec l’autre. Le protocole HTTP utilise l’HTML pour faire transiter sur le Web des représentations de pages entre le serveur et ne navigateur. Les URL sont utilisées dans le HTML dans les représentations des pages pour tisser les liens entre les pages et indiquer que dans une page, un lien pointe vers une autre page. Ces mêmes URL qui sont utilisées par HTTP pour identifier et s’adresser à distance au serveur afin de récupérer la page dont il a besoin.

Focus ensuite sur le processus de standardisation au W3C, nécessaire pour harmoniser les évolutions du Web et qui suit des étapes bien définies.

Enfin, cette première semaine s’est terminée sur les grands principes du web de données :

  • nommer les ressources avec des URI (Uniform Resource Identifier) ;
  • utiliser des URI http (ou URI déréférençables) de façon à ce qu’on puisse utiliser ces URI pour accéder à des informations sur les ressources ;
  • lorsqu’on déréférence une URI, renvoyer des informations utiles grâce à RDF et SPARQL ;
  • se relier avec d’autres URI pour créer un réseau de liens.

En définissant ainsi la notion de ressource Web en passant des URL aux URI, nous avons vu comment l’on pouvait maintenant identifier tout type d’information sur le Web.

Nous avons pu alors poser les principes de la publication de données liées sur le Web et introduire la pile des standards du Web sémantique

En savoir plus :

Quelques ressources fondatrices du web de données :

  • DBpedia, base issue de la conversion en RDF des données de l’encyclopédie collaborative Wikipedia ;
  • Geonames, l’une des principales bases de noms de lieux avec les informations associées ;
  • MusicBrainz, base d’informations en RDF sur les œuvres et les artistes musicaux.

Du Web des documents au Web sémantique

Fonctionnement et enjeux du Web des données et du Web sémantique

 

Ouvrage pédagogique sur le Web de données :

Voici un bon ouvrage pédagogique sur le fonctionnement et les enjeux du Web des données et du Web sémantique. Indispensable si vous souhaitez acquérir plus de connaissances sur le Web des données. Ce livre m’a beaucoup aidée récemment pour le MOOC sur le Web sémantique créé par l’INRIA.

Web sémantique

L’ouvrage a pour objectif de présenter les modèles, langages et techniques proposés par le Web des données et le Web sémantique. Après un rappel historique sur le Web des documents, il aborde de manière détaillée et approfondie le concept des métadonnées.

« Si nous sommes capables d’utiliser le Web pour effectuer des requêtes simples, c’est à nous qu’il revient cependant de manipuler les données, de les combiner et de les interpréter pour qu’elles se transforment en informations pertinentes. Le Web des documents reste donc principalement réservé à l’humain, la machine n’étant pas en mesure de le remplacer efficacement. Nous sommes cependant à la naissance du Web 3.0 qui porte le Web des documents vers le Web sémantique et permet aux machines d’analyser le Web pour répondre à des questions plus complexes posées par l’homme. ».

Du Web des documents au Web sémantique, Nicolas Delestre, Nicolas Malandain (Janvier 2017).