Coder un document avec NVivo

Le codage est une activité incontournable pour les chercheurs souhaitant analyser des données qualitatives. Cette activité, qui consiste à relier des segments de données à des catégories, constitue un passage quasi-obligé dans des méthodes aussi diverses que la théorisation enracinée (grounded theory), les méthodes mixtes, la qualitative comparative analysis ou encore l’ethnographie. Le codage des données est à la fois un moyen de réduire et d’organiser le matériau à analyser et de structurer le processus d’analyse pour permettre la conceptualisation.

L’objet de ce post est de vous permettre de comprendre comment coder vos Sources avec des Nœuds (Nodes). Qu’ils soient construits de façon émergente au fur et à mesure de l’analyse ou prédéfinis en fonction de la littérature existante, organisés de façon hiérarchique ou non hiérarchique, les nœuds constituent l’outil principal qui va permettre au chercheur de réaliser son codage. Ils désignent les catégories à l’intérieur desquelles les segments de données seront organisés dans Nvivo. Ces segments peuvent par exemple consister en des phrases, des paragraphes, des zones sur une image ou encore des séquences issues d’une vidéo.

Le volet Nœuds (Nodes) de NVivo comprend plusieurs types d’éléments qui sont autant d’outils utilisables par le chercheur dans le cadre de l’analyse de ses données. Nous traiterons ici du codage avec les nœuds classiques. Les cas ont déjà été couvert par un post précédent. Les sentiments (qui sont proposés aux utilisateurs de NVivo Plus) et les relations (disponibles dans les éditions Pro et Plus) feront l’objet de posts à venir. Ce billet se concentrera – par ailleurs – sur le codage des Documents (du texte donc), réservant ainsi le codage des vidéos, des images et des feuilles de calcul à des développements ultérieurs.

Avant de commencer le codage, il est nécessaire d’avoir créé ou importé des Sources dans votre projet NVivo.

Qu’est-ce que le codage ?

Comme le montre Saldaña (2013), il existe de nombreuses techniques de codage. Même si Lyn et Tom Richards, les concepteurs de NVivo, affichent plutôt une appétence pour la théorisation enracinée, le logiciel n’impose pas à ses utilisateurs de méthode d’analyse particulière. Comme le montre ce sondage réalisé par QSR International (éditeur de NVivo) et publié par Adam Long (Chief Technology Officer chez QSR International), les utilisateurs du logiciel peuvent mobiliser des approches méthodologiques très diverses.

Les utilisateurs de NVivo peuvent mobiliser des approches méthodologiques très diverses.

Les utilisateurs de NVivo peuvent mobiliser des approches méthodologiques très diverses.

Cette situation s’explique par le fait que, contrairement à un logiciel d’analyse lexicale tel que Alceste ou Prospero, NVivo (et plus généralement les CAQDAS) n’analyse pas les données à la place du chercheur. Même s’il peut être facilité par le logiciel, même s’il peut être partiellement automatisé (nous reviendrons sur ce point ultérieurement), le codage reste fondamentalement une activité d’interprétation des données réalisée avec un cerveau humain, celui du chercheur.

Même si elle fait parfois partie des critères nécessaires à l’évaluation d’une recherche qualitative (voir notamment les guidelines RATS, utilisées en médecine), la mention du logiciel dans un article de recherche, une thèse de doctorat ou un mémoire de fin d’études n’apporte que peu d’indications quant à la façon dont le chercheur a analysé ses données.

Pour vous en rendre compte, voici une courte illustration. Imaginez qu’un écrivain célèbre (Michel Houellebecq par exemple) soit l’invité d’une émission de télévision et qu’il soit interrogé sur la façon dont il a écrit son dernier roman. Imaginez maintenant que l’écrivain réponde, sur un ton lapidaire, « eh bien, j’ai utilisé le logiciel Microsoft Word 2016 ». Ce commentaire ne manquerait pas de susciter l’hilarité du public et assurerait à son auteur des rediffusions récurrentes dans les bêtisiers de fin d’année pour les dix prochaines années. On attendrait en effet de la part de l’écrivain des détails sur le mode de rédaction de l’ouvrage, sur sa façon de se documenter ou encore, sur les personnes dont il s’est inspiré pour construire les personnages de son roman.

Bien entendu, la recherche qualitative n’est pas une œuvre de fiction (la bonne recherche qualitative en tous les cas :p), mais les enjeux liés à la traçabilité du processus d’élaboration des résultats sont assez proches de la situation décrite précédemment. Au-delà des critères utilisés pour rassurer le lecteur quant à la rigueur de son analyse (voir notamment Shah et Corley, 2006, pour les critères spécifiques à la théorisation enracinée et Avenier et Thomas, 2015, pour la comparaison de 4 postures épistémologiques), il s’agit de donner à voir le processus de collecte et d’analyse des données, d’ouvrir les cuisines de sa propre recherche (Allard-Poesi, 2003).

Avant même de mentionner le logiciel NVivo dans vos écrits, assurez-vous d’avoir retracé les étapes de votre processus de collecte et d’analyse des données, d’avoir couvert ce que Pratt (2009) qualifie de « basiques » de la méthodologie. Dans tous les cas, NVivo n’est ni une condition nécessaire, ni une condition suffisante pour produire une recherche de qualité (et susceptible d’être publiée dans les meilleures revues).

Il existe de nombreuses techniques de codage (Saldana, 2013) mais deux grandes façons de procéder  peuvent être mises en évidence (Angot et Milano, 2014; Bernard, 2006 ; Creswell, 2014 ; Grawitz, 2001). En suivant Allard-Poesi (2003), on qualifiera ces deux approches de codage a priori et de codage a posteriori.

Le codage a priori : Partir de la littérature pour définir la grille de codage

La grille de codage peut être construite sur la base de la littérature. Les nœuds correspondent alors à des catégories pré-existant à l’analyse. Charge au chercheur de les agencer afin de coder de façon systématique ses données. Comme l’explique Bernard (2006), ce type de démarche est par exemple utilisé par les chercheur mobilisant la méthode de l’analyse de contenu.

Cette approche qui se fonde sur le codage a priori peut se révéler piégeuse. En effet, dans la plupart des revues scientifiques, l’élément déterminant lorsqu’il s’agit de décider de la publication ou du rejet d’un article tient à la contribution de ce dernier. L’application d’un cadre théorique déjà bien établi à un terrain peu exploré peut difficilement déboucher sur une contribution suffisamment significative pour justifier une publication. Elle conduit inévitablement à la question « so what ? ». De même, il est difficile de prétendre valider ou invalider une théorie sur la base d’une étude qualitative, souvent réalisée sur des échantillons de taille trop réduite pour être considérés comme représentatifs (comme le rappellent Avenier et Thomas, 2015, une exception à ce principe peut être trouvée, sous certaines conditions, dans l’étude de cas multiple).

Pour sortir de cette impasse, les auteurs mobilisant un codage a priori cherchent souvent à accentuer le contraste entre la théorie pré-existante (celle qu’ils ont mobilisé pour construire leur grille de codage de départ) et leurs résultats, qui débouchent sur une conceptualisation renouvelée. Dès lors, le chercheur peut compléter et ré-agencer sa grille de codage pour rendre compte des éléments ayant émergé lors de l’analyse (Miles, Huberman et Saldaña, 2014 ; Romelaer, 2005). Par exemple, on pourra définir de nouvelles variations d’une catégorie, identifier de nouvelles propriétés pour appréhender un concept, ou encore mettre en évidence des conditions d’émergence non explorées dans la littérature. On peut imaginer par ailleurs que les catégories d’analyse soient les mêmes que celles préexistant dans la littérature mais que les relations entre ces catégories présentent un caractère novateur (le codage des relations fera l’objet d’un post ultérieur).

Les auteurs peuvent ainsi présenter un pré-modèle, construit sur la base de la littérature, à la fin de leur section théorique, l’enrichir au travers de l’analyse et proposer un modèle qu’ils jugent plus satisfaisant à la fin de leur travail recherche. L’article de Gemmell, Boland et Kolb (2012), qui est issu du champ de l’entrepreneuriat, est une bonne illustration de cette stratégie (même si le processus de codage y est peu explicité).

Si vous décidez de réaliser un codage a priori, veillez à bien mettre en évidence dans votre manuscrit les éléments qui ont émergé durant l’analyse de façon à les distinguer des éléments qui préexistaient. Vous pouvez par exemple utiliser des polices de caractère ou des couleurs différentes lorsque vous présentez votre grille de codage dans votre manuscrit.

Le codage a posteriori : Partir des données pour construire la grille d’analyse

La grille de codage peut également être construite sur la base des données. Les catégories de l’analyse se construisent alors au fur et à mesure du processus de recherche (la collecte et l’analyse des données pouvant, dans certains cas, se dérouler en parallèle et s’enrichir mutuellement selon un principe d’échantillonnage théorique).

La théorisation enracinée dans sa version glaserienne (Glaser et Strauss, 1967) et, dans une moindre mesure, dans sa version straussienne (Strauss et Corbin, 1998) correspond par exemple à ce type d’approche très tournée vers le theory building. Plus généralement, les approches visant à développer une grille d’analyse sur la base des données cherchent souvent à mettre en évidence un processus de conceptualisation progressive en distinguant des étapes de codage de premier niveau (first-order coding) très proches des données et des étapes de codage de deuxième niveau (second-order coding) qui sont davantage tournées vers l’abstraction (Gioia et al., 2013 ; Miles, Huberman et Saldaña, 2014, Saldaña, 2013, Van Maneen, 1979).

Il peut sembler plus simple de convaincre des lecteurs de l’intérêt de la contribution de la recherche en utilisant ce type d’approche. Les écueils possibles sont cependant nombreux. En effet, les lecteurs peuvent ne pas percevoir l’originalité de la conceptualisation proposée. Une deuxième difficulté tient à la nécessité de les convaincre du caractère réellement inductif de la démarche d’analyse. En effet, certaines catégories utilisées dans la grille de codage peuvent parfois rappeler des concepts déjà établis dans un autre domaine. Dans ce cas, les lecteurs pourront se demander si le chercheur a bien réalisé son analyse de façon inductive ou s’il avait déjà en tête des concepts pré-existants. Enfin, même lorsque la conceptualisation proposée est nouvelle et que le lecteur est convaincu qu’elle a été développée sur la base des données et non pas en fonction d’un schéma prédéfini, il faut démontrer qu’elle présente un intérêt suffisamment important pour pouvoir déboucher sur une publication (en insistant par exemple sur les pistes quelle permet d’ouvrir).

Le travail de Gioia, Price, Hamilton et Thomas (2010), toujours issu du champ du management, propose une démonstration convaincante de l’intérêt d’une contribution développée par le biais d’un codage a posteriori. La conceptualisation des auteurs est clairement formalisée et déclinée en propositions qui pourront être prolongées par la suite (par exemple dans une étude quantitative). Cette équipe de recherche a d’ailleurs publié récemment un article méthodologique permettant de retracer le processus de construction d’une recherche mobilisant la théorisation enracinée (Gioia et al., 2013).

Est-il possible de combiner ces deux approches ?

Bien entendu, ces approches peuvent être combinées (Avenier et Thomas, 2015). Certaines parties de la grille de codage peuvent ainsi être informées par la littérature et d’autres, émerger du terrain. Cependant, ces démarches consistant en un va-et-vient permanent entre la théorie et le terrain sont complexes à mettre en œuvre et se traduisent souvent par une mise en pratique peu lisible qui laisse le sentiment au lecteur d’un gloubi-boulga difficilement compréhensible.

Si vous décidez d’adopter une approche abductive (combinant des phases inductives et déductives), veillez à distinguer précisément les éléments qui sont issus de la littérature et ceux qui ont émergé du terrain. Cela se traduit dans l’exposé de la méthode par une description des phases de codage a posteriori et des phases de codage a priori afin de retracer le déroulement du processus d’analyse.

Deux approches possibles pour le codage dans NVivo

Les deux approches de codage peuvent se traduire par des processus d’analyse différents dans NVivo.

  • Dans le cas d’un codage a priori consistant à partir de la littérature pour construire sa grille de codage, il sera possible de commencer par créer les nœuds pour coder, dans un second temps, les documents dans NVivo.
  • Dans le cas d’un codage a posteriori, les nœuds seront construits par le chercheur en même temps que son analyse des données.

Les éléments qui suivent détaillent les principales étapes du codage selon chacune de ces deux approches.

Créer les nœuds pour analyser les documents

La création des nœuds  peut s’effectuer par le biais de l’onglet Créer (Create) du ruban de navigation. Pour créer un nouveau nœud, cliquez sur l’icône correspondante.

Vous pouvez utiliser le ruban de navigation pour créer des nœuds.

La boite de dialogue de création d’élément apparait alors. Elle vous permet de spécifier un nom et une description pour votre nœud. Même si elle reste facultative, la Description est ici un élément important que nous vous conseillons de renseigner pour spécifier une définition. En effet, lorsqu’un nœud désigne un concept (ce qui est le cas dans un codage a priori), il existe souvent différentes définitions possibles qui auront des conséquences sur le codage des données. N’hésitez pas à reporter la définition retenue dans le champ Description, quitte à la faire évoluer par la suite, ainsi que la référence du texte d’où la définition est issue. Dans le même ordre d’idée, vous pouvez également utiliser la description pour spécifier des instructions quant à l’utilisation ultérieure du nœud (ex : « utiliser ce nœud lorsque…, ne pas l’utiliser pour coder les passages renvoyant à… »).

Le champ Surnom (Nickname) ne présente pas un intérêt majeur. Il rappellera à certains d’entre-vous le bon vieux temps du codage manuel où les abréviations des chercheurs étaient inscrites sous formes d’accolades dans la marge des documents.

La description du nœud peut vous permettre de spécifier une définition.

Une fois créés, les nœuds sont accessibles par le biais du volet du même nom. Pour accédez à ce dossier, cliquez sur le volet Nœuds (Nodes) figurant dans la barre latérale et sélectionnez le dossier Nœuds (Nodes). Remarquons ici que ces deux éléments portent le même nom ce qui peut occasionner un certain nombre de confusions.

Le dossier Nœuds est accessible depuis la barre de navigation latérale.

Il est évidemment possible de créer des nœuds en utilisant le menu contextuel. Une fois positionnés dans le dossier Nœuds (Nodes), faites apparaître le menu contextuel en effectuant un clic droit sur un espace vide de la vue en liste et choisissez Nouveau nœud (New Node). Vous pouvez répéter l’opération pour créer autant de nœuds que vous le souhaitez.

Création d’un noeud via le clic droit dans la vue en liste.

Votre liste initiale de nœuds étant désormais constituée, vous pouvez commencer le codage. Il s’agit ici d’attribuer des segments de données (une phrase ou un paragraphe par exemple) à un ou plusieurs nœuds créés préalablement.

Commencez par ouvrir le document que vous souhaitez coder. Rendez-vous dans le dossier Éléments Internes (Internals) du volet Sources et double-cliquez sur le document à ouvrir. Une fois le document ouvert, sélectionnez un passage et glissez-le vers le nœud concerné. Le glisser-déposer (drag and drop) est la manière la plus simple de coder des données. Si utilisez le glisser-déposer, vous pouvez également créer un nouveau nœud en déplaçant la sélection vers l’intitulé « Faites glisser la sélection ici pour encoder vers un nouveau nœud ».

Le glisser-déposer (drag-and-drop) est la manière la plus simple de coder des données.

Vous pouvez alors double-cliquer sur le nœud que vous avez utilisé pour visualiser son contenu. Les références désignent le nombre de passages non contigus couverts par le nœud (ils dépendent donc de votre style de codage, plus ou moins fin). Le taux de couverture (coverage) désigne quant à lui le pourcentage des caractères d’un document couvert par un nœud. Enfin, les onglets latéraux vous permettent de modifier le mode de visualisation du contenu du nœud (voir plus bas).

Double-cliquez sur un nœud pour visualiser  son contenu.

Analyser les documents pour créer des nœuds

La codage peut également s’effectuer de façon émergente à partir du contenu des sources. Cette démarche de codage a posteriori à définir la grille d’analyse à partir des données.

Une fois que vous avez sélectionné un passage de texte à partir d’un document préalablement ouvert, vous pouvez utiliser l’onglet Analyser (Analyze) du ruban de navigation. Pour créer un Nouveau Nœud (New Node), cliquez sur le bouton correspondant dans la colonne Encoder la sélection (Code sélection at). Vous pouvez aussi utiliser des nœuds déjà créés par ce biais en cliquant sur le bouton, ou en affichant le menu déroulant, Nœuds Existants (Existing Nodes).

L’onglet Analyser (Analyze) du ruban de navigation vous permet de coder des segments de données.

Le codage peut également être réalisé à partir du texte par le biais du menu contextuel (clic droit sur le passage sélectionné) en déplaçant le curseur sur Encoder (Code Selection) et en choisissant un nœud ou en cliquant sur le bouton Nouveau Nœud (New Node). A l’usage, c’est cette manipulation que vous utiliserez certainement.

Le menu contextuel permet de coder des segments de données.

Le codage a posteriori peut très vite déboucher sur la création d’un très grand nombre de nœuds. Si cette démarche correspond aux prescriptions de certains auteurs (on renverra ainsi le lecteur à la notion de codage ouvert développée, notamment, par Strauss et Corbin, 1998), elle peut rapidement conduire à une analyse superficielle, reposant sur des nœuds à usage uniques très redondants les uns par rapport aux autres et essentiellement descriptifs. Nous verrons un peu plus loin comment sortir de cette phase foisonnante pour faire progresser l’analyse vers plus de conceptualisation.

Afficher les bandes d’encodage

Le codage dans NVivo ne présente aucune difficulté technique particulière. Cependant, il peut vite donner l’impression d’être un exercice à l’aveugle. Plutôt que d’explorer systématiquement les nœuds que vous utilisez pour vérifier que le codage a bien été réalisé, vous pouvez visualiser immédiatement les portions d’un document qui ont déjà été codées en affichant les Bandes d’Encodage (Coding Stripes).

Ces dernières sont accessibles par le biais de l’onglet Affichage (View) du ruban de navigation. Cliquez sur le bouton Bandes d’Encodage (Coding Stripes). Vous pouvez alors afficher les derniers nœuds utilisés pour coder les données en choisissant les Nœuds récemment encodés (Nodes Recently Coding). Cette option s’avère très pertinente pour suivre l’avancée du codage en temps réel.

Les bandes d’encodage vous permettent de visualiser le codage des données.

L’illustration qui précède donne un aperçu des bandes d’encodage. Ces dernières prennent la forme de barres de couleurs verticales correspondant aux différents nœuds utilisés pour coder la source. A ces bandes s’ajoute une bande de Densité d’encodage (Coding density) dont les teintes de gris varient en fonction du nombre de nœuds utilisés pour coder chaque partie de la source.

D’autres options de visualisation des bandes d’encodage sont disponibles. Vous pouvez ainsi afficher :

  • Une liste de nœuds à choisir parmi ceux qui composent votre grille de codage : Nœuds sélectionnés (Selected Items). Une boite de dialogue va alors apparaitre pour vous permettre de choisir les nœuds à afficher. Cette fonction est particulièrement pertinente lorsque les sources sont encodées avec des champs de littérature différents et que le chercheur va coder ses sources de façon séquentielle, d’abord avec un champ de littérature, puis un autre, etc.
  • Tous les nœuds encodés (All Nodes Coding). Dans ce cas, l’ensemble des nœuds utilisés pour coder le document vont apparaitre. Cette option n’est pas la plus lisible et est plutôt réservée lorsqu’on a un très petit nombre de Noeuds (disons moins de 10).
  • Les nœuds les plus utilisés pour coder le document : Nœuds les plus encodés (Nodes Most Coding).
  • Les nœuds les moins utilisés pour coder le document : Nœuds les moins encodés (Nodes Least Coding).
  • Uniquement la bande de Densité d’encodage (Coding Densité). Cette fonction est particulièrement intéressante lorsqu’on souhaite par exemple s’assurer que l’ensemble d’un document a été codé. Une recherche sur la bande d’encodage permet de voir si certains passages auraient été oubliés.

Désencoder un segment de données

Les bandes d’encodage constituent par ailleurs le moyen le plus efficace de désencoder un segment de données. Vous pouvez ainsi supprimer le lien entre un passage et un nœud en affichant le menu contextuel (clic droit) à partir de la bande d’encodage que vous souhaitez retirez et en cliquant sur Désencoder (Uncode).

Les bandes d’encodage constituent le moyen le plus rapide de désencoder un segment de données.

Vous pouvez également sélectionner un segment de données (soit à partir d’une source, soit à partir d’un nœud) et utiliser l’onglet Analyser (Analyze) ou le menu contextuel (clic droit sur la sélection) pour procéder au désencodage. Ce dernier peut concerner :

  • Une sélection de nœuds cochés par vos soins : Décoder la Sélection aux Nœuds Existants (Uncode Selection at Existing Nodes).
  • Le nœud que vous êtes en train d’explorer (si vous êtes en train d’explorer un nœud) : Décoder la Sélection à ce Nœud (Uncode Selection at This Node).
  • Un des nœuds parmi les derniers vous venez d’utiliser.

Le désencodage peut également être réalisé par le biais de l’onglet Analyser du ruban de navigation.

Faire évoluer la grille d’analyse

Les premières phases de codage vous conduiront apporter des modifications importantes à votre grille de codage. Nous allons voir que NVivo offre une panoplie d’outils permettant de mener à bien ce travail d’évolution et de stabilisation de la grille de codage.

Changer l’intitulé des nœuds

Lors des phases de construction de la grille de codage, plusieurs tentatives sont souvent nécessaires pour arrêter les intitulés des nœuds et stabiliser la définition des catégories. Pour modifier le nom d’un nœud, commencez par le sélectionner (clic simple) et faites à nouveau un clic simple sur son intitulé. Vous pouvez également éditer les propriétés d’un nœud par le biais du menu contextuel (clic droit sur le nœud que vous souhaitez modifier) en cliquant sur Propriétés du nœud (Nodes Properties). Les changements d’intitulés des nœuds n’ont pas d’influence sur le codage réalisé préalablement. Nous vous conseillons donc de ré-explorer régulièrement les nœuds pour vérifier que leurs intitulés reflètent bien les données couvertes.

Fusionner des nœuds

La construction de la grille de codage conduisent souvent à la création de nombreux nœuds. Ce phénomène est particulièrement fréquent lors des premières phases de codage, en particulier si ces dernières sont relativement descriptives. Dès lors, il est possible que le chercheur se rende compte, avec un petit peu de recul, que certains nœuds sont redondants. NVivo offre la possibilité de fusionner des nœuds et ainsi, d’opérer une consolidation de la grille de codage.

Commencez par sélectionner le nœud que vous souhaitez fusionner par le biais du clic simple. Vous pouvez alors utiliser le bouton Couper (Cut) qui se situe dans l’onglet Début (Home) du ruban de navigation. Pour couper un nœud, vous pouvez également utiliser le menu contextuel (clic droit sur le nœud).

Vous pouvez couper un nœud par le biais du menu contextuel.

Vous pouvez couper un nœud par le biais du menu contextuel.

Il faut alors sélectionner le nœud « destination » et cliquer sur le bouton Fusionner (Merge) qui figure dans l’onglet Début (Home) du ruban de navigation (cette fonctionnalité est – bien sûr – également accessible par le biais du menu contextuel). Le codage réalisé à l’aide du premier nœud (celui que vous avez coupé) est alors transféré au nœud destination.

merge node

La fusion des nœuds peut également s’opérer par le biais du menu contextuel.

Revisiter les nœuds et tester leur cohérence

La signification des nœuds est susceptible d’évoluer de façon rampante durant l’analyse. Une catégorie clairement définie au début de l’analyse peut, au fur et à mesure du codage, commencer à abriter des segments de données sans lien évident avec la définition initiale. Des segments sans rapports les uns avec les autres peuvent alors être couverts par un même nœud et les catégories de la grille de codage peuvent perdre de leur cohérence.

Pour éviter ce problème, il est nécessaire de revisiter régulièrement les nœuds au cours de l’analyse. Pour visualiser le contenu d’un nœud, il vous suffit de double-cliquer sur ce dernier. Si les références vous semblent trop courtes pour pouvoir comprendre pourquoi elles ont été rattachées au nœud, vous avez la possibilité d’afficher le contexte environnant (les termes qui précèdent et qui suivent la référence par exemple) en affichant le Contexte d’encodage (Coding context).

La fonctionnalité "contexte d'encodage" vous permet de visualiser les termes qui précèdent et suivent une référence.

La fonctionnalité « contexte d’encodage » vous permet de visualiser les termes qui précèdent et suivent une référence.

Pour afficher le contexte d’encodage, faites apparaitre le menu contextuel (clic droit sur la référence), déplacez le curseur sur Contexte d’encodage (Coding Contexte) et choisissez une des options de visualisation disponible.

  • Contexte restreint (Narrow Context) : Les 5 mots précédant et les 5 mots suivant la référence.
  • Contexte étendu (Broad Context) : Le paragraphe environnant.
  • Personnaliser (Custom) : Une boite de dialogue apparait.
  • Source entière (Entire Source) : L’intégralité de la source originale.

Le contexte apparait alors en gris (le texte de la référence apparaissant en noir). Vous pouvez alors étendre manuellement le codage en sélectionnant une portion plus large du texte et en la codant à nouveau (rassurez-vous, le texte ne sera codé qu’une seule fois). La fonctionnalité Étendre l’encodage (Spread Coding), elle aussi accessible depuis le menu contextuel, permet également d’inclure le contexte dans le codage d’une référence.

Coder à partir des nœuds

En ré-explorant les nœuds, le chercheur peut découvrir de nouvelles catégories d’analyse ou préciser des catégories existantes. Dans NVivo, il n’est pas forcément utile de retourner dans le document source pour coder des données. En effet, le codage peut s’opérer indistinctement depuis une source ou depuis le contenu d’un nœud. Dès lors, une stratégie de codage peut consister à identifier dans un premier temps des thématiques relativement larges (ces thématiques pouvant, dans le cas d’un entretien semi-directif, renvoyer au guide d’entretien) et à les utiliser pour opérer un codage plus fin dans un second temps à l’aide de sous-catégories (voir ci-après).

Définir des nœuds parents et des nœuds enfants

Comme l’expliquent Strauss et Corbin (1998, p.148), « une fois que les concepts commencent à s’accumuler, l’analyste doit commencer par les regrouper ou les catégoriser sous des termes explicatifs plus abstraits ». Dans NVivo, les catégories les plus larges sont qualifiées de Nœuds Parents (Parent Nodes) et les sous-catégories de Nœuds Enfants (Child Nodes). Pour créer un nœud enfant, commencez par identifier le nœud parent auquel vous souhaitez le rattacher. Faites apparaître le menu contextuel et cliquez sur Nouveau Nœud (New Node).

Création d'un noeud enfant en effectuant un clic droit sur le noeud parent.

Création d’un nœud enfant en effectuant un clic droit sur le nœud parent.

Vous pouvez également déplacer un nœud existant vers un nœud parent par le biais du glisser-déposer ou du couper-coller. Dans ce cas, commencez par coupez le nœud enfant par le biais du bouton situé dans l’onglet Début (Home) du ruban de navigation ou du menu contextuel (clic droit sur le nœud à déplacer). Vous pourrez ensuite le Coller (Paste) soit par le biais du ruban de navigation (en sélectionnant préalablement le nœud parent), soit par le biais du menu contextuel (clic droit sur le nœud parent).

NVivo n’impose pas de limite quand au nombre de niveaux hiérarchiques servant à organiser la grille de codage. Gardez cependant en mémoire que la multiplication des niveaux hiérarchique conduit à complexifier la grille de codage et peut vite devenir un obstacle à l’analyse. Pour vous faciliter la tâche, nous vous conseillons de vous limiter à deux ou trois niveaux hiérarchiques et d’adopter le même type de structuration pour l’ensemble des nœuds de la grille de codage.

Agréger l’encodage

L’organisation hiérarchique des nœuds dans NVivo n’a, par défaut, pas d’incidence sur le codage des données : le codage effectué dans les nœuds enfants ne se répercute pas automatiquement dans les nœuds parents. La fonction Agréger l’encodage à partir des nœuds enfants (Aggregate coding from child nodes) permet de modifier ce paramètrage et de transformer l’arborescence des nœuds en une grille d’analyse dynamique dans laquelle le codage des nœuds enfants se retrouve aussi dans les nœuds parents.

Pour activer l’agrégation de l’encodage à partir des nœuds enfants, vous pouvez soit utiliser le menu contextuel (clic droit sur le nœud parent), soit afficher les propriétés du nœud parent et cocher la case correspondante.

L'agrégation du codage vous permet de construire une grille d'analyse dynamique.

L’agrégation du codage vous permet de construire une grille d’analyse dynamique.

L’agrégation du codage est réversible : vous pouvez la désactiver pour désynchroniser le codage des nœuds parents et des nœuds enfants. Dans le même ordre d’idée, le changement du rattachement hiérarchique d’un nœud enfant se répercutera sur le codage des nœuds parents.

Enjeux méthodologiques liés à l’organisation hiérarchique des nœuds

L’organisation hiérarchique de la grille d’analyse en nœuds parents et en nœuds enfants permet de poser la question de la nature du lien entre ces éléments. Sur la base des travaux de Le Ny (2005), nous distinguons ici deux types de logiques permettant d’organiser les nœuds de façon hiérarchique : la logique extensive et la logique intensive (Garreau, 2009).

La logique extensive consiste à utiliser les nœuds enfants pour identifier toutes les variations possibles d’une catégorie. Comme l’explique Lejeune (2014), la catégorie est ici destinée à un exercice de classement. La catégorie des ustensiles de cuisines (nœud parent) peut ainsi se décliner en des sous-catégories (nœuds enfants) telles que la fourchette, la spatule, la casserole, le couteau ou encore la cocotte-minute. Dans cette logique, les sous-catégories sont mutuellement exclusives : un même objet ne pouvant pas être à la fois une fourchette… et une cocotte-minute.

La logique intensive consiste, quant à elle, à délimiter les contours de la catégorie principale (nœud parent)  à l’aide de propriétés et de dimensions (nœuds enfants) selon le principe des idéaux-types (Weber, 1904). La catégorie principale se présente ici comme une représentation simplifiée du phénomène étudié. Le concept de chat pourra ainsi faire intervenir plusieurs propriétés : le chat a des poils, il miaule, ronronne, aime se faire les griffes sur mon canapé et a un tempérament indépendant. Bien entendu, certains spécimens de chats pourront faire figure d’exception (un chat aphone par exemple) mais le cumul de ces propriétés donne ici une bonne idée de ce qu’est un chat. La création d’une sous-catégorie n’implique d’ailleurs, pas forcément, d’avoir identifié la catégorie supérieure. On peut très bien identifier un organisme vivant qui a des poils dans les données sans qu’il s’agisse d’un chat.

Ces deux logiques correspondent souvent à des phases différentes de l’analyse. Si la logique extensive, fondée sur le classement, peut être utile en début d’analyse pour organiser et s’approprier les données, la logique intensive traduit souvent une progression dans la conceptualisation.

Même si elles débouchent toutes les deux par la création de nœuds parents et de nœuds enfants, la logique extensive et la logique intensive ne reposent pas sur le même type de lien. Dans le cas d’une logique extensive, les nœuds enfants permettent de préciser le nœud parent, de mettre en évidence plusieurs variations possibles. Dans le cas d’une logique intensive, ils permettent de définir le nœud parent, d’en préciser la signification.

La coexistence de ces deux logiques au sein d’une même grille d’analyse peut être une source de confusions chez le lecteur comme chez le chercheur qui est en train de réaliser l’analyse. Nous vous conseillons donc de préciser la logique retenue, tant au cours de votre travail d’analyse (par exemple en créant un mémo recensant vos procédures de codage) que dans l’exposé final de votre méthode au sein d’un document scientifique.

Quelques conseils liés au codage dans NVivo

Avant de vous lancer, voici quelques conseils pour réaliser le codage des données dans de bonnes conditions.

Définissez votre unité de codage

La question de l’unité de codage renvoie au choix réalisé par le chercheur de sélectionner des mots, des phrases ou des paragraphes lors du codage des données (Allard-Poesi, 2003). Lors du codage de documents texte, l’utilisation d’Nvivo n’impose pas d’avoir préalablement défini votre unité de codage. Le logiciel vous permet de définir des passages de longueurs variables.

Même si cette approche apporte une certaine flexibilité à l’analyste, elle peut poser des problèmes de stabilité des procédures de codage. Un même analyste pourra ainsi, au début de l’analyse, avoir tendance à sélectionner des passages relativement larges et à faire des sélections plus fines en fin d’analyse. Dans l’absolu, il ne s’agit pas d’un problème insurmontable car il est toujours possible, à partir des nœuds, de revenir aux sources originales ou d’afficher le contexte. Cependant, le « style de codage » (large ou fin) aura plusieurs répercussions sur le processus d’analyse :

  • L’unité de codage impacte directement le nombre de références couvertes par les nœuds. Dans le cas d’un codage très fin, le nombre de références tend mécaniquement à augmenter. Si vous envisagez de quantifier votre analyse et d’utiliser l’indicateur du nombre de références (qui permet de mesurer le nombre de fois où un nœud apparait), nous vous conseillons de définir précisément votre unité de codage et de vous y tenir tout au long de l’analyse.
  • Le style de codage peut avoir des conséquences sur le croisement des nœuds. En effet, plus le style de codage est fin, moins les passages où des nœuds se chevauchent sont nombreux. Ces passages constituent la matière première des matrices d’encodage. Si vous envisagez d’explorer les intersections entre plusieurs concepts (et éventuellement de quantifier ces intersections), nous vous conseillons d’adopter une unité de codage relativement large telle que le paragraphe par exemple.
  • L’unité de codage dépend en grande partie des petites habitudes de l’analyste. Si vous envisagez de réaliser le codage à plusieurs (par exemple en vous répartissant les sources à analyser), la question de l’harmonisation des styles de codage entre les différents membres de l’équipe doit être un point de vigilance. Cet aspect sera particulièrement critique si vous envisagez de procéder à une comparaison du codage réalisé par les différents chercheurs prenant part au projet et de quantifier le taux de fiabilité intercodeurs (intercoder reliability). Une divergence dans les styles de codage pourra être à l’origine de désaccords et se traduire par un taux de fiabilité médiocre, quand bien même il n’y aurait aucun désaccord entre les membres de l’équipe sur la définition des catégories et sur la sélection des segments de données.

Evitez le fétichisme du codage

Dans NVivo, la création de nœuds est extrêmement aisée. Dès lors, le chercheur peut être tenté de créer plus de catégories que nécessaires dans la grille de codage (Bandeira de Mello et Garreau, 2011, Lejeune, 2014 ; Richards, 2014, Richards et Morse, 2012). Le nombre de catégories n’est pas un critère de qualité d’une recherche. Lorsque la création des nœuds se mue en fétichisme du codage (une pathologie que Lejeune, 2014, qualifie de codomanie), elle peut même devenir un obstacle à l’analyse.

Lors des phases préparatoires de codage, le risque est en effet de s’enliser dans une analyse purement descriptive et de s’éloigner de la réflexion et de l’interprétation des données. Comme le précise Richards (2014), les phases de codage les plus descriptives doivent toujours être au service d’un exercice de conceptualisation ultérieur. Si le codage devient mécanique et ennuyeux, c’est probablement qu’il est temps de réduire le nombre de catégories présentes dans la grille de codage.

La multiplication des nœuds a aussi pour effet de complexifier la grille de codage. Au-delà du temps alloué au codage – qui risque d’augmenter de façon démesurée – les définitions des catégories et les procédures de codage peuvent devenir de plus en plus flottantes. L’utilisation d’une grille de codage simple et claire vous permettra d’éviter ce piège et de garantir la rigueur de vos procédures d’analyse.

Enfin, plus une grille de codage est complexe, plus elle est difficile à expliquer à une personne extérieure au projet de recherche. Une seule solution pour garantir la traçabilité de votre codage : keep it simple!

Créez des sous-dossiers correspondant à votre processus de codage

Nous l’avons expliqué précédemment : l’utilisation de NVivo n’est pas une garantie du rigueur du processus de codage. Au final, c’est la rigueur et la traçabilité du processus de collecte et d’analyse des données qui permettront de convaincre vos lecteurs du sérieux de vos résultats.

Le codage des données prend souvent la forme d’un processus séquentiel. Les phases de codage peuvent correspondre à la dichotomie classique « codage de premier niveau vs. codage de deuxième niveau » (Miles, Huberman et Saldaña, 2014). Le processus de codage peut également reprendre les étapes de la théorisation enracinée que sont le codage ouvert, le codage axial et le codage sélectif (Strauss et Corbin, 1998). Il peut, encore, laisser apparaitre une phase de codage descriptif largement automatisée, une phase de codage des topics et une phase de codage analytique (Richard, 2014). Quelles que soient les étapes de votre analyse, il est important que ces dernières puissent être accessibles dans votre projet NVivo. Un projet bien organisé est souvent synonyme d’un processus d’analyse clair 🙂

La solution la plus simple consiste à adopter une organisation, dans votre projet NVivo, qui corresponde au design de votre processus de recherche. Créez des sous-dossiers de nœud correspondant à chaque étape de l’analyse et conservez des copies des catégories que vous avez utilisé, même lorsque celles-ci n’apparaissent plus dans la conceptualisation ou la modélisation finale. Vous pourrez ainsi rendre compte de votre processus d’analyse facilement lors de la phase de rédaction.

Créez un nœuds « Best of »

La restitution des résultats d’une recherche passe souvent par l’utilisation d’extraits de données, de verbatims. Ces citations ne sont jamais choisies au hasard. Elles font l’objet d’une sélection minutieuse par le chercheur. On pourra ainsi mettre de côté les verbatims idiosyncratiques, au motif qu’ils ne reflètent pas vraiment le contenu des données ou encore, privilégier les citations les plus facilement compréhensibles par un lecteur extérieur au terrain étudié, les plus concises et les plus illustratives.

Pour faciliter le travail de rédaction, nous vous conseillons, de créer un nœud « Best of » qui vous permettra d’inventorier les citations ayant vocation à faire l’objet d’une restitution. Ce codage peut commencer dès le début de l’analyse et avant même l’émergence des catégories les plus conceptuelles.

Lorsque vous rédigerez les résultats de la recherche, il suffira de ré-explorer le nœud « Best-of » pour retrouver les meilleurs verbatims. Les requêtes de codage vous permettront d’isoler les citations les plus illustratives en croisant le nœud « Best-of » avec les autres catégories de la grille de codage.

Créez un nœud « Frigidaire »

Au cours de l’analyse, il arrive souvent qu’un passage semble intéressant, qu’il n’existe aucune catégorie dans notre grille de codage à laquelle il puisse se rattacher et que vous n’ayez aucune idée quant au nœud que vous pourriez créer.

Dans ces situations, nous vous conseillons de créer un nœud transitoire (que nous avons baptisé « Frigidaire »). Ce nœud aura pour fonction d’inventorier les passages devant être ré-analysés ultérieurement. Une fois que votre grille de codage sera stabilisée, vous pourrez ré-explorer sereinement ces passages. Entre temps, de nouvelles catégories seront probablement apparues, ce qui permettra de trouver une place aux extraits qui avaient du mal à trouver une catégorie de rattachement au début de l’analyse.

Références citées

Partager cet article Share on FacebookShare on Google+Tweet about this on TwitterShare on LinkedIn
2 commentaires… add one
  • Clarisse Fév 24, 2016

    Merci pour cet article, très utile pour ma part!!
    (A propos de la hiérarchie des noeuds de codages et des logiques extensive ou intensive, au paragraphe 5, je pense qu’il y a une petite erreur à corriger: « Dans le cas d’une logique extensive » répété deux fois.)

    • Lionel Mar 17, 2016

      Bonjour, merci pour ce signalement, nous venons de procéder à la correction. Effectivement, la dernière phrase s’entend dans une logique intensive et non extensive.

Écrire un commentaire