Corpus

colaje

Dans le cadre du Projet ANR COLAJE, nous utilisons plusieurs outils pour analyser les données.

L'un d'entre eux est le programme CLAN du Projet CHILDES.

CLAN

Voici les commandes que nous utilisons le plus fréquemment :

    • MLU : permet de calculer la longueur moyenne des énoncés des locuteurs (enfants ou adultes)
    • FREQ : permet de calculer des fréquences de formes
    • COMBO : permet de retrouver des séquences de caractères dans leur co-texte et leur contexte de production

 

 

Les commandes de CLAN se lancent à partir de la fenêtre de commandes :
menu Windows > Commands ou CTRL+D

  1. En cliquant sur "working", on choisit le dossier dans lequel se situent les transcriptions à analyser.
  2. En cliquant sur "lib" et "mor lib", on spécifie où se trouve le dossier "lib" de CLAN, qui s'est téléchargé automatiquement lors de l'installation de CLAN (il faut donc retrouver l'endroit où on a installé CLAN sur notre ordinateur).
  3. Puis on écrit la commande dans l'espace prévu à cet effet, là où le curseur clignote.

 

Pour que les commandes de CLAN fonctionnent, il faut utiliser une syntaxe particulière, dont les exemples suivants sont des illustrations :

                   
Nom de la commande Option 1

Option
2

Option 3 Option 4

Nom
du fichier

Résultat Obtenu
             
MLU   -t%mor     ANAE-2_10_24.cha Longueur Moyenne des Enoncés (en mots) transcrits sur la ligne principale de tous les participants de l'enregistrement à 2;11
MLU +t*CHI -t%mor     ANAE-2_10_24.cha Longueur Moyenne des Enoncés (en mots) transcrits sur la ligne principale d'ANAE à 2;11
MLU +t*CHI -t%mor     ANAE*.cha Longueur Moyenne des Enoncés (en mots) transcrits sur la ligne principale d'Anaé dans TOUS LES FICHIERS dont le nom commence par ANAE et se termine par l'extension .cha dans le dossier préalablement spécifié dans "Working" de la fenêtre de commandes
MLU +t*CHI -t%mor -sxx -syy ANAE-2_10_24.cha Longueur Moyenne des Enoncés (en mots) transcrits sur la ligne principale d'Anaé à 2;11, excluant les éléments transcrits "xx" et "yy"
             
FREQ +t*CHI       ANAE-2_10_24.cha Liste des mots produits par Anaé à 2;11, fréquence de chaque forme, nombre de mots différents, nombre total de mots et TTR
FREQ +t*CHI +snon     ANAE-2_10_24.cha Nombre de "non" produits par Anaé à 2;11
FREQ +t*CHI +snon +spas   ANAE-2_10_24.cha Nombre de "non" et de "pas" produits par Anaé à 2;11
FREQ +t*CHI +smoi^je     ANAE-2_10_24.cha Nombre de "moi" IMMEDIATEMENT SUIVIS DE "je" produits par Anaé à 2;11
FREQ +t*CHI +smoi^*^je     ANAE-2_10_24.cha Nombre de "moi" suivis IMMEDIATEMENT OU A DISTANCE de "je" produits par Anaé à 2;11
             
COMBO +t*CHI +snon     ANAE-2_10_24.cha Enoncés dans lesquels "non" a été produit par Anaé à 2;11
COMBO +t*CHI +snon+pas     ANAE-2_10_24.cha Enoncés dans lesquels "non" ou "pas" ont été produits par Anaé à 2;11
COMBO +t*CHI +snon +w2 -w2 ANAE-2_10_24.cha Enoncés dans lesquels "non" a été produit par Anaé à 2;11, en incluant dans le fichier de résultats les deux énoncés précédant la production du "non" et les deux énoncés suivant la production
             

Et il en existe beaucoup d'autres encore !

Toutes les commandes sont décrites dans le guide CLAN de CHILDES. Des fiches pratiques ainsi que des tutoriels vidéos sont également en cours de réalisation dans le cadre du Projet ANR COLAJE.

Nous utilisons également d'autres programmes comme PRAAT, PHON, ELAN, EXCEL, ...



logo ANR       logo Sorbonne Nouvelle       logo Modyco       logo STL UMR 8163

Ce site a été réalisé et est hébergé par le Risc  logo Risc