Download Les camemberts, mode d`emploi Les camemberts, mode d
Transcript
Les camemberts, mode d‘emploi Anke Grutschus Beate Kern 1. Méthodologie • outil d‘analyse pour les données rassemblées dans les grilles • calcul basé sur les valeurs log-likelihood normalisés • illustration du poids/de la répartition des différentes dimensions de chaque champ lexical • notre but: rendre plus systématique l‘analyse „par camemberts“ 2. Différents niveaux d‘analyse à tous les niveaux, tri par dimensions sémantiques: Critères de sélection But de l‘analyse toutes langues & toutes catégories confondues tri par catégories, toutes langues confondues tri par langues, toutes catégories confondues tri par langues et par catégories tri par langues, catégories et valeurs comparer les champs entre eux déceler le partage des tâches entre les catégories comparer le profil du champ entre les langues différences d‘ordre „typologique“ entre les langues différenciations fines à l‘intérieur des dimensions 3. Tri par catégories (déception) contrôle, causativité et verbalisation uniquement attestés pour les noms 4. Tri par langues (déception) verbalisation plus spécifique en anglais qu‘en allemand 5. Tri par langues et catégories (déception) polarité réparti régulièrement sur les catégories en anglais 5. Tri par langues et catégories (déception) polarité se concentre essentiellement sur les verbes en français 6. Tri par langues, catégories et valeurs (déception) 79%fort 21%faible 93%fort 7%faible 94%fort 6%faible Intensité comme dimension très importante dans toutes les langues et dans toutes les catégories forte est toujours prépondérante au sein de la dimension 6. Tri par langues, catégories et valeurs (déception) aspect plus spécifique en allemand qu‘en français 6. Tri par langues, catégories et valeurs (déception) phasique:terminatif – valeur aspectuelle la plus spécifique pour les noms français phasique:inchoatif – valeur aspectuelle la plus spécifique pour les noms allemands dans les deux langues: prépondérance de phasique pour les noms 6. Tri par langues, catégories et valeurs (déception) ponctuel:itératif – valeur aspectuelle la plus spécifique pour les verbes français et allemands répartition: phasique > noms, ponctuel:itératif > verbes cette répartition n‘existe pas pour l‘anglais et l‘espagnol 7. Perspectives • Noms comme catégorie de départ de l‘analyse – ils représentent toute la variété des dimensions – ils sont plus riches en collocations que les autres catégories • Analyse des verbes et des adjectifs dans une deuxième étape et en fonction des résultats de l‘analyse nominale 7. Perspectives • Dimension expérienciation – importance assez élevée de la dimension expérienciation pour les verbes et les adjectifs (jusqu‘à 90%) – certains collocatifs (verbes support, négation) avec des logs assez élevés – catégorie assez hétérogène • Besoin d‘harmoniser le codage • Est-ce que expérienciation risque de bloquer la vue sur les autres dimensions lors de l‘analyse des verbes et des adjectifs ? Est-ce qu‘il faudrait evtl. exclure expérienciation de l‘élaboration des camemberts ? 200 0 adversaire; 92 100 little; 199,687 life; 193,052 grudging; 161,687 too; 169,528 understanding; 170,815 lose; 176,845 tradition; 133,626 reverence; 117,616 proper; 117,969 regard; 126,218 elders; 130,215 attitude; 130,608 people; 407,408 some; 355,871 all; 365,551 any; 373,308 dignity; 310,725 greater; 188,214 healthy; 148,715 crainte; 46,998 plein; 47,366 croyance; 48,864 reconnaissance; 49,845 courtoisie; 53,783 parler; 54,853 religieux; 56,046 question; 59,208 pudeur; 69 simple; 74,48 estime; 77,53 éprouver; 80,85 miminum; 84 300 manquer; 291,425 400 love; 251,047 tenir; 203 500 appeler; 146 • Rappel : • L‘analyse des camemberts devrait être accompagnée d‘une analyse des profils combinatoires de lexèmes chosis centrée sur les données linguistiques plus concrètes tolérance; 540,685 600 no; 583,55 humain; 482,025 7. Perpectives 700