Download Les camemberts, mode d`emploi Les camemberts, mode d

Transcript
Les camemberts,
mode d‘emploi
Anke Grutschus
Beate Kern
1. Méthodologie
• outil d‘analyse pour les données
rassemblées dans les grilles
• calcul basé sur les valeurs log-likelihood
normalisés
• illustration du poids/de la répartition des
différentes dimensions de chaque champ
lexical
• notre but: rendre plus systématique
l‘analyse „par camemberts“
2. Différents niveaux d‘analyse
à tous les niveaux, tri par dimensions
sémantiques:
Critères de sélection
But de l‘analyse
toutes langues & toutes
catégories confondues
tri par catégories, toutes
langues confondues
tri par langues, toutes
catégories confondues
tri par langues et par
catégories
tri par langues, catégories
et valeurs
comparer les champs entre
eux
déceler le partage des tâches
entre les catégories
comparer le profil du champ
entre les langues
différences d‘ordre „typologique“ entre les langues
différenciations fines à
l‘intérieur des dimensions
3. Tri par catégories (déception)
contrôle, causativité et verbalisation
uniquement attestés pour les noms
4. Tri par langues (déception)
verbalisation plus spécifique en anglais qu‘en allemand
5. Tri par langues et catégories
(déception)
polarité réparti régulièrement sur les
catégories en anglais
5. Tri par langues et catégories
(déception)
polarité se concentre essentiellement sur
les verbes en français
6. Tri par langues, catégories et valeurs
(déception)
79%fort 21%faible
93%fort 7%faible
94%fort 6%faible
Intensité comme dimension très importante dans toutes
les langues et dans toutes les catégories
forte est toujours prépondérante au sein de la
dimension
6. Tri par langues, catégories et valeurs
(déception)
aspect plus spécifique en allemand qu‘en français
6. Tri par langues, catégories et valeurs
(déception)
phasique:terminatif – valeur aspectuelle la plus spécifique pour les noms français
phasique:inchoatif – valeur aspectuelle la plus spécifique pour les noms allemands
dans les deux langues: prépondérance de phasique pour les noms
6. Tri par langues, catégories et valeurs
(déception)
ponctuel:itératif – valeur aspectuelle la plus spécifique pour les verbes
français et allemands
répartition: phasique > noms, ponctuel:itératif > verbes
cette répartition n‘existe pas pour l‘anglais et l‘espagnol
7. Perspectives
• Noms comme catégorie de départ de
l‘analyse
– ils représentent toute la variété des
dimensions
– ils sont plus riches en collocations que les
autres catégories
• Analyse des verbes et des adjectifs dans
une deuxième étape et en fonction des
résultats de l‘analyse nominale
7. Perspectives
• Dimension expérienciation
– importance assez élevée de la dimension expérienciation pour
les verbes et les adjectifs (jusqu‘à 90%)
– certains collocatifs (verbes support, négation) avec des logs
assez élevés
– catégorie assez hétérogène
• Besoin d‘harmoniser le codage
• Est-ce que expérienciation risque de bloquer la vue
sur les autres dimensions lors de l‘analyse des
verbes et des adjectifs ? Est-ce qu‘il faudrait evtl.
exclure expérienciation de l‘élaboration des
camemberts ?
200
0
adversaire; 92
100
little; 199,687
life; 193,052
grudging; 161,687
too; 169,528
understanding; 170,815
lose; 176,845
tradition; 133,626
reverence; 117,616
proper; 117,969
regard; 126,218
elders; 130,215
attitude; 130,608
people; 407,408
some; 355,871
all; 365,551
any; 373,308
dignity; 310,725
greater; 188,214
healthy; 148,715
crainte; 46,998
plein; 47,366
croyance; 48,864
reconnaissance; 49,845
courtoisie; 53,783
parler; 54,853
religieux; 56,046
question; 59,208
pudeur; 69
simple; 74,48
estime; 77,53
éprouver; 80,85
miminum; 84
300
manquer; 291,425
400
love; 251,047
tenir; 203
500
appeler; 146
• Rappel :
• L‘analyse des camemberts devrait être
accompagnée d‘une analyse des profils
combinatoires de lexèmes chosis
centrée sur les données linguistiques plus
concrètes
tolérance; 540,685
600
no; 583,55
humain; 482,025
7. Perpectives
700