Accueil > Equipes > TALN > Projets > Blogoscopie > Lexique de l’évaluation

Lexique de l’évaluation

Nature du Lexique

Le lexique de l’évaluation se présente comme l’intégration structurée d’informations lexicales et sémantiques autour des valeurs prises par les termes lors de leurs apparitions en contexte. La typologie de l’évaluation retenue pour former ces entrées est basée sur la théorie des modalités discursives de (Charaudeau,1992).

Les termes du lexique ont été extraits du corpus annoté de 200 billets et leurs commentaires issus de blogs de la plateforme Overblog sur des thèmes variés (comme le cinéma, la politique, le développement durable, le sélectionneur de l’équipe de France de football, etc.) présenté dans la
section corpus.

L’étude des évaluations présentes dans ce corpus a mis en lumière quelques attentions à prendre en compte lors de la constitution du lexique. Des choix empiriques guidés par l’usage ont été mis en place, centrés sur l’ambiguïté d’interprétation et la désambiguïsation morpho-syntaxique :

  • Lorsqu’un terme est présent dans une appréciation contenant une tournure négative (ex : pas sympa - appréciation défavorable), la polarité de l’évaluation associée à ce terme est inversée (sympa- appréciation favorable),
  • Les collocations et les expressions figées sont pris en compte comme entrées lexicales (ex : hommage vibrant, tenir en haleine),
  • Les ambiguïtés d’interprétation sont prises en compte, tant sur la polarité que sur le type d’évaluation où l’on peut retrouver l’entrée lexicale (ex : fou peut être présent dans des appréciations favorables ou défavorables),
  • Les termes dont la sémantique est subjective mais non intrinsèquement positive ni négative (un vin fruité) ne sont à ce stade pas pris en compte dans le lexique.

Au final, le lexique de l’évaluation contient 982 entrées lexicales dont 54 ambigües dont la majorité des termes évaluatifs sont des adjectifs :

CatégorieNb d’entréesdont ambigues
Adjectif49326
Nom1663
Adverbe609
Verbe19215
Syntagme Verbal240
Autres471
Total98254

Format du Lexique

Le lexique de l’évaluation est utilisable sous licence LGPLLR sous format XML.
Chaque entrée lexicale du lexique évaluatif se caractèrise par des informations :

  • morpho-syntaxiques (morpho) : son lemme ou sa décomposition, sa catégorie grammaticale, ses éventuelles variantes orthographiques ;
  • sémantiques (evaluation) : énumération des différentes valeurs évaluatives prises par les termes lors de leur apparition en contexte (type d’évaluation et catégorisation axiologique) ;
  • sur les contextes d’apparition (attestation) : terme issu du corpus annoté, d’un ajout manuel ou d’un ajout automatique.

Exemple de l’entrée lexicale abominable :

— morpho : lemme (abominable) - catégorie (ADJ)

— evaluation : appréciation défavorable

— attestation : assassinats abominables

Exemple de l’entrée lexicale grave :

— morpho : lemme (grave) - catégorie (ADJ)

— evaluation 1 : appréciation défavorable - attestation : spidey, il ne lui arrivera rien de grave

— evaluation 2 : jugement négatif - attestation : cette réforme pose de graves problèmes

Téléchargements

Manuel du Lexique de l’évaluation :

PDF - 273.5 ko
LEXIQUE_Documentation



Dernière modification : jeudi 1er juillet 2010