Responsables : Mme Ariane Jambé, MM. Dylan Bovet et Patrick M. Michel
Cette séance sera consacrée au tagging textuel et aux enjeux que suppose cette pratique pour les langues classiques.
Par tagging textuel, on entend tout procédé consistant à appliquer à un mot une (ou plusieurs) information(s) complémentaire(s) - par exemple, son lemme, sa traduction, son analyse morpho-syntaxique, etc. Ces informations peuvent ensuite être classées, interrogées et exploitées pour mener à bien une recherche sur le texte.
En se basant sur l’expérience de quelques intervenants, nous réfléchirons à ces points problématiques :
- pourquoi choisissons-nous une façon individuelle de tagger ? Cela correspond-t-il à une « facilité d’usage » ? Serait-il pertinent d’établir un standard grammatical pour les langues classiques, même si les objectifs poursuivis par les recherches diffèrent?
- comment gérer les tags (= métadonnées) de son corpus textuel ? Où les conserver et sous quelle forme?
- comment tagger un corpus textuel diachronique ? Comment rendre compte de la polysémie / des ambiguïtés portées par un texte ?
- peut-on envisager d’autres formes de tagging textuel (par exemple un tagging pragmatique) ?
- jusqu’où faut-il tagger son corpus textuel et dans quelle mesure cela est-il pertinent pour une édition numérique?
Si vous souhaitez intervenir, soulever une autre problématique ou simplement assister à cette séance, n’hésitez pas à prendre contact avec l’un des membres d’#ASAnumerica.
Pour #ASAnumerica
Ariane Jambé
Dylan Bovet
Patrick M. Michel