..

..

samedi 26 janvier 2013

Statistique textuelle – Ludovic Lebart, André Salem

By ziane abdelhak   Posted at  08:39   maths No comments


Statistique textuelle

Ludovic Lebart, André Salem


Description :

  Cet ouvrage s'adresse à ceux qui, pour leurs recherches, leurs travaux d'études, leur enseignement, doivent décrire, comparer, classer, analyser des ensembles de textes. Il peut s'agir de textes littéraires, scientifiques (bibliométrie, scientométrie, recherche documentaire), économiques, sociologiques (réponses aux questions ouvertes dans des enquêtes socio-économiques, entretiens divers en marketing, psychologie appliquée, pédagogie, médecine), de textes historiques, politiques… Les méthodes de statistique textuelle rassemblées dans le présent ouvrage sont nées de la rencontre entre plusieurs disciplines : l'étude des textes, la linguistique, l'analyse du discours, la statistique, l'informatique, le traitement des enquêtes, pour ne citer que les principales. La démarche des auteurs s'appuie à la fois sur les travaux d'un courant aux dénominations changeantes (statistique lexicale, statistique linguistique, linguistique quantitative, etc.) qui associe depuis une cinquantaine d'années la méthode statistique à l'étude des textes, et sur l'un des courants de la statistique moderne, la statistique multidimensionnelle. L'outil informatique est aujourd'hui utilisé par un nombre croissant d'usagers pour des tâches qui impliquent la saisie et le traitement de grands ensembles de textes. Cette diffusion renforce à son tour la demande d'outils de gestion et d'analyse des textes qui émane des praticiens et des chercheurs de nombreuses disciplines. Confrontés à des textes nombreux recueillis dans des enquêtes socio-économiques, des entretiens, des investigations littéraires, des archives historiques ou des bases documentaires, ces derniers attendent en effet une aide en matière de classement, de description, de comparaisons… La statistique textuelle se veut précisément un outil destiné à parfaire l'analyse, la description, la comparaison, en un mot, le traitement des textes. Ce livre, illustré d'exemples nombreux, présente les concepts de base et les fondements des méthodes de la statistique textuelle. Il combine une approche pédagogique des outils et un exposé sur l'état de l'art de cette discipline.
  • Le premier chapitre, Domaines et problèmes, évoque à la fois : les domaines disciplinaires concernés (linguistique, statistique, informatique), les problèmes et les approches. Il précise dans chaque cas la nature du matériau de base que constituent les textes rassemblés en corpus.
  • Le second chapitre, Les unités de la statistique textuelle, est consacré à l'étude des unités statistiques que les programmes lexicométriques devront découper ou reconnaître (formes, segments répétés). Il aborde les aspects fondamentaux de l'approche quantitative des textes, les propriétés de ces unités ; il précise leurs pertinences respectives en fonction des champs d'application.
  • Les troisième et quatrième chapitres, L'analyse des correspondances des tableaux lexicaux, et La classification automatique des formes et des textes, présentent les techniques de base de l'analyse statistique exploratoire des données multidimensionnelles à partir d'exemples simples.
  • Le cinquième chapitre : Typologies, visualisations, applique les outils présentés aux chapitres trois et quatre à la description des associations entre formes et entre catégories. Il fournit des exemples d'application en vraie grandeur commentés du point de vue de la méthode statistique. Il détaille les règles de lecture et d'interprétation des résultats obtenus, fait le point sur leur portée méthodologique.
  • Pour compléter ces représentations synthétiques, le sixième chapitre, Eléments caractéristiques, réponses ou textes modaux, présente les calculs dits de spécificité ou de formes caractéristiques qui permettent de repérer, pour chacune des parties d'un corpus, celles des unités qui se signalent par leurs fréquences atypiques. La sélection automatique des réponses modales ou des textes modaux permet de replacer les formes dans leur contexte, et de caractériser, lorsque cela est possible, des parties de texte, en général volumineuses, par des portions plus petites (phrases, paragraphes, documents, réponses dans le cas d'enquêtes). On résume ainsi, dans le cas des réponses libres, l'ensemble des réponses d'une catégorie de répondants par quelques réponses effectivement attestées dans le corpus, choisies en raison de leur caractère représentatif.
  • Le septième chapitre, Partitions longitudinales, contiguité, traite le problème des informations a priori qui concernent les parties d'un corpus. Dans de nombreuses applications, en effet, l'analyste possède, avant toute démarche de type quantitatif, des informations qui lui permettent de rapprocher entre elles certaines des parties, ou encore de dégager un ordre privilégié parmi ces dernières (séries textuelles chronologiques). On étudie dans ce chapitre, en présentant une méthode et de nombreux exemples d'application, les relations de dépendance que l'on peut observer entre ces structures et les profils lexicaux des parties.
  • Le huitième chapitre, consacré à l'Analyse discriminante textuelle, étudie, au sens statistique du terme, le pouvoir de discrimination des textes. Comment affecter un texte à un auteur (ou à une période) ? Peut-on prévoir l'appartenance d'un individu à une catégorie à partir de sa réponse à une question ouverte ? Comment classer (ici : affecter à des classes préexistantes) un document dans une base de données textuelles ? On tente dans ce chapitre, qui contient des exemples d'application variés, de montrer quels sont les apports de la statistique textuelle à la stylométrie, à la recherche documentaire, ainsi qu'à certains modèles prévisionnels.

Téléchargement

-->  :  

UploadMirrors


About the Author

Ingénieur civil, aime l'internet, ce blog est dédié pour aider tout les étudiants et ceux qui aime le savoir profitez-on.
View all posts by: BT9

0 commentaires:

laisser un commentaire

Back to top ↑
Connect with Us

    Nombre de visiteurs (7 jours)

    visiteurs

    free counters

    Follow

    nos membres

Advertisement

What they says

Related Posts Plugin for WordPress, Blogger... telechargerlivresgratuit.blogspot.com Trust

espace pub

Free SEO Tools

Meilleur Blog
Top Meilleur Blog Annuaire Gratuit Subscribe to our newsletter Future Google PR for geotechniquebooks.blogspot.com - 0.00Trust Rank for geotechniquebooks.blogspot.com - 0.00 Search Engine Submission - AddMe ExactSeek: Relevant Web Search
Add URL Pro - Search Engine Submission and Optimization Services Check PageRank
Submit your website to 20 Search Engines - FREE with ineedhits!
SEO Services
USA Backlinks Free Backlinks Service at USABacklinks.com!