Introduzione
I. I fondamenti della linguistica dei corpora
1. Premesse teoriche
2. Il corpus nella tradizione
3. Il corpus elettronico
II. Struttura di un corpus
1. Il corpus come campione
2. I tratti definitori di un corpus
III. Codifica e annotazione
1. Codifica del carattere e markup testuale
2. Le unità linguistiche e la loro annotazioni
IV. L’analisi dei corpora: strumenti di base
1. La distribuzione del lessico
2. Analisi delle concordanze
3. Associazioni lessicali: le collocazioni
V. La situazione italiana
1. I centri italiani per la linguistica dei corpora e le principali risorse
scritte
2. I corpora di italiano parlato
Quadri
2.1. Corpora e questioni legali
3.1. La tokenizzazione
3.2. Le espressioni polirematiche
3.3. Il formato di trascrizione CHAT-LABLITA
3.4. La pragmatica e lo studio del parlato
4.1. Vocabolario del corpus e type/token ratio
4.2. Classi aperte e classi chiuse
4.3. Ricerche grammaticali corpus-based
Appendice
Riferimenti bibliografici e sitografia
Indice analitico