Logo del GIRCSE Informatica per umanisti Università Cattolica
Progetto realizzato da Istituto di Glottologia - Università Cattolica del Sacro Cuore di Milano

Il corso di Linguistica

   A partire dal 1982, il GIRCSE ha promosso e attuato il corso di Linguistica Computazionale, prioritariamente rivolto agli studenti delle facoltà umanistiche.
   Fin dai suoi inizi, il corso ha avuto un carattere eminentemente pratico, nella convinzione che a persone con una preparazione umanistica fosse opportuno trasmettere solo quei concetti e quelle competenze che li mettessero in grado di essere utenti non passivi, ma anzi propositivi, delle tecnologie informatiche, evitando che la componente umanistica venisse sopraffatta, come spesso accade, dagli aspetti piú strettamente tecnologici.
   Questa impostazione si è rivelata tanto piú valida con il passare degli anni, in quanto l'evoluzione della tecnologia ha raggiunto da un lato una complessità che la rende ingestibile da parte di non specialisti e dall'altro una potenza e una facilità d'uso che consentono anche ad un utente profano di effettuare su personal computer elaborazioni fino a non molto tempo fa realizzabili soltanto da programmatori all’interno di un centro di calcolo.
   Un corso di Linguistica Computazionale deve dunque fornire, in termini di conoscenze e competenze, quegli strumenti fondamentali che permettono al ricercatore in campo umanistico di sfruttare al meglio le tecnologie a disposizione, la cui utilizzazione, anche nei settori piú avanzati della ricerca, non è ancora divenuta di largo dominio.
   D’altro canto occorre tenere conto di un'utenza estremamente variegata che può comprendere studenti completamente privi di conoscenza nel settore come pure utilizzatori piú esperti.
   Il programma del corso di Linguistica Computazionale si articola dunque su alcuni principi di base: definire il ruolo e il significato dell’Informatica Linguistica come disciplina; fornire le conoscenze informatiche di base indispensabili ad un ricercatore di formazione umanistica; illustrare le metodologie sviluppate presso il GIRCSE (per quanto riguarda sia i principi teorici che l’iter di elaborazione); offrire una sintetica panoramica delle possibili applicazioni dell’informatica in campo umanistico. Piú in dettaglio il programma comprende:
premesse di linguistica
premesse di informatica (tipi di codifica - binaria, decimale, esadecimale; principi di funzionamento di un elaboratore; concetti fondamentali di programmazione; campi di applicazione dell’informatica di parole)
utilizzo teorico e pratico del pacchetto GIRCSE per la creazione di concordanze lemmatizzate:
1. redazione del sistema grafemico del testo
2. redazione del sistema grafemico della registrazione
3. trascrizione di un testo in machine-readable form
4. passaggio dal testo alle forme grafiche (analisi, sort, stralcio, riepilogo)
5. lemmatizzazione di un testo
6. post-lemmatizzazione (revisione della lemmatizzazione e trattamento delle forme composte e omografe)
7. costruzione del sistema lessicologico di un testo
le concordanze: struttura e tipologie
utilizzo di altri software standard per il trattamento informatico di testi:
1. introduzione all’uso di TACT (Textual Analysis Computing Tools)
2. introduzione all’uso di DBT (Data Base Testuale)
introduzione all’uso di altri strumenti informatici per le scienze umane:
1. dizionari macchina
2. basi di dati in campo umanistico e software applicativo
3. collegamenti in rete e posta elettronica
4. applicazioni ipertestuali
5. lessicografia informatizzata
uso di Internet e creazione di pagine Web.

   Il corso, tenuto principalmente nelle aule informatiche, affianca alle competenze teoriche un intenso addestramento pratico: gli studenti trascrivono un testo in machine-readable form dopo averne analizzato le caratteristiche e averne definito la codifica (per far ciò viene utilizzato un word processor a larga diffusione, installato sia al GIRCSE che nelle aule di informatica dell’Università Cattolica), quindi ne eseguono l’elaborazione completa fino alla lemmatizzazione eseguita con ACCESS, alla produzione di razionario, lemmario e, eventualmente, di concordanze.
   Il corso è integrato da un ciclo di esercitazioni, durante il quale gli studenti approfondiscono alcuni aspetti di quanto appreso durante le lezioni. Per l’a.a. 1998-1999 il programma prevede la trattazione dei seguenti argomenti:

i centri in rete Internet per i testi elettronici
uso di TACT
principi di editoria elettronica - Standard Generalized Markup Language e Text Encoding Initiative (un progetto per sviluppare e diffondere inicazioni metodologiche per l’interscambio di testi in formato elettronico.

   Il GIRCSE offre inoltre la sua assistenza agli studenti per le loro elaborazioni (ricerche e tesi di laurea).