A partire dal 1982, il GIRCSE ha promosso e attuato
il corso di Linguistica Computazionale, prioritariamente rivolto agli
studenti delle facoltà umanistiche.
Fin dai suoi inizi, il corso ha avuto un carattere
eminentemente pratico, nella convinzione che a persone con una
preparazione umanistica fosse opportuno trasmettere solo quei concetti e
quelle competenze che li mettessero in grado di essere utenti non
passivi, ma anzi propositivi, delle tecnologie informatiche, evitando
che la componente umanistica venisse sopraffatta, come spesso accade,
dagli aspetti piú strettamente tecnologici.
Questa impostazione si è rivelata tanto piú valida
con il passare degli anni, in quanto l'evoluzione della tecnologia ha
raggiunto da un lato una complessità che la rende ingestibile da parte
di non specialisti e dall'altro una potenza e una facilità d'uso che
consentono anche ad un utente profano di effettuare su personal computer
elaborazioni fino a non molto tempo fa realizzabili soltanto da
programmatori all’interno di un centro di calcolo.
Un corso di Linguistica Computazionale deve dunque
fornire, in termini di conoscenze e competenze, quegli strumenti
fondamentali che permettono al ricercatore in campo umanistico di
sfruttare al meglio le tecnologie a disposizione, la cui utilizzazione,
anche nei settori piú avanzati della ricerca, non è ancora divenuta di
largo dominio.
D’altro canto occorre tenere conto di un'utenza
estremamente variegata che può comprendere studenti completamente privi
di conoscenza nel settore come pure utilizzatori piú esperti.
Il programma del corso di Linguistica Computazionale
si articola dunque su alcuni principi di base: definire il ruolo e il
significato dell’Informatica Linguistica come disciplina; fornire le
conoscenze informatiche di base indispensabili ad un ricercatore di
formazione umanistica; illustrare le metodologie sviluppate presso il
GIRCSE (per quanto riguarda sia i principi teorici che l’iter
di elaborazione); offrire una sintetica panoramica delle possibili
applicazioni dell’informatica in campo umanistico. Piú in dettaglio
il programma comprende:

premesse di linguistica

premesse di informatica (tipi di codifica -
binaria, decimale, esadecimale; principi di funzionamento di un
elaboratore; concetti fondamentali di programmazione; campi di
applicazione dell’informatica di parole)

utilizzo teorico e pratico del pacchetto GIRCSE per
la creazione di concordanze lemmatizzate:
1. redazione del sistema grafemico del testo
2. redazione del sistema grafemico della registrazione
3. trascrizione di un testo in machine-readable
form
4. passaggio dal testo alle forme grafiche (analisi,
sort, stralcio, riepilogo)
5. lemmatizzazione di un testo
6. post-lemmatizzazione (revisione della
lemmatizzazione e trattamento delle forme composte e omografe)
7. costruzione del sistema lessicologico di un testo |

le concordanze: struttura e tipologie

utilizzo di altri software standard per il
trattamento informatico di testi:
1. introduzione all’uso di TACT (Textual Analysis
Computing Tools)
2. introduzione all’uso di DBT (Data Base Testuale) |

introduzione all’uso di altri strumenti
informatici per le scienze umane:
1. dizionari macchina
2. basi di dati in campo umanistico e software
applicativo
3. collegamenti in rete e posta elettronica
4. applicazioni ipertestuali
5. lessicografia informatizzata
|

uso di Internet e creazione di pagine Web.
Il corso, tenuto principalmente nelle aule
informatiche, affianca alle competenze teoriche un intenso addestramento
pratico: gli studenti trascrivono un testo in machine-readable form
dopo averne analizzato le caratteristiche e averne definito la codifica
(per far ciò viene utilizzato un word processor a larga
diffusione, installato sia al GIRCSE che nelle aule di informatica
dell’Università Cattolica), quindi ne eseguono l’elaborazione
completa fino alla lemmatizzazione eseguita con ACCESS, alla produzione
di razionario, lemmario e, eventualmente, di concordanze.
Il corso è integrato da un ciclo di esercitazioni,
durante il quale gli studenti approfondiscono alcuni aspetti di quanto
appreso durante le lezioni. Per l’a.a. 1998-1999 il programma prevede
la trattazione dei seguenti argomenti:

i centri in rete Internet per i testi elettronici

uso di TACT

principi di editoria elettronica - Standard
Generalized Markup Language e Text Encoding Initiative
(un progetto per sviluppare e diffondere inicazioni metodologiche per
l’interscambio di testi in formato elettronico.
Il GIRCSE offre inoltre la sua assistenza agli
studenti per le loro elaborazioni (ricerche e tesi di laurea).