Si raccomanda di consultare le AVVERTENZE prima di leggere il testo.
La versione scaricabile in formato Word della I parte (capp. 1-3) è disponibile qui.

Parte I: I fondamenti del Language Testing

Cap. 1 Principi metodologici

1.1. Verifica dell'apprendimento linguistico

La verifica del profitto dell'allievo è esigenza primaria di ogni insegnante che collochi la propria opera educativa in una corretta visione pedagogica, focalizzando la propria attenzione sull'allievo per conoscerne i processi di apprendimento e per accertare quanto, di ciò che l'insegnante ha cercato di trasmettere, sia stato effettivamente acquisito.

Nel campo delle lingue straniere, è particolarmente importante controllare di volta in volta che l'allievo possieda determinate abilità linguistiche: essendo una lingua, nell'accezione saussuriana, un sistema "où tout se tient", non può instaurarsi un reale apprendimento se non sviluppando adeguatamente ed in modo funzionale lutti gli elementi che entrano in gioco nel sistema.

Sul piano didattico ciò significa che non si debbono far affrontare nuove difficoltà prima di aver accertato la sicura acquisizione, da parte di ciascun allievo, di tutto ciò che si presuppone già noto. Pertanto, al di là di ciò che all'insegnante viene richiesto dalla scuola in quanto struttura burocratizzata (voti, classificazioni, pagelle, ecc.), la misurazione del profitto si configura come una necessità insopprimibile, un problema dalla cui risoluzione può dipendere, in misura notevole, il buon andamento di un corso di lingue straniere moderne.

La ricerca di nuovi strumenti, di soluzioni sempre più adeguate, ha dato origine agli studi sul "Language Testing" (LT), in cui rifluiscono i recenti sviluppi di varie discipline, tra cui la linguistica generale ed applicata, la psicolinguistica, la docimologia, la didattica delle lingue straniere e la statistica metodologica.

Premesso che il termine verrà precisato man mano che ne verranno presi in esame i singoli aspetti, definiamo il LT come il complesso dei principi metodologici e delle tecniche che presiedono alla realizzazione, somministrazione e utilizzazione delle prove oggettive di profitto nell'apprendimento delle lingue straniere.

La comprensione dei principi metodologici è di preminente importanza rispetto alla conoscenza di modelli e formule, in quanto permette di sviluppare su fondamenti scientifici la preparazione di materiale adatto alla situazione didattica in cui si opera. Proprio alla carenza di scientificità vanno ascritti gli aspetti negativi che il LT ha assunto nelle prime fasi del suo sviluppo.

In concomitanza col metodo tradizionale grammatica-traduzione, si ebbe l'identificazione tra esercizio e test: le versioni in lingua straniera venivano usate sia in fase di apprendimento (fissazione delle strutture e del lessico), sia in fase di controllo. Sul piano psicologico e su quello didattico, si tratta di un grave errore; il momento dell'acquisizione non può e non deve confondersi con quello della verifica; un esercizio è sostanzialmente diverso (per struttura e per funzione) da un test, anche quando entrambi si basano su materiale apparentemente simile.

Successivamente, sono state prese a modello le tecniche impiegate in psicometria per la costruzione dei test mentali; in questo settore, infatti, sì era registrato un notevole sviluppo delle prove oggettive e standardizzate ed un moltiplicarsi di pubblicazioni su tale argomento. Negli Stati Uniti, la vastissima diffusione nelle scuole dei test d'intelligenza, attitudinali e caratterologici è stata di per sé un veicolo di divulgazione ed ha fatto sì che gli insegnanti, insoddisfatti delle prove tradizionali, vi si ispirassero largamente.

Inizialmente, però, questo accostamento ai test è stato caratterizzato da un alto grado di superficialità e di approssimazione. Delle tecniche di valutazione è stato colto soprattutto l'aspetto esteriore, meccanico, e si sono create delle prove che assomigliavano sempre più ai quiz enigmistici e sempre meno ai test mentali. Mancava, alla base, un'approfondita analisi dell'oggetto da verificare, la L2, condotta secondo i criteri elaborati dalla scienza linguistica; nessuno strumento di misurazione è idoneo se non viene costruito tenendo. conto delle caratteristiche di ciò che deve essere misurato.

Mancava altresì il riferimento costante ad un preciso itinerario didattico. Per verificare cosa è stato appreso occorre prima sapere come sì è instaurato l'apprendimento, perché gli aspetti qualitativi sono preminenti rispetto a quelli quantitativi, e non ha senso sottoporre un allievo ad una verifica condotta in modi difformi rispetto al tipo di preparazione acquisita.

Date queste premesse, prima di procedere alla presentazione delle tecniche per la verifica delle abilità linguistiche, delineeremo, sia pure per sommi capi, il quadro generale nel quale si colloca il LT.

1.2. Testing e valutazione

Un esame, per quanto sommario, del tema della valutazione non può certo esaurirsi in poche righe, in quanto coinvolge direttamente tutta la problematica relativa ai fini e agli esiti dell'educazione e, quindi, anche alla natura stessa della scuola. D'altra parte, anche se il nostro discorso sul LT si muove in un orizzonte assai più ristretto, e ad un livello essenzialmente tecnico, non possiamo ignorare le controversie sulla "selezione meritocratica" che hanno agitato la scuola italiana in questi ultimi anni. Siamo infatti consapevoli delle implicazioni e degli effetti di un uso delle prove di controllo che, prescindendo da una chiara coscienza delle finalità educative, non avvertisse i pericoli di una presunta "oggettività" non sufficientemente qualificata. Proporre semplicemente tecniche nuove e più sofisticate in sostituzione delle prove di vecchio tipo è antiscientifico nella misura in cui non si tiene conto dei presupposti pedagogici e metodologici: è questa la ragion d'essere della docimologia come scienza.

Per quanto riguarda gli aspetti sociopolitici, ci limiteremo ad osservare come la valutazione scolastica sia servita prevalentemente ad instaurare e tramandare stratificazioni di classe, selezionando sulla base di un modello precostituito ed emarginando gli studenti i cui caratteri individuali sono difformi da tale modello. Sotto il profilo psicologico, ad esempio, sono stati privilegiati in misura talora eccessiva gli aspetti verbali e numerici dell'intelligenza a discapito degli aspetti psicomotori o "spaziali" che presiedono alle abilità manuali e pratiche.

Su questa diagnosi registriamo un'ampia concordanza di vedute; sono invece assai discordi i pareri sui possibili rimedi, e cogliere un orientamento preciso non è agevole, anche perché in vari casi è difficile distinguere tra le proposte e i progetti fondati su una seria impostazione sociopedagogica e quelli propugnati strumentalmente da vari gruppi politici, magari per fini diversi da quelli dichiarati.

Possiamo tuttavia ritenere che certe tensioni tra allievi e insegnanti non si sarebbero acuite così clamorosamente se da entrambe le parti, ma soprattutto da parte degli insegnanti, fosse stata chiarita, sviluppata e tenuta sempre presente la distinzione fondamentale tra misurazione del profitto e valutazione dell'allievo, così come essa è stata elaborata dalla pedagogia contemporanea.

La misurazione del profitto consiste nella verifica oggettiva del valore di un risultato scolastico, esclusivamente sulla base della esattezza nozionale e prescindendo da ogni considerazione sull'alunno che ha fornito quel risultato. Il processo di valutazione è invece un atto di natura complessa, nel quale i dati ottenuti mediante la misurazione del profitto sono posti in relazione alla personalità degli studenti, alla loro condizione umana sotto il profilo biologico, psichico, ambientale, socioeconomico, ecc.

In ogni insegnante, perciò, accanto alla dimensione che fa di lui un tecnico, un esperto della propria disciplina, deve coesistere la dimensione dell'educatore, ossia di colui che, inserito nel gruppo di lavoro costituito dal consiglio di classe, mira ad una valida formazione globale della persona umana.

Parallelamente ad una valutazione sommativa in cui, sotto forma di sentenza, si "tirano le somme" dì un processo di apprendimento, deve svilupparsi sempre più una valutazione formativa o programmatica, allo scopo di accertare le capacità esistenti non in vista di una sanzione, bensì per stabilire, per ogni alunno, un piano d'azione didattica che possa condurlo al livello più alto di istruzione e di educazione da lui raggiungibile. Infine, possiamo identificare una valutazione orientativa, intesa a stabilire in quali direzioni la personalità dell'allievo potrà meglio svilupparsi.

I vari aspetti del problema della valutazione, ai quali abbiamo accennato brevemente, ci offrono una visione ampia ed articolata su tutto questo settore e ci consentono quindi di cogliere le dimensioni e i confini del testing. I test di profitto sono strumenti di misurazione e non di valutazione, né sono gli unici di cui dispone l'insegnante: non sarebbero buoni educatori coloro i quali, vittime di un tecnicismo esasperato, attribuissero valore esclusivo alle prove oggettive, trascurando gli altri mezzi di conoscenza e verifica.

1.3. Testing e analisi linguistica

Non è casuale, a nostro avviso, che Robert Lado, il linguista a cui si deve una delle opere più importanti sul LT, sia anche l'esponente più qualificato della linguistica contrastiva. Infatti la verifica dell'apprendimento linguistico presuppone l'esatta comprensione del meccanismo delle interferenze della LI sulla L2, a tutti i livelli, così come, sul piano didattico, "i materiali più efficaci sono quelli basati su una descrizione scientifica della lingua da apprendere, accuratamente confrontata con una descrizione parallela della lingua materna dell'allievo"

A livello fonologico, il confronto avviene attraverso una triplice indagine su ciascun fonema della L2:

1) La lingua materna ha un fonema foneticamente simile?

2) Le varianti del fonema sono simili in entrambe le lingue?

3) I fonemi e le loro varianti sono distribuiti in modo simile?

Assumendo come L1 l'italiano e L2 l'inglese, rispondendo alla prima domanda troviamo che i fonemi inglesi / D T Z h / non corrispondono a suoni italiani simili. Ulteriori controlli (sulla base dei punti 2 e 3) rivelano, tra l'altro, che:

— il suono [N] è una variante del fonema / n / in italiano, mentre funziona come fonema autonomo in inglese;

— in inglese, ma non in italiano, / s / e / z / sono capaci di costituire coppie di opposizione minimale (ice-eyes);

— esiste in inglese, ma non in italiano, una variante velare del fonema / 1 /, ricorrente in posizione post-vocalica.

L'indagine, che ovviamente deve essere molto più accurata ed approfondita di quanto non possa apparire dalla sommaria esemplificazione che ne abbiamo dato, abbraccerà non solo i fonemi segmentali (vocali, consonanti, dittonghi) ma anche i valori soprasegmentali (accento, intonazione); inoltre, poiché le differenze nella distribuzione dei fonemi sono Ìa causa di un gran numero di problemi di apprendimento, dovranno essere esaminate contrastivamente tutte le sequenze fonemiche, ad esempio i nessi consonantici in posizione iniziale, mediana e finale.

A livello grammaticale, il Lado postula la necessità di accertare se ad una struttura della L2 corrisponda, nella LI, una struttura segnalata allo stesso modo (ossia con gli stessi mezzi formali), avente Io stesso significato, e analogamente distribuita nel sistema.

Se volessimo confrontare la formazione del plurale in italiano e in francese, dovremmo - anzitutto descrivere il fenomeno in entrambe le lingue:

a) ITALIANO

Forma: II plurale si ottiene mediante sostituzione dei morfemi inflessionali vocalici, secondo il seguente schema (semplificato):

Singolare

Plurale

mano, buono, libro

mani, buoni, libri

casa, buona, penna

case, buone, penne

nave, agile, ponte

navi, agili, ponti

poeta, idioma, idiota

poeti, idiomi, idioti

I sostantivi monosillabici e quelli terminanti in consonante sono invariabili al plurale (re, tram, sport, ecc.).

Un certo numero di vocaboli (per lo più sostantivi) hanno forme autonome ("irregolari") per il plurale.

Significato: più di uno (nei sostantivi, aggettivi, ecc.); nei pronomi personali il plurale indica l'aggiunta di altri referenti a quello indicato dalla corrispondente persona singolare. In altre parole, mentre "libri" significa "libro + libro + ...", "noi" non equivale a "io + io + ...", bensì a "io + qualcun altro".

Distribuzione: Formano il plurale i sostantivi, gli articoli determinativi, gli aggettivi qualificativi, possessivi, dimostrativi, molti indefiniti, i pronomi, ecc.

b) FRANCESE

Forma: Occorre in primo luogo distinguere il messaggio scritto da quello orale, come appare dal seguente esempio, in cui il segno + indica la presenza di tratti distintivi tra singolare e plurale, mentre il segno — indica l'assenza di tratti:

La

porte

était

fermée

 

Les

portes

étaient

fermées

 

+

+

+

+

(nello scritto)

+

(nell'orale)

Mentre sul piano grafico ogni parola è stata modificata nella formazione del plurale, sul piano orale la sola variazione è nell'articolo.

Pertanto, nel descrivere la forma del plurale francese, diremo che mentre nello scritto essa è caratterizzata dalla desinenza -s, presente nella maggioranza dei casi, nel codice orale esiste un'alta percentuale di forme invariate.

Anche in francese esistono forme irregolari (nella grafia e/o nella pronuncia), e forme invariabili anche nella grafia. Da notare il gruppo di vocaboli terminanti in -al e -ail formanti il plurale con la desinenza -aux (sul piano orale: singolare / -al, -aj /, plurale /-o/).

In quanto alla distribuzione e al significato del plurale francese, in linea di massima valgono le osservazioni fatte per l'italiano.

Sulla base di questa analisi, per quanto sommaria, si può presumere che le sole interferenze capaci di creare problemi di apprendimento si collochino a livello formale.

Se l'indagine si sposta su altre lingue, i risultati possono essere notevolmente diversi: nei rapporti tra italiano e inglese, ad esempio, esistono anche problemi di distribuzione del plurale, essendo invariabili, in inglese, l'articolo, gli aggettivi qualificativi e la maggior parte degli altri aggettivi e pronomi (con l'eccezione di other pronome e dei dimostrativi).

Problemi a livello di significato si evidenziano nei rapporti con quelle lingue il cui sistema comprende, oltre al singolare ed al plurale, altri numeri, quali il duale. La dissimmetria può essere così schematizzata:

N. oggetti

1

2

3 4 5 6 …

L1

Singol.

Plurale

L2

Singol.

Duale

Plurale

 

Lo schema offre la visualizzazione di un principio molto importante: nei rapporti tra due lingue, i problemi di apprendimento e di valutazione cambiano a seconda di quale delle due sia la L1 e quale la L2.

Nell'esempio, il passaggio da un sistema più semplice ad uno più complesso prefigura l'attendibilità di certe difficoltà; nel passaggio inverso, i problemi sarebbero minori, e comunque di tipo diverso.

Da ciò la necessità di elaborare materiali sulla base di una analisi contrastiva, tenendo presente la direzione nella quale opera l'apprendimento; in caso contrario, il lavoro potrebbe risolversi in un mero confronto di sistemi, interessante in sé ma di scarsa utilità per l'insegnante di lingue.

È stato merito del Lado l'aver mostrato come i concetti di forma, distribuzione e significato siano operanti non solo a livello morfo-sintattico, ma anche nel confronto di due sistemi lessicali e di due culture, nonché l'aver indicato procedure di analisi assai feconde di risultati.

Il modello linguistico a cui il Lado si ricollega si colloca entro i confini della linguistica tassonomica, le cui origini risalgono all'opera di Bloomfield e di Sapir. Lo strutturalismo americano si è distinto per la capacità di raccogliere materiale linguistico estremamente importante; ma per ciò che si riferisce agli sviluppi dei criteri di analisi linguistica, pur riconoscendo il valore degli studi di Hockett, Gleason, Fries (di cui il Lado fu allievo), e degli altri maggiori strutturalisti americani, concordiamo con coloro che giudicano la linguistica funzionale, e in particolare l'opera di Jakobson e Martinet, più rispondente all'esigenza di una visione organica del problema globale del linguaggio.

Attraverso il recupero delle dicotomie saussuriane langue/parole e signifiant/signifié, l'orizzonte linguistico si è ampliato oltre i limiti della linguistica descrittiva, pur senza abbandonarne i canoni di rigorosa aderenza ai criteri fondamentali dell'analisi strutturale. Con Jakobson, salgono alla ribalta della linguistica i problemi della genesi del linguaggio (attraverso gli studi sull'afasia); l'atomo-fonema è scisso nelle sue particelle, i tratti distintivi; anche la letteratura trova nuove forme di interpretazione e di analisi. Al Martinet si deve una sintesi estremamente utile e chiara delle articolazioni del linguaggio, nonché l'enunciazione di una sintassi funzionale ricca di spunti e di indicazioni valide per una corretta impostazione della didattica delle lingue.

1.4. Testing e didattica delle lingue straniere

Un'esposizione sintetica dei fondamenti della didattica delle lingue straniere non è agevole, sia per la vastità dell'oggetto, sia per le profonde implicazioni sul piano culturale e sul piano operativo. Preferiamo perciò far riferimento ad altri volumi già pubblicati in questa collana e limitarci a presentare alcuni principi essenziali, più strettamente collegati ai problemi del LT.

a) La lingua è strumento di comunicazione verbale; il codice scritto è una rappresentazione secondaria e approssimativa del codice orale.

b) La didattica delle lingue straniere si basa su un'analisi condotta secondo i principi della linguistica moderna.

c) Per grammatica di una lingua si intende essenzialmente il sistema di strutture rilevate mediante una descrizione organica e funzionale, non una serie di regole a carattere prescrittivo.

d) Una lingua è intimamente connessa, in vari modi, con la civiltà del popolo che la parla; il termine civiltà è qui inteso in senso antropologico.

e) Apprendere una lingua straniera significa essenzialmente formare un nuovo sistema di abiti fonologici, morfosintattici e lessicali.

f) Le quattro abilità fondamentali sono: il saper comprendere, il saper parlare, il saper leggere, e il saper scrivere la lingua straniera; esse vanno affrontate e sviluppate seguendo rigorosamente l'ordine indicato.

g) A causa dell'interferenza del codice scritto, si postula la necessità di una fase iniziale di condizionamento in cui si impieghi esclusivamente la lingua orale (oral approach).

h) Non è possibile apprendere una lingua straniera se non attraverso l'impiego della lingua stessa; il discorso sulla lingua (ossia la "metalingua"), specialmente se tenuto nella lingua materna dello studente, non conduce ad un effettivo apprendimento linguistico.

i) La lingua insegnata sarà lingua autentica, sempre presentata in situazioni tipiche della civiltà straniera; se possibile, ci si avvale dei parlanti nativi, o direttamente o mediante sussidi (registrazioni su nastro, disco, ecc., programmi radiofonici e televisivi).

1) II programma di insegnamento è basato su un'accurata graduazione del lessico e delle strutture morfosintattiche; attraverso l'analisi contrastiva di due lingue è possibile evidenziare le dissimmetrie e prevedere le difficoltà di apprendimento.

m) Un corso o programma si articola in una serie di unità didattiche, ciascuna delle quali racchiude, in un contesto di civiltà, materiale per 5-8 ore di lezione.

n) Le fasi dell'unità didattica sono:

A) la presentazione di motivi di civiltà straniera;

B) l'accostamento globale al brano di lingua-civiltà;

C) l'induzione delle strutture morfosintattiche e del lessico;

D) la fissazione delle strutture mediante opportuni esercizi;

E) la sistemazione grammaticale;

F) la verifica dell'apprendimento.

1.5. Oggettività dei test

L'aver definito i test come prove oggettive di profitto impone che venga precisato che cosa si intende per "oggettività". Sul piano generale, essa è l'esclusione di ogni soggettività, ossia di qualsiasi intervento arbitrario dell'esaminatore, tale da rendere incostanti le prove e aleatori i risultati. Sul piano tecnico specifico, l'oggettività di un test è il prodotto di due fattori primari, la validità e l'affidabilità.

La validità di un test è la sua attitudine a verificare l'oggetto. Un test di grammatica è valido in quanto lo si impieghi per controllare l'apprendimento della grammatica; non può essere valido se impiegato per verificare la pronuncia o la padronanza del lessico.

In base ai principi d e i (vedi paragrafo precedente) non si possono considerare validi test che non impieghino la lingua naturale di conversazione, sufficientemente situazionata, in un contesto di civiltà. Il principio e implica che un test di lingua deve verificare il possesso di abilità specifiche, e non deve essere rivolto a misurare altri fattori (p. es. l'intelligenza e la memoria) in misura tale da annullare il contenuto linguistico. Il principio h esclude che un test valido possa servirsi della lingua madre dell'alunno o della terminologia grammaticale tradizionale.

Per affidabilità di un test si intende la sua capacità di fornire dati attendibili, ossia costanti e indistorti. Tale capacità è connessa all'univocità dei quesiti ed alla quantificabìlità del test. È univoco il quesito che ammette una ed una sola soluzione esatta, chiaramente predeterminata, con esclusione di varianti, risposte parziali o incomplete, soluzioni incerte che richiedano l'intervento soggettivo dell'esaminatore. È quantificabile il test da cui si ricava direttamente e oggettivamente il punteggio conseguito da ciascun esaminato e/o la graduatoria di merito in un gruppo di esaminati.

L'affidabilità di un test non è espressa da valori assoluti ma da un indice di affidabilità compreso tra 0 (affidabilità nulla) e 1 (affidabilità massima); l'indice è in relazione anche al contenuto del test, in quanto, ad esempio, le prove sulla morfosintassi sono di solito più facilmente oggettivabili di quelle sulla pronuncia.

I test possono infine essere valutati sulla base della loro praticità: il tempo che richiedono per essere approntati, somministrati e corretti, la facilità di impiego nelle normali situazioni scolastiche, la necessità di sussidi o attrezzature, ecc. Queste considerazioni sono più importanti di quanto non sembrino a prima vista, sia per l'esigenza di economizzare tempo nelle prove di controllo, in modo da non sottrarlo all'attività didattica in senso stretto, sia perché non è sempre facile far coesistere accuratezza e praticità, ed è inutile costruire test tanto sofisticati ed elaborati da risultare poi inadoperabili.

1.6. Testing e finalità educative

Non è compito di chi si occupa di testing stabilire quali siano le mete generali e specifiche di un programma di lingue straniere. L'enunciazione dei fini e degli obiettivi di un insegnamento-apprendimento deve preesistere alla formulazione delle prove attraverso cui si verifica il raggiungimento di tali fini. Non si può finalizzare un'attività didattica al mero superamento di una prova d'esame; il solo itinerario corretto è quello inverso, che adegua le prove di controllo ai contenuti ed agli scopi dell'attività didattica.

Questo principio, la cui importanza è fondamentale, è stato disatteso in moltissimi casi. Su vasta scala, questa è tuttora la situazione per quanto riguarda gli esami di maturità: temendo l'arrivo di commissari particolarmente severi e formalisti, lo svolgimento dei programmi, soprattutto dell'ultimo anno, fa riferimento costante alle esigenze dell'esame. Non è paradossale affermare che troppe volte si fa scuola sulla base del peggior esaminatore ipotizzabile. Si tratta di un macroscopico nonsenso, dato che anche le disposizioni vigenti lasciano chiaramente intendere come sia la commissione esaminatrice a doversi adeguare alle scelte metodologiche e programmatiche degli insegnanti, e non viceversa. Resta poi da chiedersi dove possano annidarsi questi commissari-spauracchio, visto che ogni professore giura di essere una persona sensibile, aperta al dialogo, disponibile e "moderna". Al di là di ogni facile ironia, si ha l'impressione che il formalismo conformista giochi un ruolo spesso decisivo nell'impostazione delle scelte di fondo.

Nel settore specifico delle lingue, un'azione analoga viene esercitata dagli esami per il conseguimento dei titoli di studio rilasciati da università o enti stranieri. Poiché alcuni di questi diplomi godono di un indiscusso prestigio, numerose scuole di lingue orientano il loro programma verso il superamento di quegli esami e una enorme mole di materiale didattico (corsi, testi, sussidi, ecc.) viene approntata esclusivamente a tale scopo. Il fatto che le prove siano solitamente elaborate da équipes di esperti ad alto livello, se per certi aspetti garantisce la buona qualità della preparazione richiesta, finisce però per instaurare un circolo vizioso: non si ha un rinnovamento didattico senza un aggiornamento delle prove d'esame, e le prove d'esame non possono essere modificate in tempi brevi senza danneggiare coloro che hanno già impostato in un certo modo la propria preparazione. Come osservava M. West già nel 1952, "gli esaminatori sono creature conservatrici e tendono... ad esaminare ora così come essi stessi sono stati esaminati in passato". L'effetto complessivo può quindi essere paralizzante, ostacolando ulteriormente l'evoluzione della didattica, come se già non bastassero tutte le altre remore burocratiche e psicologiche.

II LT ha invece una duplice funzione ausiliaria nella definizione delle mete e degli obiettivi. Anzitutto, l'impostazione di prove di controllo valide esige che gli obiettivi siano formulati in termini comportamentistici. Per fare ciò occorre collocarsi nell'ottica dell'allievo esaminato e descrivere, in termini inequivocabili, quello che egli dovrà fare per dimostrare di avere imparato un certo argomento o acquisito determinate capacità; bisogna inoltre indicare il modo in cui si svolgerà la prova di controllo e quale sia la prestazione minima ritenuta sufficiente. Mancando un criterio che determini i requisiti minimi per cui una prova si ritiene superata, ogni esaminatore lo fisserà più o meno arbitrariamente secondo il proprio metro di valutazione; non di rado questo varia, nello stesso insegnante, da una somministrazione all'altra della prova, sotto l'influenza di fattori estranei alla prova stessa.

A titolo esemplificativo, consideriamo il caso di un insegnante che voglia verificare se i suoi studenti "sanno una certa poesia". In concreto, che cosa chiederà? Conoscere una poesia in lingua straniera, a seconda delle circostanze e del livello della classe, può voler dire saperla leggere senza errori di pronuncia, saperla tradurre nella lingua materna, saperla recitare a memoria, saperla commentare criticamente, o altro ancora. Sono tutte attività che rientrano nel "saper parlare" e riferite allo stesso oggetto, ma diversissime tra loro per il tipo di prestazioni richieste, per il grado di difficoltà e complessità, per il modo in cui si potrà misurare il profitto. L'uso di termini astratti e generici può dare luogo a una carenza di informazioni che a sua volta può causare incomprensioni e conflitti, come quelli che emergono quando lo studente si trova a dover effettuare delle prove diverse da quelle che si aspettava di sostenere e per le quali si era preparato.

Non riteniamo che l'arbitrarietà e l'indeterminatezza, proprie di tutte le relazioni interpersonali, possano essere totalmente eliminate da] rapporto insegnante-alunno, anche solo in ordine alla misurazione del profitto; crediamo però che esse debbano interferire nella misura minore possibile, e che sia quindi auspicabile un maggior impegno verso una più dettagliata comunicazione degli obiettivi e dei crileri di valutazione.

La seconda funzione ausiliaria del testing si esplica nelle sperimentazioni didattiche. Perché il termine sperimentazione non sia un'etichetta abusiva data ad iniziative scolastiche più o meno valide, è necessario che gli insegnanti seguano una rigorosa metodologia sperimentale e che possiedano strumenti precisi di misurazione del profìtto: questi permetteranno di confrontare i risultati degli allievi con i quali è stata effettuata la sperimentazione (gruppo sperimentale) con i risultati degli altri allievi (gruppo di controllo). Solo attraverso accurate verifiche si possono rilevare oggettivamente gli effetti positivi o negativi di una sperimentazione; in caso contrario, ogni giudizio sul successo dell'esperimento è lasciato alla valutazione soggettiva di chi l'ha condotto.

1.7. Prognosi e attitudini

Pur non rientrando nella tematica del LT in senso stretto, i test di attitudine linguistica meritano un cenno a parte, in relazione all'interesse che essi suscitano nell'insegnante dì lingue straniere. In effetti le capacità finali C, rilevabili al termine di un processo di apprendimento, equivalgono alla somma delle attitudini A e dell'addestramento specifico o "esperienza" E secondo la formula A + E = C. Pertanto un giudizio su un'esperienza educativa deve tener conto, oltre che dei risultati finali, delle attitudini dei discenti.

Lo studio delle attitudini linguistiche, inoltre, ci rivela quali processi mentali sono coinvolti nell'apprendimento linguistico, orientando così la nostra azione didattica; esso serve anche a costruire i test di attitudine attraverso cui si può fare la prognosi del successo e delle difficoltà degli alunni, permettendo una programmazione delle esperienze didattiche, la scelta dei mezzi più efficaci e la distribuzione del carico di lavoro in relazione alle capacità di apprendimento degli allievi.

Lo psicolìnguista americano J. B. Carroll, in una serie di indagini e ricerche negli U.S.A., ha evidenziato gli elementi attitudinali specifici dell'apprendimento delle lingue straniere. Tra i più rilevanti, ricordiamo:

— la capacità di intuire certe leggi morfofonematiche presenti, sotto forme diverse, in tutte le lingue; sono tipiche, ad esempio, quelle relative alla formazione dei numeri (tre-tredici-trenta-tre-cento, quattro-quattordici-quaranta-quattrocento, ecc.);

— la percezione auditiva e visiva;

— la capacità di associare i suoni con i simboli grafici corrispondenti;

— la sensibilità nel distinguere le strutture logico-grammaticali (per esempio, la capacità di riconoscere, in qualunque tipo di frase, gli elementi che hanno funzione di soggetto, complemento, ecc.).

A questi fattori specifici si associano altri elementi più generalizzati, quali la memoria immediata e a lungo termine, i fattori verbali e psicomotori dell'intelligenza, la capacità di comprendere le istruzioni e di organizzarsi, ecc.

Tenendo conto delle varie componenti, il Carroll ha elaborato il Modern Language Aptitude Test, una prova attitudinale che ha rivelato un alto indice di correlazione coi risultati scolastici degli studenti che ad essa erano stati sottoposti. I buoni risultati prognostici del test testimoniano non solo della validità di tale strumento ma anche che il modello attitudinale elaborato dal Carroll, trovando conferma nelle sue applicazioni scolastiche, può essere assunto come precisa indicazione sulle modalità dell'apprendimento linguistico.

CAP. 2 Le prove tradizionali

2.1. Caratteri delle prove tradizionali

Col termine prove tradizionali designiamo quelle prove di controllo del profitto che tutti gli insegnanti ben conoscono, anche perché su di esse si basano gli esami scolastici di lingue straniere: la traduzione, il riassunto, il questionario, la composizione, il dettato, l'interrogazione/colloquio.

Una caratteristica comune a tutte queste prove è la complessità; ognuna di esse coinvolge infatti numerose variabili e richiede il superamento di difficoltà di vario tipo. La possibilità di errori di natura diversa rende molto problematico e soggettivo il giudizio.

Che la soggettività dei mezzi tradizionali di controllo non sia un'ipotesi, bensì una realtà, è stato dimostrato da numerose esperienze, in Italia e all'estero. Sottoponendo un elaborato a gruppi di docenti, e chiedendo a ciascuno di dare un voto in decimi, si sono rilevate fortissime variazioni (in alcuni gruppi, addirittura dal 4 al 9, o dal 3 all'8). Ciò si è verificato non solo con temi, riassunti, traduzioni o prove analoghe, ma anche con problemi di matematica, che a prima vista potrebbero sembrare prove oggettive, ma in realtà rientrano nel campo delle prove operanti su molteplici variabili. Si è potuto inoltre rilevare che la stessa dispersione, cioè il ventaglio di voti, si aveva quando l'elaborato veniva valutato da docenti della materia e quando esso veniva invece valutato da insegnanti di materie diverse; non vi sarebbe, in altre parole, differenza tra gli esperti e i non competenti.

Per limitare la soggettività nella valutazione delle prove tradizionali sono state proposte alcune procedure. Anzitutto, l'insegnante deve analizzare le prove stesse per accertare quante e quali variabili entrino in gioco. Fatto ciò, si prospettano due soluzioni. La prima prevede che si stabilisca una gerarchia di valori tra i vari elementi della prova; ad esempio, per una composizione in lingua straniera, la graduatoria potrebbe contemplare, in ordine di importanza; la aderenza al tema proposto; la scelta appropriata del lessico; la correttezza morfosintattica; l'ortografia, ecc., con tutte le possibili varianti che tengano conto degli obiettivi che l'insegnante si prefigge. Naturalmente gli allievi debbono essere preventivamente informati della graduatoria di valori (e quindi del "peso specifico" degli eventuali errori) non solo per potersi concentrare su ciò che è più importante, ma anche perché il voto globale dato dall'insegnante risulti giustificato dalle premesse.

La seconda soluzione consiste invece nell'attribuire tanti voti quanti sono gli elementi, le variabili o le parti in cui si articola la prova (nel nostro esempio, daremmo un voto per l'aderenza al tema, un altro per la grammatica, un terzo per il lessico, un quarto per l'ortografia, ecc.). Questa proposta di soluzione ci fa chiaramente intendere come l'ideale che si vuole raggiungere sia una serie di dati oggettivi sui singoli fattori. Ma se questo è il fine, il solo mezzo adeguato è una batteria di test oggettivi predisposti opportunamente, mentre nessuna delle due procedure suggerite risolve alla radice il problema della soggettività del giudizio dell'insegnante.

Un difetto comune a molte prove tradizionali — per esempio certi "compitini di grammatica" — è la mancanza di una visione funzionale della lingua: infatti è inutile verificare l'acquisizione di questo o quel dettaglio, quando ciò che conta è la capacità di adoperare la lingua. L'errore risiede non tanto nel controllare l'acquisizione di sistemi parziali, quanto piuttosto nell'assumere elementi di dettaglio come indice di abilità assai più complesse. Troppo spesso, coi sistemi tradizionali, si è confusa la capacità di svolgere un certo tipo di prova con il possesso delle abilità linguistiche: tipicamente, il saper tradurre identificato con la conoscenza della lingua straniera.

2.2. La traduzione

Robert Lado ha messo in luce i limiti della traduzione come test:

" 1. Gli studenti meglio preparati non traducono mentre usano la lingua straniera.

2. Ci sono vari modi di tradurre e di giudicare una traduzione: dal punto di vista artistico, dell'accuratezza delle informazioni, della correttezza grammaticale, dell'appropriatezza lessicale. Una traduzione può essere valutata da questi (e altri) punti di vista. Se lo studente è costretto a tradurre a scopo di controllo lessicale o grammaticale, può risentirne negativamente la sua capacità di accostarsi alla letteratura.

3. La votazione delle traduzioni tende a non essere affidabile a causa dei vari modi di tradurre e delle varianti possibili, accettate o no da chi valuta.

4. La traduzione è un'abilità speciale, diversa dal capire, parlare, leggere e scrivere.

5. La traduzione è un test lento. A meno che abbia avuto un addestramento speciale, lo studente bravo impiega più tempo a tradurre una lettera che a comporla. Nel tempo occorrente per tradurre un brano può, usando altre tecniche, affrontare una quantità maggiore di materiale.

6. La traduzione è lenta da correggere, perché l'esaminatore deve considerare ogni soluzione per vedere se sia accettabile.

7. L'uso della traduzione nei test incoraggia l'abuso della traduzione in aula".

Alle osservazioni del Lado possiamo aggiungere:

a) Non è facile reperire del materiale da tradurre che sia ben graduato per difficoltà sia sul piano lessicale che su quello morfosintattico; i branetti creati "ad hoc", imbottiti di problemi grammaticali, oltre a non avere alcun valore letterario, sono spesso penosamente insulsi.

b) Si tende ad iniziare la traduzione mediante frasi staccate, svincolate da ogni contesto o situazione, e perciò talora ambigue o interpretabili in vari modi.

c) L'impiego della traduzione incoraggia l'uso indiscriminato dei dizionari bilingui, con la conseguente mistificazione sulla presunta "equivalenza" dei vocaboli nelle due lingue — errore inevitabile ove non si tenga conto dei contesti di civiltà.

L'uso della traduzione come test è valido là ove occorra verificare specificamente la capacità di tradurre (per esempio, nei corsi per traduttori); negli altri casi, esso non appare sufficientemente giustificato, in quanto gli svantaggi superano abbondantemente i vantaggi: il Lado afferma che "forse le sole cose favorevoli da dire sulla traduzione come test è che i temi di traduzione sono facili da assegnare e non occupano molto spazio". A favore della traduzione stanno i vecchi metodi di insegnamento, le tendenze conservatrici, i programmi ministeriali per le scuole medie superiori (v. gli esami di Maturità Scientifica), e i piani di studio universitari. Sappiamo come queste forze esercitino un'azione frenante nei confronti dei metodi più avanzati; di fatto, in molte situazioni, la traduzione è tuttora considerata non come un momento terminale, un'abilità che si acquisisce in seguito alla conoscenza della lingua, bensì come un indispensabile strumento di apprendimento della lingua straniera.

Un cenno a parte meritano le "retroversioni", ossia quelle traduzioni dall'italiano che hanno come punto d'arrivo dialoghi o brani in lingua straniera già noti agli studenti: nella misura in cui sono esercizi di rievocazione di materiale già appreso, le retroversioni non soggiacciono alle critiche mosse alle traduzioni vere e proprie. Vanno però usate con cautela, e solo se si ha la certezza che vi sia stato l'apprendimento di tutto il brano richiesto; pertanto le retroversioni come test sono o superflue (in quanto presuppongono una verifica già effettuata) o pericolose (in quanto rischiano di essere vere e proprie traduzioni laddove gli studenti non avessero sufficientemente memorizzato il materiale in lingua straniera).

Le versioni dalla lingua straniera sono a volte usate per verificare la comprensione di brani o poesie; lo stesso scopo, però, può essere raggiunto mediante prove oggettive, e senza ricorrere alla lingua madre (v. cap. 6). Se invece le si impiega come vere e proprie traduzioni, esse coinvolgono tutta la problematica linguistica e di civiltà che interessa le versioni in lingua straniera.

2.3. La composizione, il riassunto, il questionario aperto

Premesso che per questionario aperto intendiamo ogni tipo di questionario in cui le domande ammettano più risposte, diverse tra loro nel contenuto e/o nella forma, raggruppiamo queste tre prove, malgrado le differenze che intercorrono tra di esse, in quanto, come test, hanno caratteristiche comuni, e anche nella prassi didattica spesso si considerano i riassunti ed i questionari aperti come "composizioni guidate", e li si impiegano come avviamento al comporre.

Queste prove richiedono all'esaminato di:

— formulare mentalmente i concetti più adeguati a svolgere il tema, riassumere il brano, o rispondere alle domande, e organizzarli opportunamente in sequenza logica;

— redigere frasi corrette in lingua straniera, idonee ad esprimere i concetti.

A sua volta, la fase di redazione implica:

— la scelta di elementi lessicali appropriati;

— il rispetto delle strutture morfosintattiche;

— il rispetto dell'ortografìa e della punteggiatura;

— a livello avanzato, il rispetto di norme stilistiche e retoriche: chiarezza, efficacia, persuasività, ecc.

Tutte queste abilità possono essere efficientemente misurate per mezzo di test oggettivi, eliminando il ricorso a composizioni, riassunti o questionari che, in quanto prove complesse, non sono in grado di fornire misurazioni indistorte del profitto. La principale obiezione contro i test è la loro presunta inidoneità a verificare la capacità di scrivere brani di prosa. E mentre per la traduzione si possono opporre critiche di fondo, la capacità di comporre, riassumere, redigere lettere o resoconti, rispondere per iscritto a questionari è di solito considerata parte integrante del "saper scrivere". In effetti, nel criticare queste prove come test non si intende affermare che esse non debbano rientrare negli obiettivi di un corso di lingue straniere. Si vuole invece sfatare l'opinione corrente secondo cui solo prove di composizione possono verificare la capacità di comporre. Poiché esiste un'alta correlazione tra i dati ottenuti mediante opportuni test e quelli ricavati attraverso prove di composizione, è possibile fare a meno di queste ultime a scopi puramente valutativi. Anche in questo caso, gli esami (di Stato e non) esercitano un certo tipo di influenza, concorrendo a far identificare esercizi e test e a confondere gli obiettivi con i mezzi di controllo.

2.4. Il dettato

II dettato non è una prova oggettiva anche se, da un certo punto di vista, potrebbe sembrarlo: infatti, nella correzione, gli errori sono sicuramente rilevabili, in quanto si tratta semplicemente di osservare se il testo dettato sia stato riprodotto fedelmente oppure no. Ma due importanti fattori ne invalidano l'oggettività. Anzitutto, anche il dettato è una prova complessa, in cui entrano in gioco la comprensione auditiva, l'ortografia e l'interpunzione. A loro volta i problemi ortografici si suddistinguono a seconda che interessino il lessico (ortografia lessicale) ovvero la morfologia (accenti, apostrofi, morfemi inflessionali — suffissi e desinenze —: ortografia grammaticale). L'esecuzione di un dettato può quindi comportare errori di natura diversa, la cui gravità è stabilita soggettivamente da chi li corregge.

Un secondo fattore di distorsione è inerente al modo in cui le prove di dettato vengono effettuate. Nella prassi scolastica sono in uso tecniche diverse; c'è chi detta subito e rilegge, e chi invece legge una volta anche prima di dettare; alcuni dettano parola per parola, altri per segmenti significativi o intere frasi; il ritmo di dettatura può essere lento o veloce, ecc. Queste variabili fanno sì che ben difficilmente un brano venga dettato allo stesso modo da due persone diverse, o addirittura che la stessa persona detti due volte (a gruppi diversi) senza variazioni.

Inoltre, la ricezione di chi è seduto vicino a colui che detta è diversa da quella di chi è seduto in fondo all'aula, e gli psicologi hanno rilevato differenze di prestazioni anche in relazione alla diversa illuminazione e rumorosità di fondo dell'ambiente. Pertanto, se si vogliono comparare due dettature dello stesso brano, occorre che il dettato sia registrato su disco o nastro e diffuso mediante un sistema di cuffie, riducendo al minimo i disturbi ambientali. L'uniformità di somministrazione è perciò ottenibile solo in particolari situazioni (ad esempio il laboratorio linguistico), ma queste condizioni non sono facilmente realizzabili, né prive di svantaggi. L'audizione da un mezzo di registrazione impedisce la "lettura delle labbra" e i registratori o i giradischi di solito non riproducono l'intera gamma delle frequenze sonore, per cui va perduta una parte del messaggio acustico.

Sul dettato come esercizio i pareri sono discordi: alcuni autori lo ritengono superfluo: i più lo ritengono invece utile, soprattutto nella fase di passaggio dal codice orale allo scritto. Riteniamo che le divergenze di opinione possano essere in relazione sia alle caratteristiche della lingua straniera considerata, sia al fatto che alcuni studiosi si sono interessati al problema della "lingua straniera", ossia di una lingua estera insegnata fuori dai paesi in cui tale lingua si parla (p. es. il francese in Italia) mentre altri si sono occupati prevalentemente della "seconda lingua", ossia dell'insegnamento di una lingua, a studenti stranieri, nel paese in cui tale lingua è parlata (p. es. l'inglese in Gran Bretagna o Stati Uniti).

Sulla scarsa produttività del dettato come test esiste, al contrario, una notevole concordanza di vedute. Premesso che le abilità interessate dal dettato possono essere valutate più efficacemente con altre tecniche, analizzando a fondo il dettato si può notare come esso in realtà non misuri certi fattori che in apparenza vi sono coinvolti. Ad esempio, esso non è di per sé un test di discriminazione auditiva. Se si detta la parola inglese ship e questa viene scritta correttamente, noi possiamo dedurre che lo studente discrimina tra il suono /i/ di ship e il suono /i:/ di sheep solo a condizione che:

a) entrambi i vocaboli siano stati appresi dallo studente;

b) il contesto sia tale da non privilegiare un vocabolo rispetto all'altro.

Se la frase dettata è I can see a ship entering Dover Harbour il contesto è tale per cui le probabilità di sheep sono pressoché nulle: lo studente che commettesse questo errore rivelerebbe non tanto problemi di discriminazione auditiva, quanto piuttosto problemi di apprendimento del lessico.

Rispetto alle altre prove tradizionali, comunque, il dettato ha il vantaggio della rapidità di somministrazione e della facilità di correzione, qualità che ne fanno una prova abbastanza utile, sempreché coloro che se ne servono siano consapevoli dei suoi limiti e preparino del materiale idoneo.

2.5. Le prove orali tradizionali

L'interrogazione tradizionale assumeva vari aspetti a seconda delle circostanze, ma in genere comprendeva una o più delle seguenti attività:

— traduzione di frasi nella lingua straniera, oralmente o alla lavagna;

— lettura di brani;

— retroversione di brani, con eventuale commento grammaticale e lessicale;

— dialogo dello studente con l'insegnante (conversazione libera o risposte a domande predeterminate).

Ovviamente, la traduzione di frasi alla lavagna non è affatto un'attività orale, anche se era comunemente adoperata dagli insegnanti che impiegavano il metodo grammatica/traduzione; del resto, a tutti è noto come, per mettere voti nella colonna ORALE del registro si usasse ricorrere anche a dettati, compitini di grammatica o di vocaboli, e simili. Tutti questi espedienti servivano a dare classificazioni collettive, risparmiando il tempo richiesto dalle verifiche indviduali, ma ciò non toglie che tanti, troppi "voti di orale" fossero dai falsi ideologici, in quanto poco o nulla avevano a che fare con il saper comprendere e parlare.

L'abilità del saper comprendere, in particolare, era la più trascurata, e a ciò si devono in larga misura gli insuccessi, all'estero, di coloro che apprendevano la lingua coi metodi tradizionali. Infatti anche nei colloqui si richiedeva spesso che lo studente rispondesse a domande prestabilite ed a lui già note, esigendo solo un minimo sforzo di comprensione.

Il colloquio è il test meno facilmente valutabile, ossia la prova in cui si riscontrano i più bassi indici di affidabilità. Le cause vanno ricercate nella complessità della prova (un colloquio abbraccia problemi di pronuncia, intonazione, ritmo, accento, fluidità, appropriatezza lessicale, correttezza grammaticale, e altri) e nell'effetto di alone che, nel colloquio, è avvertibile in misura maggiore che nelle altre prove soggettive. Esso viene definito come la "distorsione di giudizio dovuta alla tendenza di valutare una caratteristica particolare di un individuo, sulla base dell'impressione globale che il valutatore si è fatta nei riguardi del valutato o, viceversa, la tendenza ad allargare il giudizio di una caratteristica su tutta la personalità del valutato".

In altre parole, ciò significa che chi valuta è esposto a due tendenze che possono falsare il suo giudizio. La prima è quella di estendere un giudizio generale a tutti i particolari: dopo aver giudicato un allievo positivamente o negativamente nel suo complesso, incontriamo una certa difficoltà ad accettare una prestazione di segno opposto, ossia il bel voto dell'allievo scadente o il brutto compito dello studente bravo. Eppure, anche prescindendo da cause accidentali (indisposizioni, stati emotivi o ansiosi), ed esclusa la possibilità di inquinamento della prova (copiature, suggerimenti), un risultato divergente dagli altri è perfettamente plausibile qualora la prova si riferisca ad un'abilità particolare, di tipo specialistico, che presupponga doti, attitudini e preparazione difformi, in qualche misura, da quelle richieste per le altre prove. È indubbio che esista una certa correlazione fra i diversi aspetti di una disciplina, ma ciò non deve far escludere la possibilità che uno studente riesca in certe prove assai meglio che in altre.

La seconda tendenza è quella di generalizzare un aspetto particolare. È il caso di chi, accertate in un allievo buone capacità in una prova di lettura, viene indotto a supporre buone capacità in tutte le abilità linguistiche, comprese quelle che non hanno alcun rapporto diretto col saper leggere. Accade di frequente, nelle riunioni dei consigli di classe, che un insegnante, avendo giudicato in un certo modo un allievo, si meravigli del fatto che altri colleghi abbiano espresso, per le loro materie, giudizi molto diversi dal suo.

All'effetto di alone si debbono anche le interferenze sulla misurazione del profitto di elementi che col profitto stesso non hanno nulla a che vedere: la condotta dello studente, il suo aspetto fisico più o meno gradevole, le sue doti di simpatia e comunicatività, la sua capacità di assumere un comportamento gradito all'insegnante, ecc. Dell'esistenza di questi condizionamenti siamo tutti abbastanza consapevoli, se non altro perché abbiamo dovuto tenerne conto nella nostra vita di studenti; non sempre, però, ci rendiamo conto di quanto penetranti, sottili e subdole possano essere certe interferenze, che non si manifestano in modo sensibile ma incidono più sui nostri riflessi inconsci che sulle nostre valutazioni razionali, portandoci a giudizi errati mentre noi, in buona fede, riteniamo di essere obiettivi, sereni ed equilibrati.

2.6. Il voto

Poiché nel corso di queste pagine facciamo più volte riferimento ai voti scolastici, riteniamo opportuno inserire a questo punto alcune osservazioni in proposito.

La legislazione vigente prevede che ogni insegnante formuli nel corso di un certo periodo (trimestre o quadrimestre) un giudizio sul profitto di ciascun allievo. Al momento dello scrutinio i giudizi vengono tramutati in voti da 1 a 10. La prassi è tuttavia ben diversa, in quanto i voti in decimi vengono usati in riferimento a ogni singola prova. Ciò porta alla istituzionalizzazione della confusione tra misurazione del profitto e valutazione dell'allievo.

Come strumento di misurazione, i voti in decimi sono del tutto inadeguati; lo dimostra l'uso dei "mezzi voti", dei "più", dei "meno", dei "meno meno", e così via, senza che peraltro vi sia accordo sul valore preciso di questi artifici. Il nostro stesso ordinamento scolastico dimostra di essere consapevole dell'insufficienza dei voti in decimi, prevedendo voti in trentesimi per gli esami universitari, in sessantesimi per gli esami di maturità, in centesimi o centodecimi per gli esami di laurea; in quanto ai punteggi delle abilitazioni e dei concorsi, è prevista una scala di 75 o 100 punti ampliata mediante l'uso di due cifre decimali, consentendo così 7.500 o 10.000 punteggi diversi.

Se per la misurazione del profitto la scala decimale è troppo ristretta, per la valutazione complessiva essa è sovrabbondante. La opinione più diffusa, al riguardo, esclude che il risultato di un processo valutativo possa essere adeguatamente espresso da un numero o dalla media di una serie di numeri. In effetti gli aspetti qualitativi sono di gran lunga più importanti di quelli quantitativi, per cui un "profilo" o una scheda di valutazione in cui compaiano, oltre al profitto, tutte le notizie relative alla personalità dello studente, sono strumenti assai più idonei della pagella tradizionale.

Qualora a fini pratici, ovvero in ossequio alle leggi e alle tradizioni, si debba esprimere una valutazione globale mediante una scala (cercando di quantificare degli aspetti qualitativi), le possibilità si riducono a cinque: lo studente si colloca o nella media dei valori considerati, o al disopra della media, o al disotto di essa; a loro volta, gli scostamenti dalla media possono essere più o meno ampi. La seguente tabella riporta, per ciascuna delle cinque possibilità, gli aggettivi e i voti decimali normalmente adoperati per esprimere i relativi giudizi.

Valutazione

Aggettivi

voto

Molto al disotto della media

pessimo, negativo

4

Al disotto della media

insufficiente, mediocre, scarso

5

Nell'ambito della media

sufficiente, medio

6

Al disopra della media

discreto, distinto, buono

7

Molto al disopra della media

ottimo, eccellente

8

I voti compresi tra il 4 e l'8 sono infatti quelli che normalmente compaiono nelle pagelle scolastiche, mentre i voti inferiori o superiori (1, 2, 3, 9, 10), sono in genere usati più per singole prove che per giudizi complessivi, a meno che non concorrano circostanze eccezionali. In quanto alla frequenza dei voti, essi sono tanto più numerosi quanto più si avvicinano al valore centrale: il 6 è di gran lunga il voto più frequente, seguito dal 5 e dal 7 e, a distanza, dal 4 e dall'8. Questo schema, tuttavia, soggiace a numerose alterazioni dovute in parte ad usi ormai invalsi nella scuola (ove spesso

si tende a considerare il voto non tanto come un giudizio quanto piuttosto come un premio o una punizione) e in parte alla disposizione di legge che fa coincidere la sufficienza col voto 6. Poiché

i concetti di sufficienza, idoneità e promovibilità non coincidono necessariamente con quello di appartenenza alla media, a fine anno si mettono in moto vari meccanismi, tra cui i "voti di consiglio", che hanno l'effetto pratico di tramutare in 6 certi voti negativi e si giustificano per la necessità di conciliare istanze diverse. Vi è quindi difformità tra le votazioni dei trimestri intermedi (non vincolate alla promozione) e quella finale, in cui sono di solito presenti più voti sufficienti, indipendentemente dagli effettivi progressi degli studenti.

Per superare tutti questi equivoci riteniamo opportuno che la misurazione del profìtto venga effettuata sulla base di scale assai più ampie di quella in decimi: tra tutte, quella in centesimi è senz'altro la più facilmente adoperabile, e scale diverse si possono ricondurre ad essa in modo abbastanza semplice. Al tempo stesso, occorre abolire i voti come strumento di valutazione, sostituendoli con profili valutativi sufficientemente articolati. Ciò richiederà un cambiamento di abitudini non solo da parte degli insegnanti ma anche degli allievi e delle loro famiglie, e occorrerà una paziente e penetrante opera di chiarimento per evitare di giungere all'incomunicabilità tra scuola e famiglia. D'altronde, solo superando gli schemi attuali si potrà impostare su base scientifica il problema della selezione nella scuola e della "meritocrazia".

Nel frattempo ogni insegnante dovrà contemperare le diverse esigenze nel modo più proficuo; se usa tecniche rinnovate di misurazione e valutazione è necessario che ne renda edotti allievi e famiglie, perché il linguaggio dei voti (come ogni linguaggio) ha essenzialmente il fine di comunicare; qualora si parlassero linguaggi diversi, ciò sarebbe ancor peggio del sistema vigente che, pur con i suoi grossi difetti, ha il pregio di essere noto a tutti.

Cap. 3 I vari tipi di test

3.1. Ipotesi di classificazione

I test possono essere classificati secondo diversi parametri, in relazione alle caratteristiche che vengono considerate di volta in volta preminenti. Ecco anzitutto un quadro di riferimento riguardante i vari tipi di test esaminati in questo capitolo.

A) Secondo l'ampiezza del campo d'indagine:

a) Test fattoriali

b) Test di abilità

c) Test globali di lingua

d) Test di lingua-civiltà.

B) Secondo i livelli linguistici:

a) Test fonologici

b) Test morfosintattici

c) Test lessicali.

C) Secondo il momento di applicazione:

a) Test intermedi

b) Test di livello

c) Test di padronanza.

D) Secondo il contenuto:

a) Test specifici

b) Test aspecifici.

E) Secondo il grado di sistematicità ed elaborazione:

a) Test episodici

b) Test sperimentali

c) Test standardizzati.

L'ipotesi di classificazione qui proposta si differenzia in certa misura dagli schemi suggeriti da altri autori. Riteniamo che le nostre scelte siano giustificate da tre motivi fondamentali. Anzitutto vi è discordanza tra i vari autori sui termini adottati, soprattutto a proposito di vocaboli piuttosto generici, quali profitto, idoneità, progresso, capacità e simili. Ciò è in parte dovuto alla difficoltà di tradurre adeguatamente certi termini stranieri, come gli inglesi achievement, attainment, proficiency. Su un punto importante vi è comunque un certo accordo, e cioè nel considerare i test di profitto in contrapposizione ai test psicologici, psicometrici, attitudinali, ecc. Poiché, tuttavia, tutti i test di cui ci occuperemo rientrano in questa categoria, l'impiego del termine "test di profitto" risulta troppo generico per essere di alcuna utilità pratica ai nostri fini.

Una seconda giustificazione si ricollega al fatto che noi ci interessiamo esclusivamente di language testing, ossia di un settore specifico e ristretto con particolari presupposti metodologici e precise caratteristiche di impiego, mentre altre classificazioni sono rivolte a coprire l'intera gamma delle possibilità di uso dei test nella scuola. Anche la terminologia assume valori ben precisi: un termine di per sé generico, quale "abilità", possiede nel campo della didattica delle lingue un significato ben determinato (vedi paragrafo 1.4, punto f), il quale rifluisce nella definizione dei "test di abilità" così come essa è formulata nel paragrafo seguente.

Infine, ci è parsa primaria l'esigenza di mettere in rilievo i diversi ordini di fattori che entrano in gioco nel testing delle lingue straniere; lo schema che ne è risultato evidenzia i cinque parametri fondamentali con le relative sotto-classificazioni.

3.2. Il campo d'indagine

Un test può vertere su un campo più o meno ristretto di elementi di lingua-civiltà.

I test fattoriali misurano un solo fattore od elemento, ossia prendono in esame un singolo problema di apprendimento della lingua-civiltà. Per esempio, un test sugli aspetti morfologici di un tempo verbale è un test fattoriale. È intuibile come un test complesso sia costituito da più test fattoriali coordinati.

I test di abilità misurano il grado di apprendimento nell'ambito di una abilità linguistica (capire, parlare, leggere, scrivere), rilevando e interrelando i diversi fattori che operano nell'ambito di tale abilità. Un test di comprensione della lettura è un esempio di test di abilità relativo al saper leggere.

I test globali di lingua misurano il grado di apprendimento linguistico complessivo da parte di un allievo ed operano su tutte le abilità linguistiche nel loro complesso.

I test di lingua-civiltà, oltre al grado di apprendimento della lingua, mirano a rilevare il livello di comprensione interculturale sulla base di un approfondimento degli elementi della civiltà straniera.

I test globali di lingua e i test di lingua-civiltà sono difficili e complessi da realizzare; vedremo nei successivi capitoli i metodi, le tecniche e le procedure di costruzione dei test. Qui vogliamo rilevare come i test contenuti in certi corsi e volumi e presentati come prove globali spesso siano invece test parziali, soprattutto in quanto non forniscono materiale per la verifica delle abilità orali (capire e parlare).

3.3. I livelli linguistici

Poiché ogni lingua viene analizzata su diversi piani o livelli, avremo test caratterizzati dal vertere primariamente su problemi a livello fonologico, morfosintattico o lessicale.

I test fonologici misurano la padronanza del sistema fonologico della lingua straniera. Essi riguardano quindi i fonemi segmentali (vocali, dittonghi, consonanti) ed i valori soprasegmentali (ritmo, accento, intonazione, giuntura). Tipici delle abilità orali, essi verificano sia l'aspetto passivo o ricettivo (percezione e discriminazione di suoni, comprensione della lingua parlata) sia quello attivo o produttivo (il parlare nei suoi vari aspetti).

I test morfosintattici rilevano la padronanza delle strutture morfosintattiche e misurano l'acquisizione del sistema grammaticale nelle sue varie estrinsecazioni. Rifacendoci alla lezione della linguistica strutturale riteniamo infondata la distinzione classica tra morfologia e sintassi; il concetto di lingua come sistema conduce al superamento di confini artificiosi, mal definiti e non rispondenti ai criteri di analisi linguistica.

Anche per i test lessicali è essenziale la distinzione tra lessico passivo (riferito alle abilità del capire e del leggere) e lessico attivo (impiegato nel parlare e nello scrivere). Nella lingua materna e nelle lingue straniere il lessico passivo è di norma assai più ampio di quello attivo.

Malgrado alcuni autori, specialmente nell'area linguistica francese, abbiano talora considerato i test ortografici come categoria a sé stante, noi, accogliendo l'impostazione di R. Lado, non riteniamo giustificata questa distinzione in quanto i problemi di ortografia lessicale rientrano nel livello lessicale e i problemi di ortografia grammaticale nel livello morfosintattico. Non esistono test puramente ortografici, a meno di giungere a un tal grado di artificiosità da contrastare con le premesse sulla funzionalità del linguaggio. Il negare che i test ortografici costituiscano una classe autonoma non significa tuttavia escluderli dall'impiego sistematico, che è anzi necessario nella misura in cui il codice scritto presenta difficoltà di apprendimento.

Abbiamo invece escluso dal nostro discorso, ritenendoli di scarso interesse per la maggioranza degli insegnanti italiani di lingue straniere, i problemi relativi all'uso di alfabeti diversi da quello latino (greco, cirillico, arabo, ecc.) ovvero di sistemi ideografici.

3.4. Impiego dei test

Nel corso di un programma di lingua-civiltà straniera i test vengono impiegati in momenti e per scopi diversi.

Se il nostro insegnamento si basa sull'unità didattica come modello operativo, è indispensabile che non si proceda all'unità didattica successiva prima di aver accertato che gli allievi abbiano acquisito in modo sicuro e funzionale tutti i contenuti dell'unità precedente. Per questo si afferma che il testing si colloca, per sua natura, nella fase conclusiva di ciascuna unità didattica.

Questa collocazione naturale ha la sua giustificazione non solo nel concetto di unità didattica, ma anche in relazione all'esigenza di condurre controlli sistematici. Non presentano invece carattere di sistematicità, anche se costituiscono una fonte d'informazione preziosa per l'insegnante, tutti quei dati che è possibile raccogliere durante ogni lezione, specialmente se questa è condotta in modo che gli allievi partecipino attivamente. Le rilevazioni sul profitto condotte durante la fissazione dei dialoghi o delle strutture — o, in genere, in qualunque momento diverso da quello specifico del testing — se tradotte in giudizi o espresse sotto forma di voti, rischiano di riportare alla confusione tra esercizio e test, già denunciata come ascientifica. Inoltre può essere demotivante per gli allievi, nel momento in cui stanno compiendo degli sforzi per apprendere, vedere il loro insegnante trasformarsi da colui che li aiuta ad imparare in colui che li giudica e sanziona. Per questi motivi riteniamo opportuno che si elabori una serie completa di test intermedi, uno per ciascuna unità didattica. I test di livello misurano il grado di apprendimento complessivo ad un certo punto dello sviluppo del programma; servono a stabilire eventuali fasce di livello, oppure a collocare nuovi allievi nel gruppo o nella classe cui. sono idonei.

Per test di padronanza intendiamo quelli che misurano il grado di autonomia linguistica raggiunto al termine di un programma completo: è il caso dei test finali di un corso di lingua-civiltà.

3.5. Il contenuto dei test

Per quanto riguarda i contenuti, sia linguistici che di civiltà, esistono due possibilità.

Un test può fare preciso ed esplicito riferimento ad un particolare corso, testo o materiale di apprendimento di una lingua straniera, ed esaminare l'allievo sulla base e nei limiti di esso. L'impiego di questi test specifici è rigorosamente riservato agli allievi che usano quel materiale, mentre essi sono inutilizzabili in situazioni diverse.

Esistono tuttavia anche test aspecifici, che prescindono totalmente da qualsiasi corso, testo o materiale e sono pertanto di uso generalizzato. Essi si basano di norma su indagini e ricerche attraverso cui si stabilisce il "corpus" di materia che si presuppone noto a studenti di un certo tipo di scuola o a un dato livello; tali indagini sono condotte o mediante questionari rivolti a gruppi sufficientemente numerosi di esperti oppure indirettamente, per esempio comparando un numero adeguato di testi per ricavarne gli elementi comuni. Sono aspecifici, di solito, i test di profitto e le schede di valutazione poste in commercio, salvo quelli che accompagnano esplicitamente un dato corso.

Il vantaggio principale dei test aspecifici è quello di permettere il confronto tra gruppi diversi di studenti, la cui preparazione è stata effettuata con materiali e metodi disomogenei; indirettamente, quindi, si può giudicare della validità del materiale didattico, ma perché il giudizio sia probante occorre che il test sia neutrale, ossia non privilegi indebitamente alcuni gruppi o testi a danno di altri. Inoltre, non vi deve essere stato un addestramento particolare al contenuto del test, e tutti i gruppi debbono essere egualmente preparati alla tecnica di esecuzione del test.

Le difficoltà di un test si riferiscono sia al contenuto dei quesiti sia al tipo di tecnica usata per la risposta. Questo secondo ordine di difficoltà deve essere rimosso preventivamente, addestrando gli allievi a tecniche di risposta a cui non sono abituati, per evitare che al momento della somministrazione della prova si sovrappongano fattori emotivi quali l'insicurezza ed il disagio, tali da influire negativamente sul punteggio. Alcuni test in commercio sono accompagnati da fogli per le esercitazioni preliminari, attraverso i quali gli allievi apprendono la tecnica di esatta esecuzione del test vero e proprio. Non si deve confondere l'addestramento alla tecnica di risposta con l'addestramento al contenuto del test, ossia con l'anticipazione delle difficoltà inserite nei quesiti e delle relative soluzioni; questo addestramento snaturerebbe il test e toglierebbe ogni validità ai punteggi conseguiti. Un test aspecifico, in quanto tale, comprende normalmente una grande quantità di problemi ed è normale che ciascun esaminato risponda solo ad una parte dei quesiti, tralasciando quelli dei quali non è in grado di individuare la soluzione (per ignoranza del lessico, delle strutture, degli elementi di civiltà, ecc.). Un test di questo genere può quindi evidenziare le lacune individuali o dei gruppi e segnalare la necessità di integrazioni e sviluppi nel programma didattico; è chiaro che le lacune si colmano mediante apposite esercitazioni, non contrabbandando le risposte a qualche quesito.

Vorremmo infine sottolineare che non esiste un conflitto tra test specifici ed aspecifici, nel senso che gli uni siano da preferire agli altri: entrambi trovano la loro naturale collocazione nell'attività scolastica. Mentre i test specifici verificano che gli allievi apprendano il materiale didattico con cui la classe lavora, e sono quindi di uso regolare e frequente, i test aspecifici sono usati come test di livello o di padronanza ogni volta che occorra uscire dai limiti del testo adottato e controllare l'apprendimento sul piano generale.

3.6. La sistematicità dei test

Uno dei caratteri tipici delle prove tradizionali è la mancanza di sistematicità, nel senso che si tratta di prove somministrate "una tantum", senza che poi i risultati vengano elaborati statisticamente né confrontati con quelli ottenuti somministrando la stessa prova ad altri gruppi di allievi. Le prove di questo tipo rientrano nella classe dei test episodici; essi si contrappongono ai test sperimentali che hanno lo scopo di permettere le rilevazioni statistiche, attraverso cui si giunge all'elaborazione dei test standardizzati, ossia delle prove oggettive la cui validità è stata verificata. Poiché ai processi di rilevazione, analisi ed elaborazione statistica sono dedicati i capitoli 9 e 10, ci limitiamo qui alla pura e semplice classificazione, rimandando ad essi per la discussione dettagliata dei principi e delle tecniche statistiche.

Concludiamo accennando brevemente ad alcune definizioni di tipi particolari di test che noi non abbiamo incluso nella nostra classificazione generale perché riguardanti aspetti secondari o specifiche tecniche di somministrazione. La distinzione tra test individuali e collettivi (o di gruppo) è di per sé chiara e non ha bisogno di ulteriori precisazioni. In quanto alle tecniche di somministrazione, si parla di test verbali e di test carta-matita, a seconda che le risposte vengano fornite oralmente dagli esaminati ovvero mediante l'uso di appositi fogli per le risposte, su cui gli esaminati debbono scrivere, disegnare, apporre segni convenzionali o contrassegnare la risposta esatta scegliendola tra le alternative. In relazione a certe prove sono in uso termini particolari, che preferiamo illustrare nei capitoli successivi man mano che prenderemo in esame le singole tecniche di testing.