Nuove funzionalità di Google Ngram Viewer

Qual è il tipo di terminologia più nominata nei libri italiani del XX secolo? Nella seconda metà la terminologia tecnica, all’inizio del secolo invece terminologia filosofica e scientifica:

Sono tendenze utili per il lavoro terminologico e si possono ricavare facilmente nei corpora di libri di Google Books grazie a nuove funzionalità di Google Ngram Viewer, descritte dal lessicografo Ben Zimmer in Google’s Ngram Viewer Goes Wild.

La novità principale è il carattere jolly * (wildcard), che può essere combinato anche con la parte del discorso. Vengono restituiti risultati con le dieci combinazioni più frequenti: il grafico qui sopra indica le occorrenze più comuni della parola terminologia seguita da un aggettivo ed è stato ottenuto con la ricerca terminologia *_ADJ.

In ciascun grafico si può evidenziare uno o più risultati con un clic:

Non è necessario specificare la parte del discorso (_NOUN, _ADJ, _VERB ecc., da aggiungere alla parola o al carattere jolly, senza spazi), ma è utile per escludere articoli, preposizioni e altre parti del discorso molto frequenti ma non significative.

Altri esempi di ricerche (se i grafici non vengono visualizzati, premere Search lots of books):
lessico *_ADJ,
*_NOUN importante,
mal di *_NOUN.

L’operatore => consente invece di trovare parole che sono in rapporti di dipendenza anziché in sequenza, ad esempio mangiare=>*_NOUN dà un’indicazione dei sostantivi più frequenti in relazione a mangiare.

Per l’inglese si possono trovare tutte le forme flesse di una parola aggiungendo _INF (ad es. book_INF restituisce risultati per book, books, booked, booking), ma per il momento non mi pare funzioni per l’italiano.

Si possono anche confrontare tendenze da corpora di lingue diverse:

È uno strumento davvero divertente da usare: provare per credere! Maggiori dettagli nella pagina di informazioni What does the Ngram Viewer do? (Google).

Attenzione ⚠ – Un limite di Ngram Viewer è la mancanza di informazioni su come sono stati costruiti i corpora e che tipo di testi contengono (non si conosce in che proporzione siano composti da romanzi, saggi, testi scientifici o altri tipi di libri). Inoltre, nelle lingue diverse dall’inglese non si sa quanto incida la presenza di testi tradotti e se tutte le traduzioni siano affidabili. I risultati vanno quindi valutati con molta attenzione: si possono ottenere indicazioni e tendenze ma non certezze.

Esempi di ricerche (nuovo)

Ho aggiunto alcuni rimandi a post che contengono grafici ottenuti da Ngram Viewer.

Ricerche con operatori per ricavare collocazioni:
♦ debunking =>*_NOUN in Vi smonto il debunking
♦ copycat *_NOUN in Copycat crime: cosa c’entra il gatto?
♦ migranti *_ADJ in Il gerundio che non era un participio
♦ *_NOUN carino, *_NOUN carina in #carino

Ricerche e confronti di parole per ricavare indicazioni di tipo diacronico:
♦ Risorse lessicali per tradurre dall’inglese
♦ Antivaccinisti? Non sono una novità
♦ Interferenze dell’inglese: il problema di “con”
♦ Risemantizzazione (drones=>surveillance, drones=>bee)

Nota: se si seguono i link agli esempi in Ngram Viewer e si ottiene un messaggio di errore, premere il pulsante Search lots of books.

2 commenti su “Nuove funzionalità di Google Ngram Viewer”

BEP

21/10/2013 alle 17:36

BEP:

Interessanti le punte di “mangiare zuppa” durante la prima guerra mondiale e “mangiare pane” durante la seconda.
Licia

21/10/2013 alle 17:47

Licia:

@BEP, osservazione molto interessante, hai evidenziato un aspetto culturale che si riflette nell’uso del lessico. Conosci culturomics?

Io sarei curiosa di saperne di più sul picco per piatto di pasta all’inizio del XX secolo e l’ascesa di piatto di minestra a partire dalla seconda guerra mondiale, con caduta negli anni ‘50 e poi di nuovo crescita costante.

I commenti sono chiusi.