II progetto PRIN 2022 (Prot. 2022A74X79) Corpus SIM – Senectus Ipsa Morbus. Spontaneous Speech in Healthy Ageing (CUP E53D23008780006) nasce per colmare una significativa lacuna nella ricerca linguistica italiana: la quasi totale assenza di risorse accessibili dedicate al parlato senile sano. In un contesto demografico caratterizzato dall’invecchiamento della popolazione, comprendere le dinamiche del linguaggio nell’età avanzata rappresenta una priorità scientifica e sociale.
Il progetto ha coinvolto tre unità operative: Università di Napoli Federico II (PI Prof.ssa Francesca M. Dovetto; CUP E53D23008780006), Università degli Studi di Bari (Prof.ssa Patrizia Sorianello; CUP H53D23004190006) e Università degli Studi di Firenze (Prof. Alessandro Panunzi; CUP B53D23014450006). Il progetto è stato approvato dal Comitato Etico per le Attività non biomediche dell’Università degli Studi di Napoli Federico II (PG/2024/0011629 del 29/10/2024).
Il corpus SIM è un corpus pilota di parlato spontaneo prodotto da soggetti con invecchiamento sano, differenziato per variazione diatopica (Napoli, Bari, Firenze) e diafasica e organizzato per fasce di età (65–74; 75–84). Tutti i partecipanti sono stati sottoposti a screening cognitivo e hanno fornito consenso informato.
Le registrazioni sono state raccolte attraverso diversi task linguistici: descrizione di immagini, intervista semi-strutturata e narrazione di una favola. I dati sono stati trascritti secondo il metodo CLIPS e annotati a più livelli (fonetico, fonologico, prosodico, lessicale e morfosintattico).
I campioni di parlato, liberamente scaricabili nelle versioni con trascrizione ortografica e annotazione su TextGrid, sono disponibili in questa pagina. In una fase successiva, il corpus sarà integrato in un’infrastruttura open access dedicata al trattamento automatico di testo e voce e all’estrazione automatica dell’informazione linguistica.
The PRIN 2022 project (Prot. 2022A74X79), Corpus SIM – Senectus Ipsa Morbus. Spontaneous Speech in Healthy Ageing (CUP E53D23008780006), addresses a significant gap in Italian linguistic research: the near absence of publicly available resources on healthy elderly speech. In the context of rapid demographic ageing, understanding language dynamics in later life is both a scientific and societal priority.
The project involved three research units: the University of Naples Federico II (PI Prof. Francesca M. Dovetto; CUP E53D23008780006), the University of Bari (Prof. Patrizia Sorianello; CUP H53D23004190006), and the University of Florence (Prof. Alessandro Panunzi; CUP B53D23014450006). The project was approved by the Ethics Committee for Non-Biomedical Research of the University of Naples Federico II (PG/2024/0011629, 29 October 2024).
SIM is a pilot corpus of spontaneous speech produced by cognitively healthy older adults, diversified according to diatopic variation (Naples, Bari, Florence) and diaphasic variation, and organized by age groups (65–74; 75–84). All participants underwent cognitive screening and provided informed consent.
Recordings were collected through different linguistic tasks: picture description, semi-structured interview, and narrative retelling. The data were transcribed using the CLIPS method and annotated at multiple linguistic levels (phonetic, phonological, prosodic, lexical, and morphosyntactic).
The speech samples, freely downloadable in orthographic transcription and TextGrid annotation formats, are available on this page. In a subsequent phase, the corpus will be integrated into an open-access infrastructure providing tools for automatic text and speech processing and linguistic information extraction.
- Poster Corpus Sim
- Corpus SIM: Napoli, Firenze, Bari