La prossima rivoluzione nella comunicazione scientifica, 1
Come accennato nel precedente post l’identificazione di un 4° paradigma del procedimento scientifico ha conseguenze di rilievo sulla comunicazione scientifica che vanno a specificare la nozione stessa di documento. Il documento scientifico (in senso lato) appare infatti sempre più come la punta di un iceberg che nella parte nascosta ha una enorme quantità di dati che però, nei consueti contributi scientifici testuali, vengono presentati solo in modo sommarizzato invece che esaurientemente documentati. In tal modo il legame tra evidenza e scrittura diventa più complesso ed elusivo, mentre anche il recupero dei dati per sostanziare i risultati diventa sempre più problematico.
La sfida che si delinea è quella di costruire in modo sistematico l’accesso ai depositi di dati creati dagli esperimenti di simulazione o raccolti automaticamente e di realizzare una più stretta connessione tra documenti e dati e tra i dati di documenti analoghi.
La complicazione nasce però dal fatto che oltre ad essere sempre più numerosi i “dati” sono sottoposti a manipolazioni basate su software per simulazione ed altri scopi; queste manipolazioni diventano parte integrante della questione della riproduzione sperimentale che caratterizza il procedimento scientifico (la possibilità di “falsificare” i risultati), e quindi della natura stessa dei dati. Documentare “complesse configurazioni di software come parte della provenienza dei prodotti della scienza data-intensive, rimane questione nodale nella gestione dei dati e nella strutturazione del workflow” (Clifford Lynch). Per questo la provenienza (provenance) dei dati appare una qualità imprescindibile per un approccio critico.
In questa prospettiva spiccano le funzioni di raccolta, cura e analisi dei dati, tra cui Gray sottolinea quella che chiama l’oggettificazione della conoscenza e che sembra consistere nella organizzazione dei dati come ontologie di oggetti informativi. Gray fa l’esempio di grandezze generiche quali “unità”, “misura”, il “chi” e “quando” della misurazione, ma anche di strutturazioni più complesse che definiscano gli oggetti delle diverse discipline, i loro attributi e i loro metodi. I corsivi sottolineano concetti tipici della programmazione ad oggetti (OOP) che sempre più impronta il funzionamento di internet, piattaforma di elezione per la distribuzione anche della eScience, in cui “la gente manipola oggetti”.
La nuova rilevanza dei dati che caratterizza il 4° paradigma della scienza non riguarda peraltro solo le discipline delle scienze della vita o delle scienze della terra. Ad esempio anche in ambito sociologico o urbanistico la raccolta automatica di dati e l’analisi quantitativa tendono ad assumere un ruolo di primo piano.
Accanto alle digital libraries di testi sono quindi sempre più necessarie digital libraries di dati, cioè depositi di dati organizzati in oggetti informativi attraverso ontologie. Un esempio in questo senso è Entrez, creato dal National Center for Biotechnology Information della NLM, una interfaccia di ricerca che partendo dal repository di letteratura scientifica PubMed permette di estendere una ricerca incrociata ad esempio su banche di dati filogenetici, sequenze di nucleotidi, banche dati di proteine con le loro strutture in 3-D e GenBank, la banca di dati genetici.
[...] Chi fosse interessato alla materia (e magari approfondirla in questa sede) vi segnaliamo questi importanti contributi: Dal blog (Tecnoetica.it) del prof. Bennato Un seminario sulla scienza 2.0 e un esperimento , un articolo di un anno fa ma con riferimenti e link ancora interessanti, a due articoli su 4lib Blog (autore anonimo ma non meno interessante) che espone le teorie sul cambio di paradigma della scienza: Il “quarto paradigma” della eScience e La “prossima rivoluzione nella comunicazione scientifica”, 1. [...]
E adesso anche la scienza è 2.0 « Web Sapienza
15 gennaio 2010 alle 09:45