<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:georss="http://www.georss.org/georss" xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#" xmlns:media="http://search.yahoo.com/mrss/"
	>

<channel>
	<title>4lib Blog</title>
	<atom:link href="http://4lib.wordpress.com/feed/" rel="self" type="application/rss+xml" />
	<link>http://4lib.wordpress.com</link>
	<description>Osservatorio sull&#039;informazione in rete e le digital libraries</description>
	<lastBuildDate>Thu, 04 Feb 2010 08:49:20 +0000</lastBuildDate>
	<language>it</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.com/</generator>
<cloud domain='4lib.wordpress.com' port='80' path='/?rsscloud=notify' registerProcedure='' protocol='http-post' />
<image>
		<url>http://s2.wp.com/i/buttonw-com.png</url>
		<title>4lib Blog</title>
		<link>http://4lib.wordpress.com</link>
	</image>
	<atom:link rel="search" type="application/opensearchdescription+xml" href="http://4lib.wordpress.com/osd.xml" title="4lib Blog" />
	<atom:link rel='hub' href='http://4lib.wordpress.com/?pushpress=hub'/>
		<item>
		<title>La prossima rivoluzione nella comunicazione scientifica, 2</title>
		<link>http://4lib.wordpress.com/2010/01/13/la-prossima-rivoluzione-nella-comunicazione-scientifica-2/</link>
		<comments>http://4lib.wordpress.com/2010/01/13/la-prossima-rivoluzione-nella-comunicazione-scientifica-2/#comments</comments>
		<pubDate>Wed, 13 Jan 2010 15:13:58 +0000</pubDate>
		<dc:creator>Nicola</dc:creator>
				<category><![CDATA[digital library]]></category>
		<category><![CDATA[Library 2.0]]></category>
		<category><![CDATA[markup]]></category>
		<category><![CDATA[open access]]></category>

		<guid isPermaLink="false">http://4lib.wordpress.com/?p=136</guid>
		<description><![CDATA[Le conseguenze dei processi evolutivi rapidamente delineati riguardano anche le digital libraries testuali, e non solo nel senso del rapporto con digital libraries di dati su cui abbiamo riferito nel precedente post. Collocare la creazione e distribuzione di informazione e conoscenza in una dimensione di rete, per massimizzare i benefici delle connessioni e della cooperazione [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=136&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>Le conseguenze dei processi evolutivi rapidamente delineati riguardano anche le digital libraries <em>testuali</em>, e non solo nel senso del rapporto con digital libraries <em>di dati</em> su cui abbiamo riferito nel precedente post.</p>
<p>Collocare la creazione e distribuzione di informazione e conoscenza in una dimensione di rete, per massimizzare i benefici delle connessioni e della cooperazione oltre che delle manipolazioni del testo cui accenniamo sotto, significa intanto disporre dell’accesso libero, o al più limitato ai soli costi di produzione, ai documenti scientifici e ai dati.</p>
<p>Inoltre i nuovi modi di fare scienza implicano un diverso peso del singolo autore, che sempre più si delinea come nodo di una rete di collaborazioni più che come monade isolata, così come cambia il ruolo dell’editore in un contesto in cui la pubblicazione testuale non richiede marcate abilità tecniche e il <em>peer review</em> può essere dichiarato autonomamente dagli studiosi, ad esempio tramite i cd. <em>overlay journal</em>, frontespizi di riviste virtuali che in realtà contengono link ad articoli contenuti in un <em>repository</em> e indicano ai visitatori come ai motori di ricerca, che si tratta di articoli valutati. D’altro lato le riviste scientifiche tendono sempre più a diventare siti web, in tal modo superando la caratteristica del documento come oggetto <em>a se stante</em>. Nel momento in cui l’esplicitazione della semantica, della strutturazione logica del testo, e l’analisi dei riferimenti bibliografici e delle fonti possono essere realizzati, il documento entra a far parte di una rete di connessioni e riferimenti più ampi.</p>
<p>Il problema delle <em>digital library</em> quindi non è tanto di adeguamento o precisazione dei metadati, tema su cui si è soprattutto insistito, bensì di capire come  esse si possano configurare realmente (Gray). Fino ad oggi infatti anche la rivista digitale spesso altro non è che la riproduzione come immagine di un testo editoriale.  Il digitale però non è un <em>supporto </em>ma una ambiente per rappresentare in modo più ricco ed esaustivo la conoscenza.</p>
<p>Il compito di manipolare il testo in modo da esplicitarne la semantica, può essere svolto dall’autore, dall’editore o in modo automatico dopo la pubblicazione del documento.</p>
<p>Nel primo caso si tratta di inserire dei marcatori per le entità bibliografiche identificative, autore, titolo, nome della rivista, data di edizione, URL, identificativo univoco, etc. (procedimento che qualsiasi utente compie senza soverchia difficoltà ad esempio costruendo la propria bibliografia con strumenti semiautomatici quali Zotero o Mendeley), per le parti significative del documento (ad es. abstract, esposizione dei risultati, discussione dei risultati, descrizione dell’esperimento, conclusioni, etc. -  processo analogo alla formattazione editoriale del testo implementata in qualsiasi programma di scrittura senza valore semantico) oltre che per taggare le entità significative per la disciplina,  facendo riferimento ad una ontologie condivisa.</p>
<p>Per delineare il ruolo che gli editori possono rivestire in un nuovo contesto, ci si può riferire alla rivista <em>Molecular BioSystems</em> della Royal Society of Chemistry, i cui articoli nel formato <em>enhanced html</em> mostrano strumenti   per evidenziare i termini contenuti in banche dati di termini chimici e connetterli a risorse esterne; o la rivista Cell che implementa una applicazione dal nome <em>Reflect</em>, in grado di taggare e colorare le proteine, i geni e le piccole molecole menzionate nell’articolo e di generare al passaggio del mouse finestre pop up con informazioni contestuali rilevanti e link aggiuntivi sulle varie entità (v. <a href="http://www.rsc.org/delivery/_ArticleLinking/DisplayHTMLArticleforfree.asp?JournalCode=MB&amp;Year=2010&amp;ManuscriptID=b907925b&amp;Iss=1">qui </a>e <a href="http://www.cell.com/fulltext/S0092-8674%2809%2901488-3">qui </a>).</p>
<p>La strutturazione semantica dei documenti può avvenire anche dopo la pubblicazione, con strumenti di analisi automatica del linguaggio naturale (NLP) cui abbiamo fatto cenno in questi post. I risultati sono relativamente accettabili in definiti contesti disciplinari, per quanto riguarda l’identificazione di entità e la trattazione delle citazioni. Una volta inseriti i marcatori che  indicano entità e concetti, è possibile realizzare l’intefacciamento con banche dati che espongono la struttura dei propri record, in modo da connettere i dati pertinenti realizzando connessioni automatiche tra articoli e articoli,  tra articoli e dati e tra dati utilizzati in articoli simili.</p>
<p>Un&#8217;altra modalità di incremento del valore della comunicazione scientifica di cui le digital libraries devono farsi portatrici, è l’implementazione di servizi tipicamente 2.0 quali in primo luogo le note e commenti, e i tag che svolgono un ruolo diverso dalle ontologie disciplinari in quanto si riferiscono ad ambiti personali o ad ambienti collaborativi delimitati. Ma rientrano in questa categoria liste bibliografiche, claud dei termini utilizzati nel testo, link a wiki di gruppi di ricerca o a immagini e video, la possibilità di ricevere in tempo reale via RSS le osservazioni ad un determinato documento, comprese citazioni in documenti successivi, o <em>trackback</em> di blog che discutono l’articolo.</p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/4lib.wordpress.com/136/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/4lib.wordpress.com/136/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/4lib.wordpress.com/136/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/4lib.wordpress.com/136/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/4lib.wordpress.com/136/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/4lib.wordpress.com/136/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/4lib.wordpress.com/136/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/4lib.wordpress.com/136/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/4lib.wordpress.com/136/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/4lib.wordpress.com/136/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/4lib.wordpress.com/136/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/4lib.wordpress.com/136/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/4lib.wordpress.com/136/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/4lib.wordpress.com/136/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=136&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://4lib.wordpress.com/2010/01/13/la-prossima-rivoluzione-nella-comunicazione-scientifica-2/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/5652d4981287bd7a7fb4d51bf836e789?s=96&#38;d=identicon&#38;r=G" medium="image">
			<media:title type="html">Nicola</media:title>
		</media:content>
	</item>
		<item>
		<title>La prossima rivoluzione nella comunicazione scientifica, 1</title>
		<link>http://4lib.wordpress.com/2010/01/10/la-prossima-rivoluzione-nella-comunicazione-scientifica-1/</link>
		<comments>http://4lib.wordpress.com/2010/01/10/la-prossima-rivoluzione-nella-comunicazione-scientifica-1/#comments</comments>
		<pubDate>Sun, 10 Jan 2010 16:13:47 +0000</pubDate>
		<dc:creator>Nicola</dc:creator>
				<category><![CDATA[escience]]></category>
		<category><![CDATA[comunicazione scientifica]]></category>
		<category><![CDATA[dati]]></category>
		<category><![CDATA[digital library]]></category>

		<guid isPermaLink="false">http://4lib.wordpress.com/?p=132</guid>
		<description><![CDATA[Come accennato nel precedente post l’identificazione di un 4° paradigma del procedimento scientifico ha conseguenze di rilievo sulla comunicazione scientifica che vanno a specificare la nozione stessa di documento. Il documento scientifico (in senso lato) appare infatti sempre più come la punta di un iceberg che nella parte nascosta ha una enorme quantità di dati [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=132&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>Come accennato nel precedente post l’identificazione di un <em>4° paradigma</em> del procedimento scientifico ha conseguenze di rilievo sulla comunicazione scientifica che vanno a specificare la nozione stessa di documento. Il documento scientifico (in senso lato) appare infatti sempre più come la punta di un iceberg che nella parte nascosta ha una enorme quantità di dati che però, nei consueti contributi scientifici testuali, vengono presentati solo in modo sommarizzato invece che esaurientemente documentati. In tal modo il legame tra evidenza e scrittura diventa più complesso ed elusivo, mentre anche il recupero dei dati per sostanziare i risultati diventa sempre più problematico.</p>
<p>La sfida che si delinea è quella di costruire in modo sistematico l’accesso ai depositi di dati creati dagli esperimenti di simulazione o raccolti automaticamente e di realizzare una più stretta connessione tra documenti e dati e tra i dati di documenti analoghi.</p>
<p>La complicazione nasce però dal fatto che oltre ad essere sempre più numerosi i “dati” sono sottoposti a manipolazioni basate su software per simulazione ed altri scopi; queste manipolazioni  diventano parte integrante della questione della riproduzione sperimentale che caratterizza il procedimento scientifico (la possibilità di “falsificare” i risultati), e quindi della natura stessa dei dati. Documentare “complesse configurazioni di software come parte della provenienza dei prodotti della scienza <em>data-intensive</em>, rimane questione nodale nella gestione dei dati e nella strutturazione del <em>workflow</em>” (Clifford Lynch). Per questo la provenienza (<em>provenance</em>) dei dati appare una qualità imprescindibile per un approccio critico.</p>
<p>In questa prospettiva spiccano le funzioni di raccolta, cura e analisi dei dati, tra cui Gray sottolinea  quella che chiama <em>l’oggettificazione</em> della conoscenza e che sembra consistere nella organizzazione  dei dati come ontologie di oggetti informativi. Gray fa l’esempio di grandezze generiche quali “unità”, “misura”, il “chi” e “quando” della misurazione, ma anche di strutturazioni più complesse che definiscano gli <em>oggetti</em> delle diverse discipline, i loro <em>attributi</em> e i loro <em>metodi</em>. I corsivi sottolineano concetti tipici della programmazione ad oggetti (OOP) che sempre più impronta il funzionamento di internet, piattaforma di elezione per la distribuzione anche della <em>eScience</em>, in cui “la gente  manipola oggetti”.</p>
<p>La nuova rilevanza dei dati che caratterizza il 4° paradigma della scienza non riguarda peraltro solo le discipline delle scienze della vita o delle scienze della terra. Ad esempio anche in ambito sociologico o urbanistico la raccolta automatica di dati e l’analisi quantitativa tendono ad assumere un ruolo di primo piano.</p>
<p>Accanto alle digital libraries di <em>testi </em>sono quindi sempre più necessarie digital libraries di <em>dati</em>, cioè depositi di dati organizzati in oggetti informativi attraverso ontologie. Un esempio in questo senso è <a href="http://www.ncbi.nlm.nih.gov/sites/gquery">Entrez</a>,   creato dal National Center for Biotechnology Information della NLM, una interfaccia di ricerca che partendo dal repository di letteratura scientifica PubMed  permette di estendere una ricerca incrociata ad esempio su banche di dati filogenetici, sequenze di nucleotidi, banche dati di proteine con le loro strutture in 3-D e GenBank, la banca di dati genetici.</p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/4lib.wordpress.com/132/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/4lib.wordpress.com/132/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/4lib.wordpress.com/132/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/4lib.wordpress.com/132/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/4lib.wordpress.com/132/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/4lib.wordpress.com/132/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/4lib.wordpress.com/132/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/4lib.wordpress.com/132/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/4lib.wordpress.com/132/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/4lib.wordpress.com/132/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/4lib.wordpress.com/132/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/4lib.wordpress.com/132/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/4lib.wordpress.com/132/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/4lib.wordpress.com/132/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=132&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://4lib.wordpress.com/2010/01/10/la-prossima-rivoluzione-nella-comunicazione-scientifica-1/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/5652d4981287bd7a7fb4d51bf836e789?s=96&#38;d=identicon&#38;r=G" medium="image">
			<media:title type="html">Nicola</media:title>
		</media:content>
	</item>
		<item>
		<title>Il &#8220;quarto paradigma&#8221; della eScience</title>
		<link>http://4lib.wordpress.com/2010/01/04/il-quarto-paradigma-della-escience/</link>
		<comments>http://4lib.wordpress.com/2010/01/04/il-quarto-paradigma-della-escience/#comments</comments>
		<pubDate>Mon, 04 Jan 2010 12:08:01 +0000</pubDate>
		<dc:creator>Nicola</dc:creator>
				<category><![CDATA[escience]]></category>
		<category><![CDATA[4th paradigm]]></category>
		<category><![CDATA[Chris Anderson]]></category>
		<category><![CDATA[data intensive science]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Jim Gray]]></category>
		<category><![CDATA[Microsoft]]></category>
		<category><![CDATA[Peter Norvig]]></category>
		<category><![CDATA[scholarly communication]]></category>

		<guid isPermaLink="false">http://4lib.wordpress.com/?p=119</guid>
		<description><![CDATA[In un precedente post (La strutturazione del linguaggio) avevo riportato le sconcertanti conclusioni di Peter Norvig sulla “irragionevole efficacia dei dati”. Analoghe considerazioni dovevano esser state espresse dallo stesso direttore della ricerca di Google alla conferenza sulle Emerging Technology del gruppo O&#8217;Reilly nel marzo 2008, in cui Norvig avrebbe contestato la procedura della scienza di [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=119&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>In un precedente post (<a href="http://4lib.wordpress.com/2009/11/22/la-strutturazione-del-linguaggio/">La strutturazione del linguaggio</a>) avevo riportato le sconcertanti conclusioni di <a class="zem_slink" title="Peter Norvig" rel="homepage" href="http://norvig.com/">Peter Norvig</a> sulla “irragionevole efficacia dei dati”. Analoghe considerazioni dovevano esser state espresse dallo stesso direttore della ricerca di <a class="zem_slink" title="Google" rel="homepage" href="http://google.com">Google</a> alla conferenza sulle <em>Emerging Technology</em> del gruppo O&#8217;Reilly nel marzo 2008, in cui Norvig avrebbe contestato la procedura della scienza di costruire ipotesi e articolare <a class="zem_slink" title="Modello" rel="wikipedia" href="http://en.wikipedia.org/wiki/Modello">modelli</a> per analizzare il mondo reale: riprendendo l’affermazione dello statistico Gorge Box: “Tutti i modelli sono sbagliati, qualcuno è utile” , Norvig avrebbe infatti sostenuto: “tutti i modelli sono sbagliati e sempre più possiamo farne a meno”.</p>
<p>Prendendo spunto da questo intervento C. Anderson in un articolo del giugno 2008 (<a href="http://www.wired.com/science/discoveries/magazine/16-07/pb_theory">The End of Theory: The Data Deluge Makes the Scientifc Method Obsolete</a>, <a class="zem_slink" title="Wired (magazine)" rel="geolocation" href="http://maps.google.com/maps?ll=37.7808,-122.3957&amp;spn=0.01,0.01&amp;q=37.7808,-122.3957%20%28Wired%20%28magazine%29%29&amp;t=h">Wired</a>, June 2008) aveva sottolineato la crescente disponibilità in tutti i campi di enormi quantità di dati a cui potevano essere applicati strumenti statistici e matematici analoghi a quelli applicati da Google alla ricerca in Internet, e aveva predetto la fine del modello di scienza dominante: “la correlazione sostituisce la causalità e la scienza può progredire anche senza modelli coerenti, senza teorie unificate o addirittura senza alcun modello di spiegazione Non ha alcun senso aggrapparsi alle nostre vecchie pratiche. E’ il momento di domandarsi: cosa può imparare la scienza da Google ?”</p>
<p>La domanda se pur posta in modo così provocatorio non è affatto peregrina. Infatti la scienza, grazie alla applicazione delle tecnologie informatiche, ha sempre più a che fare con enormi quantità di dati, su scala di petabyte (1 petabyte = circa 1 milione di gigabyte), sia che vengano raccolti attraverso sensori, sia che siano prodotte da procedure di simulazione. La scala dei dati è tale che spesso non è possibile nemmeno rappresentarli e le stesse procedure informatiche hanno difficoltà a trattare numeri così grandi. Nella “Petabyte Age” sono quindi necessarie nuove tecniche di modellazione e nuove procedure matematiche per identificare le strutture nascoste dei dati che sono cruciali per la comprensione dei sistemi, e cambieranno “il ruolo della sperimentazione nella scienza e il ruolo della scienza nel suo insieme” (<a href="http://www.ams.org/notices/200905/rtx090500586p.pdf">Mathematics and the Internet: A Source of Enormous Confusion and Great Potential</a>, Walter Willinger, David Alderson, and John C. Doyle, in Notices of the AMS, May 2009, p. 597. ). Ma questi sviluppi non inficiano i principi costitutivi del procedimento scientifico e l&#8217;approccio di Google alla gestione delle connessioni può sicuramente fornire strumenti complementari alla scienza purché si ricordi che, per dirla con Paul Ginsparg: “La scienza mira a produrre ben di più che una semplice predizione meccanica di correlazioni; il suo fine è invece di utilizzare le ricorrenze estratte dai dati per costruire strumenti comprensivi per gestirli a priori” (Text in a Data-centric World, v. sotto).</p>
<p>Un tema così scottante è stato affrontato nel 2009 da un volume dal significativo titolo: <a href="http://research.microsoft.com/en-us/collaboration/fourthparadigm/4th_paradigm_book_complete_lr.pdf">The Fourth Paradigm: Data-Intensive scientific discovery</a>, Edited by Tony Hey, Stewart Tansley, and Kristin Tolle, REDMOND, WASHINGTON,  Microsoft research, 2009,  edito, come si vede, da Microsoft  e dedicato allo scomparso <a class="zem_slink" title="Jim Gray (computer scientist)" rel="wikipedia" href="http://en.wikipedia.org/wiki/Jim_Gray_%28computer_scientist%29">Jim Gray</a>,  secondo cui l’<em>esplorazione e manipolazione di grandi quantità di dati</em>, costituisce di fatto un nuovo paradigma, il 4°, dopo l’<em>osservazione empirica</em>, volta alla descrizione dei fenomeni naturali; la <em>riflessione teorica</em>, che mira a generalizzare i risultati dell’osservazione e costruire modelli; e negli ultimi decenni, l’<em>approccio computazionale</em>, che costruisce la simulazione dei fenomeni complessi.</p>
<p>La “catena del valore” della <em>escience </em>sotto l’ottica del <em>4° paradigma</em>, si delinea quindi nei seguenti passaggi:</p>
<p style="text-align:center;">Capture – curate – analyse – publish</p>
<p>Dallo schema emerge che il <em>4° paradigma</em> oltre a sollecitare tecniche e tecnologie specifiche, accentua la divisione tra la fase di raccolta e analisi dei dati e quella di elaborazione di teorie e modelli. Accade così, secondo le osservazioni di Gray, che per ogni disciplina si stiano delineando due branche diverse, ambedue con piena dignità scientifica, l’una “informatica” che riguarda la raccolta e analisi dei dati e l’altra “computazionale” incentrata sulla simulazione e costruzione di ipotesi e modelli stabili.</p>
<p>Ambedue pongono problematiche specifiche: come acquisire i dati, come organizzarli e riorganizzarli, come costruire schemi comuni che attribuiscano significati in una dimensione di condivisione e collaborazione, in una parola come rappresentarli con algoritmi. Quali <a class="zem_slink" title="Computer software" rel="wikipedia" href="http://en.wikipedia.org/wiki/Computer_software">software</a> di archiviazione o <em>Laboratory Information Management Systems</em> (LIMS) utilizzare, al di là dei minimali, e praticamente unici programmi commerciali di Matlab ed Excell, per ingegnerizzare il passaggio dei dati prodotti dallo strumento (sensore etc.) o dalle simulazioni, nell’archivio. La manipolazione dei dati in progetti specifici richiede una componente crescente di software per analizzare i dati al punto che la spesa per questa componente può raggiungere il 25-50% dei costi totali di un progetto. Il lavoro da fare in questi campi è enorme.</p>
<p>L’altro aspetto da sottolineare riguarda l’ultimo passaggio della catena del valore sopra riportata, la pubblicazione dei risultati della ricerca scientifica che ha problematiche assolutamente nuove tali da prefigurare quella che Gray chiama <em>The coming revolution in scholarly communication</em> che sarà oggetto di un prossimo post.</p>
<div class="zemanta-pixie" style="margin-top:10px;height:15px;"><a class="zemanta-pixie-a" title="Reblog this post [with Zemanta]" href="http://reblog.zemanta.com/zemified/43180ee1-a86d-4eb8-93ca-5e633f524786/"><img class="zemanta-pixie-img" style="border:medium none;float:right;" src="http://img.zemanta.com/reblog_e.png?x-id=43180ee1-a86d-4eb8-93ca-5e633f524786" alt="Reblog this post [with Zemanta]" /></a></div>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/4lib.wordpress.com/119/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/4lib.wordpress.com/119/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/4lib.wordpress.com/119/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/4lib.wordpress.com/119/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/4lib.wordpress.com/119/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/4lib.wordpress.com/119/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/4lib.wordpress.com/119/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/4lib.wordpress.com/119/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/4lib.wordpress.com/119/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/4lib.wordpress.com/119/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/4lib.wordpress.com/119/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/4lib.wordpress.com/119/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/4lib.wordpress.com/119/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/4lib.wordpress.com/119/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=119&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://4lib.wordpress.com/2010/01/04/il-quarto-paradigma-della-escience/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/5652d4981287bd7a7fb4d51bf836e789?s=96&#38;d=identicon&#38;r=G" medium="image">
			<media:title type="html">Nicola</media:title>
		</media:content>

		<media:content url="http://img.zemanta.com/reblog_e.png?x-id=43180ee1-a86d-4eb8-93ca-5e633f524786" medium="image">
			<media:title type="html">Reblog this post [with Zemanta]</media:title>
		</media:content>
	</item>
		<item>
		<title>Tra library 2.0 e 3.0</title>
		<link>http://4lib.wordpress.com/2009/12/18/tra-library-2-0-e-3-0/</link>
		<comments>http://4lib.wordpress.com/2009/12/18/tra-library-2-0-e-3-0/#comments</comments>
		<pubDate>Thu, 17 Dec 2009 23:36:37 +0000</pubDate>
		<dc:creator>Nicola</dc:creator>
				<category><![CDATA[Library 2.0]]></category>
		<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[Add new tag]]></category>
		<category><![CDATA[common tag]]></category>
		<category><![CDATA[faviki]]></category>
		<category><![CDATA[flickr]]></category>
		<category><![CDATA[Fondazione Rinascimento Digitale]]></category>
		<category><![CDATA[rdf]]></category>
		<category><![CDATA[RDFa]]></category>
		<category><![CDATA[YouTube]]></category>

		<guid isPermaLink="false">http://4lib.wordpress.com/?p=109</guid>
		<description><![CDATA[In un interessante intervento al convegno del 15 e 16 dicembre della Fondazione Rinascimento Digitale dal titolo Cultural Heritage on line. Empowering users: an active role for user communities, Laura Campbell della Library of Congress (LOC) ha illustrato le numerose iniziative intraprese nel web per valorizzare l’azione della LOC per gli utenti e in particolare [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=109&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>In un interessante intervento al convegno del 15 e 16 dicembre della <a class="zem_slink" title="Fondazione Rinascimento Digitale" rel="wikipedia" href="http://en.wikipedia.org/wiki/Fondazione_Rinascimento_Digitale">Fondazione Rinascimento Digitale</a> dal titolo <a href="http://www.rinascimento-digitale.it/conference2009.phtml"><em>Cultural Heritage on line. Empowering users: an active role for user communities</em></a>, Laura Campbell della Library of Congress (LOC) ha illustrato le numerose iniziative intraprese nel web per valorizzare l’azione della LOC per gli utenti e in particolare il successo dell’esperimento di distribuire alcune collezioni della LOC sui più diffusi <a class="zem_slink" title="Social network" rel="wikipedia" href="http://en.wikipedia.org/wiki/Social_network">social network</a>, a cominciare da Flickr, <span class="zem_slink"><a class="zem_slink" title="YouTube" rel="homepage" href="http://www.youtube.com/">Youtube</a></span>, iPod.</p>
<p>Per la verità questo “cedimento” al 2.0 è meno eccitante di quanto possa apparire dato che l’essenza della sperimentazione sta tutta in una parolina, <em>distribution</em>, da distinguere nettamente dalla semanticamente e programmaticamente assai più impegnativa espressione: <em>sharing.</em> Quello che la LOC ha realizzato è infatti un adeguamento delle modalità di <em>distribuzione</em> delle collezioni bibliotecarie, alla mondializzazione della comunicazione imposta da internet.</p>
<p>La riflessione sulla peculiarità della cultura emergente nel web e di cui sono intrisi i <em>media</em> del 2.0 e sulle modalità per integrarla nell’approccio all’informazione tramandato (basato sulla centralità del supporto fisico cartaceo e della sua storia e sulla diffidenza del <em>messaggio</em> dei nuovi <em>media</em>, quali i social network) è altra cosa: i media del 2.0 sono invece visti soprattutto come <em>mezzi</em>, non contenuto, posizione comprensibile per una biblioteca nazionale, che ha compiti istituzionali ben precisi, ma non sufficiente per il più vasto mondo delle biblioteche che vanta una ricca tradizione di biblioteche pubbliche e non può storcere la bocca davanti alla informazione “non istituzionale” che nasce dalla <em>crowd (The wisdom of the crowd</em> è il titolo di un noto <a onclick="return mugicPopWin(this,event);" oncontextmenu="mugicRightClick(this);" href="http://www.amazon.com/Wisdom-Crowds-James-Surowiecki/dp/0385721706">libro</a> di J. Surowiecki ) e fa leva sull&#8217;<em>intelligenza collettiva</em>. Da questo punto di vista i tentativi di integrare le conversazioni nell’ambiente della biblioteca e nel catalogo stesso operata dalla <a href="http://4lib.wordpress.com/2009/11/01/opac-2-0-oakville-public-library/">Oaks Public Library</a> o delineata nel progetto <a href="http://4lib.wordpress.com/2009/11/01/sopac/">SOPAC </a>di cui abbiamo parlato qualche settimana fa, e che si sforzano di privilegiare l’attività di <em>sharing,</em> suscitano altrettanta simpatia.</p>
<p>Anche questa precisazione però non basta a porre in modo esauriente la questione del rapporto tra evoluzione del web e biblioteche. Prendiamo l’attività del <em>social tagging</em>: fino ad oggi si caratterizza per la soggettività della scelta, uso e perfino grafia della terminologia adottata in assenza di un vocabolario univoco, ma nelle comunità di rete, come più in generale quale strumento di ricerca, richiama una cultura di emergenze priva di istanze universalistiche, <em>vague</em> (vaga, cioè limitata a ciò che importa qui ed ora), e di rapido consumo nella comunicazione molti a molti. Ma ci sono modi di fare <em>social tagging</em>, più affidabili: mi riferisco al progetto <a href="www.faviki.com">Faviki</a>, che trae la propria terminologia da <a href="http://www.freebase.com">Freebase </a>, una banca dati i cui contenuti sono creati in parte dall&#8217;utente, nella logica del wiki, in parte  si appoggia su <a href="http://dbpedia.org">Dbpedia</a>, costituita da dati strutturati estratti da Wikipedia le cui voci hanno un indirizzo web e link ai concetti espressi in modo univoco nel contesto degli articoli della enciclopedia online. Ne deriva un vocabolario in cui le parole sono non meri simboli ma concetti, connessi in una rete di relazioni (una rete, non una struttura imposta, per motivi di gestione, come quella gerarchica che caratterizza le classificazioni). In più il w3c ha pubblicato la codifica per inserire dati in formato <a class="zem_slink" title="Resource Description Framework" rel="wikipedia" href="http://en.wikipedia.org/wiki/Resource_Description_Framework">RDF</a> nell’html, cioè <a href="http://www.w3.org/TR/xhtml-rdfa-primer/">RDFa</a> venendo incontro alla esigenza di utilizzo di dati strutturati, interpretata p. e. da <a class="zem_slink" title="Yahoo!" rel="homepage" href="http://www.yahoo.com">Yahoo!</a> <a href="http://developer.yahoo.com/searchmonkey/">SearchMonkey</a><cite></cite> o da <a href="http://googlewebmastercentral.blogspot.com/2009/05/introducing-rich-snippets.html">Rich Snippets</a> di <a class="zem_slink" title="Google" rel="homepage" href="http://google.com">Google</a> e fino a oggi affidata ai <em>microformat </em>o alla versione semplificata di RDF proposta da Talis, <a class="zem_slink" title="Embedded RDF" rel="wikipedia" href="http://en.wikipedia.org/wiki/Embedded_RDF">eRDF</a>.</p>
<p>Nasce da queste sinergie il progetto <a href="http://www.commontag.org">Common Tag</a>, a cui partecipano due comunità di servizi web: quella del <em>social tagging</em>, con Faviki e <a href="http://www.zigtag.com/">Zigtag </a><cite></cite> e quella della ricerca nel web, con Yahoo, <a href="http://getglue.com/">Adaptive Blue</a> , <a href="http://sindice.com/">Sindice</a> , con anche <a href="http://www.zemanta.com">Zemanta </a> una applicazione che in base al contesto dei post, suggerisce contenuti relati e tags strutturati ai bloggers.</p>
<p>A completamento di questa panoramica, e con riferimento alla crescente disponibilità di dati strutturati, va ricordato che le biblioteche (per citare due casi presentati al satellite meeting dell&#8217;IFLA a Firenze  la Biblioteca nazionale Finlandese e quella Svedese) si sono distinte nel 2009 per la conversione dei loro record bibliografici in triple RDF in vista della loro adesione all’iniziativa dei <em>linked data</em>.</p>
<div class="zemanta-pixie" style="margin-top:10px;height:15px;"><a class="zemanta-pixie-a" title="Reblog this post [with Zemanta]" href="http://reblog.zemanta.com/zemified/2b048b94-9f90-48f4-b017-6bd8c4854040/"><img class="zemanta-pixie-img" style="border:medium none;float:right;" src="http://img.zemanta.com/reblog_e.png?x-id=2b048b94-9f90-48f4-b017-6bd8c4854040" alt="Reblog this post [with Zemanta]" /></a></div>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/4lib.wordpress.com/109/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/4lib.wordpress.com/109/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/4lib.wordpress.com/109/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/4lib.wordpress.com/109/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/4lib.wordpress.com/109/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/4lib.wordpress.com/109/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/4lib.wordpress.com/109/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/4lib.wordpress.com/109/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/4lib.wordpress.com/109/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/4lib.wordpress.com/109/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/4lib.wordpress.com/109/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/4lib.wordpress.com/109/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/4lib.wordpress.com/109/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/4lib.wordpress.com/109/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=109&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://4lib.wordpress.com/2009/12/18/tra-library-2-0-e-3-0/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/5652d4981287bd7a7fb4d51bf836e789?s=96&#38;d=identicon&#38;r=G" medium="image">
			<media:title type="html">Nicola</media:title>
		</media:content>

		<media:content url="http://img.zemanta.com/reblog_e.png?x-id=2b048b94-9f90-48f4-b017-6bd8c4854040" medium="image">
			<media:title type="html">Reblog this post [with Zemanta]</media:title>
		</media:content>
	</item>
		<item>
		<title>L&#8217;evoluzione del web nel 2009: spunti di ricerca</title>
		<link>http://4lib.wordpress.com/2009/11/30/levoluzione-del-web-nel-2009-spunti-di-ricerca/</link>
		<comments>http://4lib.wordpress.com/2009/11/30/levoluzione-del-web-nel-2009-spunti-di-ricerca/#comments</comments>
		<pubDate>Mon, 30 Nov 2009 15:39:32 +0000</pubDate>
		<dc:creator>Nicola</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[bdpedia]]></category>
		<category><![CDATA[google squared]]></category>
		<category><![CDATA[linked data]]></category>
		<category><![CDATA[search monkey]]></category>
		<category><![CDATA[social search]]></category>
		<category><![CDATA[SOPAC]]></category>
		<category><![CDATA[the cloud]]></category>
		<category><![CDATA[the stream]]></category>
		<category><![CDATA[web of things]]></category>

		<guid isPermaLink="false">http://4lib.wordpress.com/?p=102</guid>
		<description><![CDATA[Nel 2009 si sono delineati i tratti di una nuova fase dello sviluppo del web nella sua terza decade caratterizzati da cambiamenti che prefigurano un quadro assai variegato. Le principali novità mi sembrano le seguenti. La affermazione del web sociale in termini non solo di crescente quantità di contenuti creati dagli utenti, ma anche di [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=102&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>Nel 2009 si sono delineati i tratti di una nuova fase dello sviluppo del web nella sua terza decade caratterizzati da cambiamenti che prefigurano un quadro assai variegato. Le principali novità mi sembrano le seguenti.</p>
<p>La affermazione del web sociale in termini non solo di crescente quantità di contenuti creati dagli utenti, ma anche di tempestività nella comunicazione “molti a molti di più” (<em>the</em> <em>stream</em>) e di personalizzazione dei servizi in rete, che si concretizzano soprattutto nei <em>social network</em>, nel <em>microblogging</em> e nella crescente interoperabilità tra social networks (rallentata dal carattere proprietario delle piattaforme),  completando il passaggio dal  “web dei documenti&#8221; al “web delle persone”. La ricerca dell’informazione si sposta pertanto verso la comunicazione interpersonale e prende la forma di suggerimenti, commenti, valutazioni, preferenze etc. In ambito bibliotecario, a fronte anche della saturazione del mercato per l’adeguamento degli ILS negli anni passati che spinge i principali operatori commerciali a disinvestire in questo campo, l&#8217;iniziativa passa a progetti <a class="zem_slink" title="Open Source" rel="wikinvest" href="http://www.wikinvest.com/concept/Open_Source">open source</a> a cui si debbono anche gli OPAC innovativi (<em>SOPAC; OPL</em>) che accolgono le funzionalità del <em>web 2.0</em>, con commenti personali, liste di lettura e altre funzionalità sociali.</p>
<p>Una ulteriore evoluzione del <em>web 2.0</em>, in particolare dell’interattività, del <em>mashup </em>e della moltiplicazione degli API, è il <em><a class="zem_slink" title="Cloud Computing" rel="wikinvest" href="http://www.wikinvest.com/concept/Cloud_Computing">cloud computing</a>,</em> cioè la trasformazione della rete in piattaforma per la distribuzione di servizi che sta  rivoluzionando l’attività di <em>networking</em>. Recentemente alcune applicazioni in rete hanno portato nella <em>cloud</em> la catalogazione (<a href="http://biblios.net/"><em>Biblios.net</em></a> su cui si veda <a href="http://bonariabiancu.wordpress.com/2009/11/22/library-mashups-2-mashing-up-open-data-with-biblios-net-web-sevices/">qui </a>e <a href="http://theskyriver.com/"><em>SkyRiver</em></a>) Anche il maggior consorzio bibliotecario mondiale OCLC mira a fornire un servizio a livello di rete non tramite la condivisione dello stesso hardware, dei servizi e dei dati e nemmeno ospitando hardware e software per conto di singole biblioteche, bensì ingegnerizzando nuove architetture di sistema e nuove procedure di lavoro per attivare modi di interazione e collaborazione globali. L’obiettivo, dopo la catalogazione partecipata e la condivisione del prestito interbibliotecario, è quello di fornire funzionalità gestionali modulari e in più fornire una integrazione a livello di rete di servizi attualmente esclusi anche dai tradizionali ILS quali l’integrazione della knowledge base, l’analisi delle collezioni delle biblioteche in worldcat, etc. (cfr. <a href="http://www.oclc.org/us/en/productworks/webscale.htm">qui</a>)</p>
<p>Il modello di ricerca di google basato sulla statistica delle parole cercate e sulla analisi del grafo della rete per inferire criteri di popolarità dei siti internet da far valere nell’ordinamento di importanza dei risultati, è sempre più <a href="http://thenextweb.com/2008/06/03/video-nova-spivack-making-sense-of-the- semantic-web/">soggetto a critiche</a> sia perché la ricerca tramite parole chiave offre minori prestazioni sia per le crescenti attese di tempestività e personalizzazione. Queste spinte hanno motivato il motore di ricerca a proporre nelle prima posizioni risultati tratti dal settore delle news e a distribuire <em>Searchwiki</em>, un interfaccia che permette di modificare l’ordinamento dei risultati delle proprie ricerche, promuovendone alcuni siti e cancellandone altri e inserendo commenti e giudizi espressi in voti. In tal modo <a class="zem_slink" title="Google" rel="homepage" href="http://google.com">Google</a> recupera l’esperienza di quei motori di ricerca, quali <em><a class="zem_slink" title="Digg" rel="homepage" href="http://www.digg.com">Digg</a></em> o <em><a class="zem_slink" title="StumbleUpon" rel="homepage" href="http://www.stumbleupon.com/">Stumbleupon</a></em> in cui l’ordinamento dei risultati dovrebbe avvenire in base al giudizio degli utenti. La dimensione sociale viene sottolineata attraverso l’implementazione di un servizio di annotazioni e commenti chiamato <em>Sidewiki</em> &#8211; che si rifà a servizi quale <em>ReframeIt, </em>sponsorizzato da Mozilla &#8211; e le cui note sono disponibili sia sul proprio profilo, sia tramite la pubblicazione su blog purché costruito con l’API di Google, <a href="http://www.blogger.com/"><em>Blogger</em></a>. Diretta è anche la pubblicazione su <em>Facebook</em> e <em><a class="zem_slink" title="Twitter" rel="homepage" href="http://twitter.com">Twitter</a></em>.</p>
<p>Il numero di pagine presenti in rete sembra inoltre aver raggiunto una soglia che sollecita l’esplorazione di altre vie per rendere efficace la ricerca e quindi la stessa tenuta della rete come formazione socio tecnica. La parola d’ordine è diventata ricerca “semantica” contrapposta alla ricerca basata su dati quantitativi. <a href="http://www.readwriteweb.com/archives/semtech_making_the_web_searchable_searchmonkey.php">Peter Mika</a> di Talis ha evidenziato la presenza di dati strutturati in circa la metà delle pagine web.  <a href="http://developer.yahoo.com/searchmonkey/"><em>SearchMonkey</em></a> di <em>Yahoo</em>! e i <em>Rich snippets</em> di Google (o anche il prototipo <em>Googlesquare</em><em>d</em> che presenta i singoli risultati in forma tabulare) rappresentano un tentativo di favorire la diffusione e sfruttare le potenzialità, di forme di strutturazione dei dati contenuti nelle pagine web.</p>
<p>Altri approcci seguono la via della analisi semantica del linguaggio naturale delle <em>queries</em> e delle <em>pagine web</em> nel tentativo di realizzare un <em>matching</em> per “concetti” e non per parole intese come meri simboli. Le tecniche adottate mirano da un lato alla categorizzazione automatica delle pagine web in modo da offrire i risultati raggruppati in faccette o gruppi, per suddividere l’ambito semantico dei risultati; ovvero in analisi complesse e assai onerose  che applicano le regole grammaticali e sintattiche della analisi linguistica.</p>
<p>In questo ambito, a fronte di grandi numeri di dati come quelli offerti dal web, <a href="http://www.computer.org/portal/web/csdl/doi/10.1109/MIS.2009.36">alcuni ricercatori</a>, in particolare legati a Google, ripropongono l’efficacia della analisi quantitativa applicata sulla valorizzazione di strutture minimali, nel caso in questione sequenze di parole (n-gram), identificate con metodi statistici, che definiscono contesti linguistici, disambiguano i concetti collegati e quindi assumono valore semantico; si realizza così l’emergenza di modelli, pur parziali e incompleti e in continua variazione – quindi anche scalabili nella dinamica di sviluppo del web &#8211; che possono essere associati a concetti e significati per l’analisi semantica.</p>
<p>Un esperimento di grande importanza per estrarre dati strutturati da testi esistenti, verte sulla manipolazione di Wikipedia che si presta ad una estrazione di dati strutturati di alto valore semantico: infatti i titoli sono in effetti lemmi di  enciclopedia; concetti, eventi e fatti citati, sono linkati al lemma corrispondente, che esprime un concetto univoco; ogni voce contiene inoltre una bibliografia (o serie di link a siti esterni) e una lista di parole chiave (<em>tag</em>) per identificarne il contenuto e spesso gli articoli sono corredati di un quadro riassuntivo che contiene dati strutturati. Nasce così il database <a href="http://dbpedia.org/About"><em>DBpedia</em></a> costituito da dati strutturati espressi in RDF che dialoga con altre banche dati del medesimo formato.</p>
<p>Un meccanismo importante per rendere disponibile dati strutturati sono i numerosi progetti di conversione di banche dati preesistenti in formato RDF il linguaggio formalizzato dal W3C per connettere i dati (<em>linked data</em>). Molte banche dati sono già disponibili in questo formato leggibile dalle macchine e sono liberamente utilizzabili dalle applicazioni. Altri progetti di conversione dei dati in triple RDF vedono protagoniste banche dati preesistenti, tra cui i cataloghi di biblioteche che vengono riversati in questo formato per valorizzare i dati bibliografici nelle ricerche di rete e renderli liberamente utilizzabili.</p>
<p>Infine, si delinea sempre più il cd <em>web of things</em>, o anche <em>web wide world </em>(<a href="http://mindingtheplanet.net/nova_spivacks_weblog/2009/11/the-world-becomes-the-web.html">Nova Spivak</a>), cioè la diffusione di sensori nel mondo fisico che permettono una interazione remota con e tra macchine. ﻿</p>
<p>(revisionato 2/12)</p>
<div class="zemanta-pixie" style="margin-top:10px;height:15px;"><a class="zemanta-pixie-a" title="Reblog this post [with Zemanta]" href="http://reblog.zemanta.com/zemified/20e62643-9a50-4e5c-821b-06005ed8bbd0/"><img class="zemanta-pixie-img" style="border:medium none;float:right;" src="http://img.zemanta.com/reblog_e.png?x-id=20e62643-9a50-4e5c-821b-06005ed8bbd0" alt="Reblog this post [with Zemanta]" /></a></div>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/4lib.wordpress.com/102/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/4lib.wordpress.com/102/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/4lib.wordpress.com/102/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/4lib.wordpress.com/102/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/4lib.wordpress.com/102/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/4lib.wordpress.com/102/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/4lib.wordpress.com/102/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/4lib.wordpress.com/102/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/4lib.wordpress.com/102/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/4lib.wordpress.com/102/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/4lib.wordpress.com/102/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/4lib.wordpress.com/102/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/4lib.wordpress.com/102/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/4lib.wordpress.com/102/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=102&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://4lib.wordpress.com/2009/11/30/levoluzione-del-web-nel-2009-spunti-di-ricerca/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/5652d4981287bd7a7fb4d51bf836e789?s=96&#38;d=identicon&#38;r=G" medium="image">
			<media:title type="html">Nicola</media:title>
		</media:content>

		<media:content url="http://img.zemanta.com/reblog_e.png?x-id=20e62643-9a50-4e5c-821b-06005ed8bbd0" medium="image">
			<media:title type="html">Reblog this post [with Zemanta]</media:title>
		</media:content>
	</item>
		<item>
		<title>La strutturazione del linguaggio</title>
		<link>http://4lib.wordpress.com/2009/11/22/la-strutturazione-del-linguaggio/</link>
		<comments>http://4lib.wordpress.com/2009/11/22/la-strutturazione-del-linguaggio/#comments</comments>
		<pubDate>Sun, 22 Nov 2009 18:42:27 +0000</pubDate>
		<dc:creator>Nicola</dc:creator>
				<category><![CDATA[information theory]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[hakia]]></category>
		<category><![CDATA[n-gram]]></category>
		<category><![CDATA[NLP]]></category>
		<category><![CDATA[semantic search engine]]></category>
		<category><![CDATA[semantic web]]></category>

		<guid isPermaLink="false">http://4lib.wordpress.com/?p=96</guid>
		<description><![CDATA[I motivi della diffusione dei motori di ricerca semantici sono legati alla valutazione che l’algoritmo di google abbia raggiunto il culmine della sua efficacia (si veda per tutti in bell’intervento di Nova Spivak ) e che siano necessarie nuove tecnologie di tipo qualitativo per incrementare la ricerca nel web. La questione non è a mio [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=96&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>I motivi della diffusione dei motori di ricerca semantici sono legati alla valutazione che l’algoritmo di google abbia raggiunto il culmine della sua efficacia (si veda per tutti in bell’intervento di <a href="http://thenextweb.com/2008/06/03/video-nova-spivack-making-sense-of-the-semantic-web/">Nova Spivak</a> ) e che siano necessarie nuove tecnologie di tipo <em>qualitativo </em>per incrementare la ricerca nel web. La questione non è a mio parere posta in modo corretto dato che, come ha scritto Stefano Mazzocchi  in un bruciante <a href="http://www.betaversion.org/~stefano/linotype/news/275/">commento</a> allo stimolante e provocatorio articolo <a href="http://portal.acm.org/citation.cfm?id=1525642.1525689">The unreasonable effectiveness of data</a>, apparso su <em>IEEE Intelligent Systems</em>, nell’aprile 2009 a firma dei ricercatori legati a Google, A. Halevy, P. Norvig e F. Pereira,  Google fa riferimento più a alla struttura offerta dal tag &lt;a&gt; dell&#8217;html (<em>anchor</em>) e alla analisi dei <em>link </em>successivi per ricostituire il <em>social graph</em>, che non all&#8217;analisi statistica delle parole (che per altro include in parte nell&#8217;algoritmo del PageRank).</p>
<p>L’intervento tranchant di Mazzocchi &#8211; dal titolo <em>Unreasonabe Hypocrisy</em> – ha forse avuto l’effetto di bloccare momentaneamente lo sviluppo di un dibattito serio sulla capacità di trarre da tale<em> struttura minimale </em>dell’html, strumenti di &#8220;irragionevole efficacia&#8221;. In questo senso hanno perfettamente ragione A. Halevy, P. Norvig e F. Pereira a delineare una  alternativa non tra una semantica basata sulla strutturazione e una basata sulla statistica, bensì tra dati strutturati  manualmente e dati definiti tramite l’identificazione di <em>strutture emergenti,</em> anche se incomplete, dalla analisi statistica.</p>
<p>Il dibattito è comunque tutto da sviluppare. Per tornare al tema mi sembra che per sopperire alle presunte carenze di google si siano intrapresi due percorsi principali, da un lato quello scelto da Yahoo! con SearchMonkey, seguito dai Rich snippet di Google, di incrementare e valorizzare i dati strutturati manualmente presenti nelle pagine web, dall’altro l’utilizzo di tecniche di “<em>natural language processing</em>”(NLP) cioè di analisi linguistica sia della query che dei risultati della ricerca.</p>
<p>In particolare i motori di ricerca semantici si propongono di fornire una categorizzazione dei risultati nell’ottica di un approccio esplorativo ai possibili significati che potrebbero corrispondere all’intenzione dell’utente, oppure ambiscono a rispondere proprio alle <em>queries </em>della <em>long tail</em>, quindi richieste personalizzate, specifiche, articolate, in una parola <em>non frequenti</em>, e quindi dipendenti più dalla qualità che dalla popolarità delle risposte. Le tecniche di NLP sono infatti alla base dei progetti di motori “verticali” cioè che operano in campi disciplinari definiti e i cui contenuti possono essere formalizzati in modo coerente.</p>
<p>Queste tecnologie sono cresciute negli ultimi decenni in laboratori di ricerca e progetti specifici, costruendo esperienze e set di dati considerevoli anche se non ancora in grado di misurarsi con la dimensione del web. Inoltre la loro efficacia si evidenzia soprattutto nella trattazione di testi omogenei e parzialmente strutturati, come la banca dati di Medline, che costituisce un corpus altamente omogeneo e strutturato, o recentemente soprattutto Wikipedia perché:</p>
<ul>
<li>non      sottoposto a copyright,</li>
<li>abbastanza      generalista da fornire facilmente un’ampia gamma di risposte alle possibili queries e in più      costruito secondo i criteri formali di una enciclopedia,</li>
<li>e      ultimo ma non meno importante, fornito di una struttura semantica propria,      dalle parole chiave in fondo agli articoli, ai link che spiegano e      disambiguano i concetti citati collegando alle pagine corrispondenti della      stessa Wikipedia, ai box di sommario presenti in molti articoli.</li>
</ul>
<p>Si costruiscono per questa via le ontologie con cui confrontare i risultati della analisi semantica della <em>query </em>in modo da trovare una corrispondenza non tra simboli (le parole) ma tra concetti.  I passi avanti dal punto di vista logico sono tangibili, meno però la loro efficacia pratica quando si considera il rapporto costi benefici. Come ricordato nell’articolo sopra citato di A. Halevy, P. Norvig e F. Pereira:</p>
<blockquote><p>Project Halo did an excellent job of encoding and reasoning with knowledge from a chemistry textbook, but the cost was US$10,000 per page. Obviously we can’t afford that cost for a trillion Web pages</p></blockquote>
<p>Per affrontare l’analisi semanica del web l’approccio necessario sembra doversi legare ad altri fattori.</p>
<p>In <a href="http://www.hakia.com">Hakia</a>, come viene spiegato in un <a href="http://www.readwriteweb.com/archives/new_commercial_ontology_from_hakia.php">post</a> di autopresentazione del progetto, l’attenzione è stata spostata dall’analisi sintattica e semantica, all’analisi delle sequenze di parole. Oggetto di valutazione non sono singole parole, naturalmente dotate di molteplici significati e usi, bensì brevi sequenze di parole (dette<a href="http://en.wikipedia.org/wiki/N-gram"> n-gram</a>) che insieme costituiscono un <em>contesto e </em> <em>disambiguano </em>il significato di ognuna di esse circoscrivendo il concetto espresso, come esemplifica il seguente schema tratto dal <em>post </em>stesso e relativo alla sequenza semantica <em>road kill</em>:</p>
<p><a href="http://4lib.files.wordpress.com/2009/11/hakia_sponsor_jul09a.jpg"><img class="aligncenter size-medium wp-image-97" title="hakia_sponsor_jul09a" src="http://4lib.files.wordpress.com/2009/11/hakia_sponsor_jul09a.jpg?w=300&#038;h=257" alt="Schema di analisi linguistica" width="300" height="257" /></a></p>
<p>Questo approccio al linguaggio non per parole isolate, ma per parole correlate, si esercita non solo a livello di analisi dei dati, ma anche a livello di costruzione dell’ontologia di riferimento: è quella che in Hakia viene chiamata <em>Commercial Ontology</em> che rinvia al fatto che:</p>
<blockquote><p>The ontology is built based on the commercial value of the concepts. The concept of digital camera may be more important than the concept of German Opera in the commercial world, thus the former gets more refinement and detail in its ontological definition and lexicon space</p></blockquote>
<p>In base al <em>post </em>non si riesce a determinare quanto la costruzione dell’ontologia proposto da Hakia, sicuramente una ontologia che si riferisce ad una corpus reale, non astratto, sia basata su un apporto manuale di specialisti oppure su un processo automatico statistico.</p>
<p>L’aspetto più interessante è però che su questa via i pacchetti che vanno a costruire l&#8221;ontolgia (e che non sappiamo come siano scelti in Hakia &#8230; magari sono tratti dalle queries ?) si possono definire non attraverso il ragionamento (<em>reasoning</em>) in base a regole su parole strutturate manualmente nel loro contesto semantico (parole correlate e sinonimi), bensì da <em>modelli emergenti</em> dalla mera analisi statistica.</p>
<p>Si motiva così l’affermazione di A. Halevy, P. Norvig e F. Pereira che la meccanizzazione del linguaggio è tanto più semplice  quanto più si opera <em>in corpore vili</em>, cioè su un corpus di dati che esiste “in natura” (usano l&#8217;espressione <em>in the wild</em>) invece che su uno creato astrattamente e sottoposto a complessi, discutibili ma sempre variabili assunti (come avviene nella interpretazione del linguaggio) e suggeriscono l’esempio del relativo successo della meccanizzazione delle traduzioni, avvenuto in base ad un corpus considerevole di traduzioni in più lingue creato dalla CE e dalle agenzie internazionali di news, in cui a gruppi di parole ricorrenti si possono associare corrispondenti gruppi di parole in altre lingue, trasformando la traduzione da un problema di raffinato <em>reasoning </em>ad uno di <em>matching </em>di sequenze di parole.</p>
<p>E’ forse anche questa una delle vie per una strutturazione del linguaggio del web capace di identificare  una struttura minimale dei dati e restituire automaticamente quanto di più simile alla semantica del linguaggio naturale ?</p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/4lib.wordpress.com/96/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/4lib.wordpress.com/96/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/4lib.wordpress.com/96/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/4lib.wordpress.com/96/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/4lib.wordpress.com/96/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/4lib.wordpress.com/96/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/4lib.wordpress.com/96/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/4lib.wordpress.com/96/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/4lib.wordpress.com/96/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/4lib.wordpress.com/96/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/4lib.wordpress.com/96/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/4lib.wordpress.com/96/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/4lib.wordpress.com/96/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/4lib.wordpress.com/96/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=96&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://4lib.wordpress.com/2009/11/22/la-strutturazione-del-linguaggio/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/5652d4981287bd7a7fb4d51bf836e789?s=96&#38;d=identicon&#38;r=G" medium="image">
			<media:title type="html">Nicola</media:title>
		</media:content>

		<media:content url="http://4lib.files.wordpress.com/2009/11/hakia_sponsor_jul09a.jpg?w=300" medium="image">
			<media:title type="html">hakia_sponsor_jul09a</media:title>
		</media:content>
	</item>
		<item>
		<title>Motori di ricerca semantici 2</title>
		<link>http://4lib.wordpress.com/2009/11/17/motori-di-ricerca-semantici-2/</link>
		<comments>http://4lib.wordpress.com/2009/11/17/motori-di-ricerca-semantici-2/#comments</comments>
		<pubDate>Tue, 17 Nov 2009 09:48:47 +0000</pubDate>
		<dc:creator>Nicola</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[Cognition]]></category>
		<category><![CDATA[Lexxe]]></category>
		<category><![CDATA[NLP]]></category>
		<category><![CDATA[Powerset]]></category>
		<category><![CDATA[semantic search engine]]></category>

		<guid isPermaLink="false">http://4lib.wordpress.com/?p=89</guid>
		<description><![CDATA[Ho accennato nel precedente post al fatto che stanno nascendo numerosi motori di ricerca che si dicono semantici basati sulla linguistica computazionale che pretendono di migliorare sostanzialmente la ricerca di contenuti, rispetto alla ricerca per parole chiave che utilizza criteri statistici o di popolarità. Oltre ad Hakia ho preso in esame anche Lexxe, apparentemente un [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=89&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>Ho accennato nel precedente post al fatto che stanno nascendo numerosi motori di ricerca che si dicono semantici basati sulla linguistica computazionale che pretendono di migliorare sostanzialmente la ricerca di contenuti, rispetto alla ricerca per parole chiave che utilizza criteri statistici o di popolarità.</p>
<p>Oltre ad <a href="http://www.hakia.com">Hakia </a>ho preso in esame anche <a href="http://www.lexxe.com">Lexxe</a>, apparentemente un efficace <a href="http://www.lexxe.com/about/technology.cfm">motore di ricerca</a> che si propone di  rispondere a domande formulate in linguaggio naturale e non solo con parole chiave. La caratteristica più marcata di Lexxe è quella di presentare accanto ai risultati di una ricerca, categorizzazioni o raggruppamenti ad hoc che servono a specificare o filtrare i risultati per ottenere maggior precisione. Tali raggruppamenti non sono precostituiti al momento della presentazione dei risultati, bensì si costruiscono <em>on the fly</em> se vengono cliccati. Il risultato di tale ricerca è una nuova lista di risultati ma anche il suggerimento di nuovi raggruppamenti da esplorare  (<em>dinamic clustering</em>) .</p>
<p>Si tratta di un modo efficace per esplorare un argomento da diversi punti di vista, attraverso la classificazione ontologica, che si basa non sul <em>matching </em>delle parole della <em>query </em>con quelle dell’indice del motore di ricerca, valutate poi in modo statistico quantitativo,  bensì sulla identificazione dei concetti rappresentati dalle parole della <em>query </em>e il loro confronto con una <em>ontologia</em> o <em>mappa di concetti</em>, cioè di parole dotate di relazioni tra di se, costruita in modo semiautomatico.</p>
<p>Di questa categoria fa parte anche <a href="http://www.powerset.com/">Powerset </a>un motore di ricerca semantico  recentemente acquistato da <em>Microsoft </em>per integrare i risultati del proprio motore di ricerca, <em>Bing</em>. La sua tecnologia risiede soprattutto sull’analisi sintattica tramite un software di <em>parsing</em> su licenza di Xerox Parc. Come <a href="http://www.ciaoblog.net/a-pochi-giorni-dal-lancio-di-powerset-il-motore-di-ricerca-semantico-l%E2%80%99intervista-a-lorenzo-thione-co-fondatore-e-product-architect-dell%E2%80%99azienda-stessa/">spiega </a>Lorenzo Thione co-fondatore di Powerset, il software scompone il testo in frasi e fa</p>
<blockquote><p>l’analisi logica e grammaticale della frase, scomponendola in soggetto, predicati verbali e complementi, e cercando di analizzare il ruolo di ciascun complemento nell’ambito del testo, come per esempio, individuare se un complemento e’ finale, causale o di moto a luogo. Una volta che il software ha fatto questa analisi, delle componenti semantiche (dette features, o caratteristiche) vengono estratte e inserite nell’algoritmo di selezione e ordinamento dei risultati, in armonia con le altre componenti meno linguistiche, come il <em>PageRank </em>o la prossimita’ delle parole chiave.</p></blockquote>
<p>Thione  sostiene che lo <em>spider </em>di <em>Powerset </em>è in grado di indicizzare il web (naturalmente solo pagine in inglese) ma “per adesso l’indice di <em>Powerset </em>e’ ristretto a <em>Wikipedia</em>&#8220;  (<em>ibidem</em>) e al database di <em>Freebase </em>(basato sull’analisi di <em>Wikipedia </em>e su contenuto sociale).</p>
<p>Ad esempio la ricerca di &#8220;Al Gore&#8221; conduce ad una risposta univoca tratta da <em>Freebase </em>ma presenta anche le possibili <em>triple</em>:</p>
<p>Al Gore:</p>
<p>won                 district, country, vote, internet, primari, states, seat, nomination …</p>
<p>carried             disctrict, stated and Nashville</p>
<p>received          percent, vote, primetime Emmy Avard, a number, electors …..</p>
<p>Inoltre gli articoli di <em>Wikipedia </em>relativi alla ricerca e rimaneggiati da <em>Powerset</em>, presentano sulla destra un utile quadro riassuntivo del contenuto dell’articolo che rimane stabile allo scorrere dello schermo, che si suddivide in <em>Overview</em> (dati sintetici); <em>outline </em>(l’indice dell’articolo); <em>images </em>(le immagine pubblicate nell’articolo); <em>locations </em>(le mappe dei luoghi connessi al contenuto dell’articolo); <em>Twitter </em>(recent <em>tweets </em>di Al Gore). <em>Powerset </em>è quantomeno un ottimo motore di ricerca sui dati tratti fattuali da <em>Wikipedia </em>e di <em>Freebase</em>.</p>
<p><a href="http://www.cognition.com">Cognition </a>si basa come <em>Hakia </em>sulla classificazione ontologica ma, affermano i suoi ideatori, con una mappa semantica (cioè parole e concetti classificati) più comprensiva e quindi più funzionale. Inoltre sostiene di utilizzare anche l’analisi morfologia e di gestire i sinonimi. Non risulta tuttavia che a oggi il motore di ricerca abbia suscitato particolare interesse (maggiori informazioni <a href="http://www.readwriteweb.com/archiv">qui</a>)</p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/4lib.wordpress.com/89/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/4lib.wordpress.com/89/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/4lib.wordpress.com/89/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/4lib.wordpress.com/89/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/4lib.wordpress.com/89/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/4lib.wordpress.com/89/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/4lib.wordpress.com/89/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/4lib.wordpress.com/89/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/4lib.wordpress.com/89/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/4lib.wordpress.com/89/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/4lib.wordpress.com/89/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/4lib.wordpress.com/89/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/4lib.wordpress.com/89/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/4lib.wordpress.com/89/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=89&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://4lib.wordpress.com/2009/11/17/motori-di-ricerca-semantici-2/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/5652d4981287bd7a7fb4d51bf836e789?s=96&#38;d=identicon&#38;r=G" medium="image">
			<media:title type="html">Nicola</media:title>
		</media:content>
	</item>
		<item>
		<title>Semantic search engines</title>
		<link>http://4lib.wordpress.com/2009/11/09/semantic-search-engines/</link>
		<comments>http://4lib.wordpress.com/2009/11/09/semantic-search-engines/#comments</comments>
		<pubDate>Sun, 08 Nov 2009 22:25:19 +0000</pubDate>
		<dc:creator>Nicola</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[Cognition]]></category>
		<category><![CDATA[hakia]]></category>
		<category><![CDATA[Lexxe]]></category>
		<category><![CDATA[ontologie]]></category>
		<category><![CDATA[Powerset]]></category>
		<category><![CDATA[semantic search engine]]></category>

		<guid isPermaLink="false">http://4lib.wordpress.com/?p=83</guid>
		<description><![CDATA[In fase di declino dell’efficacia dell’algoritmo di Google, tra le tendenze di ricerca proposte per ovviare alla scarsa rilevanza dei risultati, figurano i motori di ricerca semantici capaci cioè di distinguere e riconoscere i significati. L’idea non è nuova dato che sottende la ricerca sul semantic web condotta del w3c, che consiste, in estrema sintesi, [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=83&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>In fase di declino dell’efficacia dell’algoritmo di Google, tra le tendenze di ricerca proposte per ovviare alla scarsa rilevanza dei risultati, figurano i motori di ricerca semantici capaci cioè di distinguere e riconoscere i significati. L’idea non è nuova dato che sottende la ricerca sul semantic web condotta del w3c, che consiste, in estrema sintesi, nell’introdurre strutture semantiche fin dalla costruzione delle pagine web. Questo approccio, come è noto, è considerato complessivamente irrealistico perché richiede l’accettazione estesa di standard condivisi e la padronanza delle complesse regole della semantica. Una via alternativa è invece quella di spostare l’analisi semantica negli algoritmi dei motori di ricerca rendendo interpretabile ogni <em>testo</em>: “We need algorithms that match the meaning of concepts (rather than mere words) and emulate &#8220;understanding.&#8221;” (<em><a href="http://www.readwriteweb.com/archives/semantic_search_antidote_for_poor_relevancy.php">Riza C. Berkan</a>, Founder &amp; CEO, <a href="http://hakia.com/">hakia.com</a></em><em>) ()</em> Questo è il percorso intrapreso dai cosiddetti motori di ricerca semantici quali Hakia, <a href="http://www.powerset.com/">Powerset</a>, <a href="http://www.cognition.com/info/how.html">Cognition search</a>, <a href="http://www.lexxe.com/">Lexxe</a> che si avvale di un nuovo approccio delle tecniche di Natural Language Processing.</p>
<p>Hakia si presenta come alternativa ai motori di ricerca tradizionali e mira a sostituire al criterio quantitativo quello qualitativo: “a popular Web site may not always be credible, and a credible Web site may not always be popular”. Inoltre i motori di ricerca basati sulla popolarità richiedono una costruzione della query con poche, semplici parole. Ciò significa che le query più lunghe e complesse che rispecchiano spesso bisogni informativi specifici o che richiedono risposte in tempo reale rispetto agli eventi cercati, non vengono soddisfatte.</p>
<p>Tramite la analisi della query (meglio se formulata con frasi che non solo con  parole chiave) l’algoritmo di Hakia sarebbe invece in grado di trovare corrispondenze col contenuto delle pagine web e non solo sulle frasi chiave che esse condividono o le statistiche di popolarità. Questi risultati sono ottenuti implementando l’ontologia semantica (OntoSem) che traduce in modo automatico ogni frase che le viene sottoposta, in Text meaning representation (TMR). A questo scopo utilizza complesse procedure di analisi linguistica del testo pieno che mirano a identificarne i componenti grammaticali e sintattici e i concetti contenuti e a collocarli in un contesto semantico di sinonimi e concetti correlati, costruito attraverso l’analisi di migliaia di pagine di testo pieno. In tal modo si emula il processo mentale di un umano che legge un testo. Queste metodologie sono poi utilizzate insieme a tecniche non semantiche per essere implementate nel motore di ricerca (<a href="http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.95.1311&amp;rep=rep1&amp;type=pdf">Hempelmann, , Christian F.</a> Hakia inc.).</p>
<p>Attraverso l’algoritmo QDEX (Quality Detection and Extraction) i ricercatori di Hakia sarebbero riusciti a implementare procedure veloci ed efficienti per indicizzare le risorse di rete. Sembra anche di capire che il primo passo è stato creare la struttura semantica dei TMRs analizzando siti di provata qualità come benchmarck per la verifica dei concetti. Il risultato sono una organizzazione dei risultati per categorie, cioè per contesti semantici.</p>
<p>I risultati delle ricerche sono presentati non come liste standard bensì per schede (tabs) dal nome:  <em>All results - Credible sites &#8211; News &#8211; Images &#8211; Meet Others</em> a suggerire i diversi approcci, uno generalista, uno limitato a siti scelti da bibliotecari o specialisti dell’informazione (ma <a href="http://www.techcrunch.com/2008/10/06/semantic-search-engine-hakia-now-says-it-can-filter-results-by-how-credible-they-are/">sembra</a> che non vi sia alcuna vera barriera contro lo spam e tentativi di influenzare i risultati), uno dedicato alle news e l’ultimo è una sorta di forum, suddiviso in diverse stanze di conversazione, in cui gli utenti possono articolare conversazioni stabilire contatti, esprimere valutazioni e scambiarsi informazioni.</p>
<p>L’analisi semantica permette l’implementazione di una serie di nuove funzionalità, quali:</p>
<p><em>evidenziazione di frasi coerenti</em>: i risultati della ricerca riportano selezionata nella descrizione del sito la frase semanticamente corrispondente alla query.</p>
<p><em>la categorizzazione</em>: per richieste formulate in modo semplice e popolare (p. e. cancer oppure Madonna), hakia presenta i risultati organizzati in categorie, costruendo aggregazioni chiamate Galleries composte da circa 10 categorie, corrispondenti, secondo gli ideatori ad altrettante queries più specifiche nei motori di ricerca convenzionali.</p>
<p><em>Parallelismo</em>: è una innovativa funzionalità che rinvia all’uso di termini equivalenti o associati nella ricerca (ad esempio “kill=murder”).</p>
<p><em>Generalizzazione</em>: in molte domande è necessario applicare forme di generalizzazione: ad esempio una ricerca con il termine car può dover essere riconosciuto come termine generale per le singole marche che devono quindi essere contenute nei risultati della ricerca</p>
<p>Nella Home page di Hakia viene proposto un <a href="http://club.hakia.com/challenge/default2.aspx?q=Naval+Academy&amp;lang=Web">confronto con google</a>. La lista dei risultati della stessa query suggerita (naval academy) in Hakia (mi limito alla scheda All results per Hakia) è organizzata in  categorie (p. e.; college profile, Headline news, Admissions, Athletics, Applying for Financial Aid, Faculty Directory ….etc) mentre in google i risultati sono correlati ai “rich snippets” che raggruppano i dati per formato (<em>videos, news, blogs, forums</em>), cronologicamente (risultati recenti, un’ora fa …), per pagine visitate o no, secondo visualizzazioni particolari (<em>Standard, Related Searches, Wonder Wheel, timeline)</em>, e infine: risultati standard oppure con immagini tratte dalla pagina, con più o meno siti di shopping, con la preview. Il confronto dovrebbe evidenziare il valore semantico della struttura categoriale proposta da Hakia per organizzare i risultati, rispetto alla suddivisione più occasionale dei &#8220;rich snippet&#8221; (Per uno studio sulle performance di Hakia in confronto con Yahoo, Google e Msn che tuttavia non presenterebbero grandi diversità, si veda <a href="http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=5076348">qui</a>),</p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/4lib.wordpress.com/83/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/4lib.wordpress.com/83/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/4lib.wordpress.com/83/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/4lib.wordpress.com/83/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/4lib.wordpress.com/83/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/4lib.wordpress.com/83/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/4lib.wordpress.com/83/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/4lib.wordpress.com/83/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/4lib.wordpress.com/83/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/4lib.wordpress.com/83/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/4lib.wordpress.com/83/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/4lib.wordpress.com/83/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/4lib.wordpress.com/83/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/4lib.wordpress.com/83/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=83&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://4lib.wordpress.com/2009/11/09/semantic-search-engines/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/5652d4981287bd7a7fb4d51bf836e789?s=96&#38;d=identicon&#38;r=G" medium="image">
			<media:title type="html">Nicola</media:title>
		</media:content>
	</item>
		<item>
		<title>SOPAC</title>
		<link>http://4lib.wordpress.com/2009/11/01/sopac/</link>
		<comments>http://4lib.wordpress.com/2009/11/01/sopac/#comments</comments>
		<pubDate>Sun, 01 Nov 2009 17:18:51 +0000</pubDate>
		<dc:creator>Nicola</dc:creator>
				<category><![CDATA[Library 2.0]]></category>
		<category><![CDATA[social information]]></category>
		<category><![CDATA[Darien Library]]></category>
		<category><![CDATA[Drupal]]></category>
		<category><![CDATA[Insurge]]></category>
		<category><![CDATA[Locum]]></category>
		<category><![CDATA[SOPAC]]></category>
		<category><![CDATA[Sphinx]]></category>

		<guid isPermaLink="false">http://4lib.wordpress.com/?p=76</guid>
		<description><![CDATA[Diversamente da Bibliocommons, SOPAC è una infrastruttura che permette l’integrazione di un Integrated Library System (ILS) con il Content Management System (CMS) Drupal per aggiungere tags, giudizi e recensioni ai records bibliografici. L’informazione fornita dagli utenti è incorporata nell’indice della ricerca, trasformando il catalogo tradizionale in un catalogo 2.0. Il CMS Drupal è interfacciato con [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=76&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>Diversamente da Bibliocommons, <a href="http://thesocialopac.net/about">SOPAC</a> è una infrastruttura che permette l’integrazione di un Integrated Library System (ILS) con il Content Management System (CMS) <em>Drupal </em>per aggiungere tags, giudizi e recensioni ai records bibliografici. L’informazione fornita dagli utenti è incorporata nell’indice della ricerca, trasformando il catalogo tradizionale in un catalogo 2.0.</p>
<p>Il CMS <em>Drupal </em>è interfacciato con l’ILS attraverso il software php, <em>Locum</em>, che tramite “connectors” è potenzialmente in grado di interagire con qualsiasi ILS. Inoltre si interfaccia con il motore di indicizzazione del full text, <em>Sphinx</em>, che costruisce un efficace indice esterno.</p>
<p>L&#8217;ultimo modulo dell&#8217;infrastruttura è <em>Insurge </em> che serve per associare i dati sociali costruiti in modo interattivo, con i records bibliografici (è lo S di SOPAC). Esso permette di sfruttare le potenzialità del deposito di dati sociali importati via <em>Locum </em>e visualizzati con applicazioni come SOPAC.</p>
<p>SOPAC può essere visto in azione nelle seguenti biblioteche:</p>
<ul>
<li><a href="http://www.darienlibrary.org/catalog">Darien Library</a></li>
<li><a href="http://www.pvld.org/catalog">Palos Verdes Library District</a></li>
<li><a href="http://www.aadl.org/catalog">Ann Arbor District Library</a></li>
</ul>
<p>Esiste anche una <a href="http://demo.sopac.biblibre.com/node?destination=node">demo</a> in cui il modulo <em>Drupal </em>sostituisce l’opac dell’ILS , in questo caso <em>Koha </em>(open source).</p>
<p>Esaminando la <a href="http://www.darienlibrary.org/">Darien Library</a> dopo essersi autenticati (la procedura è immediata anche se non si possiede la library card) colpisce subito sotto il frame col canale per la ricerca, la possibilità di esplorare il posseduto della biblioteca esaminando le categorie di narrativa, libri, DVD, Blu-ray Disc (BD), CDs e Audiobook, rispettivamente nuovi, più popolari o più votati. In più i favoriti dallo staff della biblioteca. Immediatamente sotto seguono le discussioni tra utenti su libri, film e musica posseduti dalla biblioteca.</p>
<p>L’attività che può essere svolta si trova sulla sinistra dello schermo e oltre a presentare i dati e le opzioni per la circolazione dei documenti relativa all’account, permette di vedere i propri giudizi, recensioni, tags e ricerche. E’ sempre presente una opzione “Talk to a librarian”. Una volta identificato un libro è possibile votarlo sulla scala da 1 a 5 stelle, scrivere una recensione o attribuire un tag.</p>
<p>Per quanto riguarda la ricerca compaiono curiosamente due canali: il primo posto sul frame che sembra rimanere stabile mentre si naviga nel sito, che indirizza le ricerche sui cataloghi di libri, musica, films, generale, sul sito della dariel library oppure, udite, direttamente su google.</p>
<p>Nella frame sottostante invece il canale di ricerca può indirizzarsi sulle parole chiave, titolo, autore, collana, tags, recensioni subject e collocazione (call numeber) cercate nei cataloghi generale, libri, musica, films, audiobook, periodici, software, elettronica. Esiste anche una ricerca avanzata che introduce la ricerca in collezioni, collocazioni e formati. Numerose le opzioni di ordinamento dei risultati, tra cui per rilevanza (?), più recenti o più popolari.</p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/4lib.wordpress.com/76/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/4lib.wordpress.com/76/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/4lib.wordpress.com/76/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/4lib.wordpress.com/76/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/4lib.wordpress.com/76/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/4lib.wordpress.com/76/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/4lib.wordpress.com/76/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/4lib.wordpress.com/76/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/4lib.wordpress.com/76/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/4lib.wordpress.com/76/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/4lib.wordpress.com/76/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/4lib.wordpress.com/76/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/4lib.wordpress.com/76/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/4lib.wordpress.com/76/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=76&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://4lib.wordpress.com/2009/11/01/sopac/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/5652d4981287bd7a7fb4d51bf836e789?s=96&#38;d=identicon&#38;r=G" medium="image">
			<media:title type="html">Nicola</media:title>
		</media:content>
	</item>
		<item>
		<title>Opac 2.0: Oakville Public Library</title>
		<link>http://4lib.wordpress.com/2009/11/01/opac-2-0-oakville-public-library/</link>
		<comments>http://4lib.wordpress.com/2009/11/01/opac-2-0-oakville-public-library/#comments</comments>
		<pubDate>Sun, 01 Nov 2009 11:59:27 +0000</pubDate>
		<dc:creator>Nicola</dc:creator>
				<category><![CDATA[Library 2.0]]></category>
		<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[Web 2.0]]></category>
		<category><![CDATA[bibliocommons]]></category>
		<category><![CDATA[community activity]]></category>
		<category><![CDATA[exploratory search]]></category>
		<category><![CDATA[OPAC 2.0]]></category>
		<category><![CDATA[social search]]></category>

		<guid isPermaLink="false">http://4lib.wordpress.com/?p=70</guid>
		<description><![CDATA[Sta costruendosi una nuova generazione di OPAC ? sembra proprio di si a giudicare dalle aspettative che vengono poste su due nuovi prodotti SOPAC costruito da John Blyberg  della Darien Library (Connecticut) e l&#8217;OPAC della Oakville Public Library (Canada) che sottende il progetto Bibliocommons. Queste iniziative vengono soprattutto dopo un periodo di stallo nella elaborazione [...]<img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=70&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>Sta costruendosi una nuova generazione di OPAC ? sembra proprio di si a giudicare dalle aspettative che vengono poste su due nuovi prodotti SOPAC costruito da John Blyberg  della <a href="http://www.darienlibrary.org/">Darien Library</a> (Connecticut) e l&#8217;OPAC della <a href="http://www.opl.on.ca/">Oakville Public Library</a> (Canada) che sottende il progetto Bibliocommons.</p>
<p>Queste iniziative vengono soprattutto dopo un periodo di stallo nella elaborazione di nuove funzionalità per gli OPAC da parte delle società che controllano il mercato degli ILS, limitate fino ad oggi alla faceted search e alla innovativa interfaccia utente di Acquabrowser e alla costruzione di Primo da parte di Ex-libris (per un inquadramento di questi temi: Opensource, crowdsource: harnessing the power of the  people behind our libraries, CindiTrainor,  Program: electronic library and information systems, Vol.43No.3,2009, pp.288-298. DOI10.1108/00330330910978581)</p>
<p>Non mancano in verità gli stimoli a rivedere le funzionalità del catalogo a fronte delle innovazioni non tanto tecnologiche quanto relative alle possibilità stesse della ricerca dell&#8217;informazione introdotte dal web 2.0, ma è evidente che dopo gli ingenti investimenti per la meccanizzazione delle biblioteche negli anni passati il settore è commercialmente saturo. La ricerca nel web 2.0 introduce nuovi approcci che prendono il nome di ricerca sociale o anche ricerca esplorativa. Viene esaltato il ruolo degli utenti per proporre risorse di interesse, assegnargli un voto, scrivere recensioni e commenti, assegnare categorie (tag) alle pagine selezionate (contribuendo in tal modo anche a favorire la ricerca semantica), costruire liste di oggetti interessanti, ricevere consigli sulla base del proprio profilo personale, comunicare in tempo reale le proprie scoperte, valutazioni, impressioni, nella propria rete sociale tramite i social network e ricevere feedback, costruire un ambiente basato sulla fiducia, etc&#8230;</p>
<p>Si evidenzia che gli ILS tradizionali hanno in realtà meccanizzato solo il back office della attività bibliotecaria avendo presente soprattutto le esigenze del lavoro del bibliotecario e non quelle dell&#8217;utente. E&#8217; ormai un luogo comune, lamentato dai bibliotecari stessi, che gli utenti ormai cerchino di soddisfare il proprio bisogno informativo tramite google e usino il catalogo come inventario del posseduto della biblioteca.</p>
<p>Per esaminare le funzionalità di un OPAC 2.0 è molto utile vedere la demo &#8220;<a href="http://www.bibliocommons.com/tour/CAN-OAK/tour.html">Take a tour</a>&#8220;  sulla home page del sito della Oakville Public Library. Le funzionalità 2.0 sono tutte presenti e del tutto integrate: la scelta che ha guidato la progettazione dell&#8217;OPAC è infatti la piena integrazione nel record bibliofico della informazione sociale.  L&#8217;interfaccia per utenti iscritti è divisa in tre parti, quella centrale che presenta il servizio richiesto (novità, libri da restituire, etc.), quella di destra in cui in genere sono elencate le operazioni che l&#8217;utente può condurre sul proprio account o sul libro: <em>Comment, CaTagorize This, Add Summary, Similar titles, Age suitability, Raccomandations, My collection, Inbox e Community credits</em>; e quella di sinistra in cui  compaiono, a seconda del contesto, le possibilità di filtro della ricerca (tramite <em>Branches</em> &#8211; cioè sedi della biblioteca, <em>Format, By Topic, By Language</em> &#8230;) oppure sono accessibili le più recenti azioni fatte da altri utenti (The Commons) tra cui commenti e liste organizzate in genere per argomento. Si può agiungere un video (ad es. una intervista all&#8217;autore di un libro) tratto da Youtube o Schooltube ad un titolo o ad una lista di titoli, fornendo lo script del servizio prescelto per incorporarlo nel record. Le liste possono essere documenti che si vorrebbe prendere in prestito o la lista dei libri commentati e valutati.</p>
<p>L&#8217;OPAC contiene un semplice meccanismo per identificare l&#8217;affidabilità della collaborazione tra gli utenti. Si può scegliere il proprio network indicando di quali altri utenti si vuol seguire (<em>follow</em>) o ignorare (<em>ignore</em>) l&#8217;attività: i bibliotecari hanno una icona specifica che li distingue da altri utenti. Oltre a selezionare un utente da seguire si specifica il soggetto su cui si ritiene abbia competenza (<em>humor, cooking, historical finction</em>&#8230;) tremite i tag. Per scegliere le persone da seguire si utilizzano i commenti e le liste da loro create o si parte dai libri preferiti per identificare chi ha espresso analogo parere. I documenti valutati dalla cerchia di persone affidabili con 4 o 5 stelle sono proposti come &#8220;raccomandati&#8221;.</p>
<p>La personalizzazione è molto spinta anche in negativo: gli utenti iscritti possono escludere dalla loro vista l&#8217;attività di altri utenti e inserire note negative a commenti o liste o addirittura escluderle dalla vista pubblica. Commenti e liste giudicate inappropriate da almeno 3 utenti vengono nascoste ma possono essere corrette e riproposte pubblicamente.</p>
<p>Particolarmente interessante è l&#8217;interfaccia per assegnare tag ai libri (<em>CaTAGorize this</em>). All&#8217;utente vengono infatti proposte 4 tipologie di tag volte a disambiguarne la funzione: <em>genre</em>, esempi forniti: tragedy, chicklit, science fiction; <em>tone</em>, esempi forniti: dark, moody, hilarious; <em>theme</em>, esempi forniti: gardening, european travel, parenting; e infine <em>personal</em>, esempi: from mom, book club.</p>
<p>4 novembre 2009</p>
<p>Lorcan Dempsey, vice Presidente di  OCLC, ha parlato  nel suo <a href="http://orweblog.oclc.org/">webblog</a>, lo stesso giorno di questo post (1/11/09), del catalogo della Oakville Public Library, sotto il titolo di Community Bibliography. Con il solito acume Dempsey sottolinea, tra le altro cose, che il sito è costruito non attorno al record bibliografico bensì attorno all&#8217;attività degli utenti che è ilsuo  vero contenuto e fa dell&#8217;OPAC, appunto, una Community bibliography.</p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/4lib.wordpress.com/70/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/4lib.wordpress.com/70/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/4lib.wordpress.com/70/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/4lib.wordpress.com/70/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/4lib.wordpress.com/70/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/4lib.wordpress.com/70/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/4lib.wordpress.com/70/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/4lib.wordpress.com/70/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/4lib.wordpress.com/70/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/4lib.wordpress.com/70/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/4lib.wordpress.com/70/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/4lib.wordpress.com/70/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/4lib.wordpress.com/70/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/4lib.wordpress.com/70/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=4lib.wordpress.com&amp;blog=9687637&amp;post=70&amp;subd=4lib&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://4lib.wordpress.com/2009/11/01/opac-2-0-oakville-public-library/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/5652d4981287bd7a7fb4d51bf836e789?s=96&#38;d=identicon&#38;r=G" medium="image">
			<media:title type="html">Nicola</media:title>
		</media:content>
	</item>
	</channel>
</rss>
