Internet
può essere vista come una rete di librerie
geograficamente distribuite e multimediali,
interconnesse tra di loro: per poter utilizzare in modo
efficace l'informazione in essa contenuta, occorre una riflessione sui
documenti, che sono il veicolo primo di accesso e
trasmissione dell’informazione e sul loro ruolo nella
disponibilità di conoscenza. Essi forniranno tanta più
conoscenza quanto meglio saranno organizzati.
I
motori di ricerca mondiali iniziano a manifestare
inefficienze legate alle tecniche di indicizzazione e ai
loro limiti intriseci, per cui nasce l’esigenza di
modificare alla radice il modo con cui si organizzano
i documenti.
L’obiettivo
della tesi è legato alla realizzazione di
un’applicazione che permette di aggiungere
informazione semantica ai documenti testuali. Tale
informazione è realizzata aggiungendo dei marcatori
che descrivono il significato di un determinato
paragrafo, porzione di testo o parola. I documenti
etichettati in questo modo acquisiscono ulteriore
conoscenza semantica e strutturale, pur mantenendo
inalterato il loro contenuto.
“Il
principio è semplice: più informazione viene aggiunta
ad un documento e un miglior uso di esso ne può
derivare”.
La
marcatura è realizzata con l’utilizzo del linguaggio
XML (Extensible Markup Language) che permette la
definizione di tag da parte dell’utente, che non è
così confinato ad uno schema predefinito.
Procedendo
sistematicamente nell’analisi e generazione di
documenti secondo questa metodologia di marcatura, si
rendono più efficienti le ricerche in due modi
distinti:
·
Il primo è relativo al punto di vista
dell’utente che limita la ricerca ad un certo numero
di pagine con caratteristiche specifiche.
·
Il secondo è inerente all’apertura di
grandi basi di dati attualmente chiuse
ai robot di ricerca che indicizzano il Web, con la
possibilità di ricerche specifiche nei linguaggi
di markup specializzati, nati dal metalinguaggio XML.
Le
possibilità di accrescimento della conoscenza intesa
come patrimonio comune, insite nell’uso di questa
metodologia, sono non indifferenti, perché sia grazie
all’azione individuale di inserimento di ulteriore
conoscenza nei documenti, che alla collaborazione
globale delle persone che ne deriva mettendo a
disposizione di altri i propri documenti XML così
arricchiti, è possibile poter usufruire meglio di quel
patrimonio comune all’umanità intera che è il
sapere, da sempre trasmesso principalmente
attraverso documenti.
Lo
strumento realizzato in questa tesi, XMLStudio è
un’applicazione, scritta in linguaggio Java, che
permette di manipolare documenti testuali aggiungendo,
rimuovendo tag, fornendo schemi (DTD) che potranno
essere utilizzati per confrontare l’etichettatura dei
documenti. Il tutto fornendo all’utente la possibilità
di navigare anche in modo strutturale nel documento.
Il
linguaggio Java è stato scelto per il suo ottimo
connubio con XML e per la sua portabilità che consente
al programma di essere eseguito su diversi sistemi
operativi: Java è un linguaggio indipendente dalla
piattaforma, XML è un modo di rappresentare i dati in
modo indipendente dalla piattaforma per cui Java ed XML
sono complementari per loro natura, specialmente in
applicazioni legate ad internet.
Molti
editor XML sono presenti sul mercato (alcuni di essi
sono gratuiti mentre altri a pagamento) ma l’approccio
di trasformazione di documenti secondo la metodologia di
XMLStudio è seguita solo da un altro editor italiano
relativo ad un progetto di nome Xdidattica, che verrà
analizzato nella tesi.
L’utente
che desiderasse imparare ad usare XMLStudio è aiutato
nell’apprendimento dello stesso da un help, in formato
JavaHelp, sensibile al contesto. Alcuni esempi, inclusi
nella directory esempi di XMLStudio e riportati
nell'Appendice B della tesi, permettono di
rendersi conto di quale sia l’uso concreto del
programma.
-
Il
primo capitolo è un’introduzione ad
aspetti dell’XML utilizzati durante la
progettazione dell’applicazione XMLStudio; vengono
anche esposti dei concetti di base utili per il suo
utilizzo.
-
Il
secondo capitolo illustra l’uso dei
linguaggi Java e XML, che si integrano costituendo un
ottimo connubio per la realizzazione di
applicazioni.
-
Il
terzo capitolo mostra nel dettaglio
l’editor integrato XMLStudio, specificando
l’idea alla base della sua realizzazione ed alcuni
elementi utili a comprenderne l’implementazione.
-
Il
quarto capitolo prende in esame altri editor
XML e li confronta con XMLStudio per far emergere la
differenza di approccio di base che essi hanno.
-
Il
quinto capitolo elenca alcuni possibili
sviluppi futuri del programma XMLStudio e riporta le
conclusioni del lavoro di questa tesi.
-
Bibliografia
essenziale.
|