» best viewed @ 1024x768  

   
Scarica Tesi
 Formato .doc
Formato .pdf
Formato .ps

Documentazione
 Formato .doc
Formato .pdf
Formato .ps
On-line

Presentazione
 Formato .ppt
On-line

Java 2SE
Java 2SE
Java 1.4.x
JavaHelp

XMLStudio 1.0
File .class
File .java
File JAR
Schermata

Licenza GPL
Formato .pdf
Formato .txt
On-line

 

 
1.0  
 

Introduzione all'applicazione XMLStudio

Internet può essere vista come una rete di librerie geograficamente distribuite e multimediali, interconnesse tra di loro: per poter utilizzare in modo efficace l'informazione in essa contenuta, occorre una riflessione sui documenti, che sono il veicolo primo di accesso e trasmissione dell’informazione e sul loro ruolo nella disponibilità di conoscenza. Essi forniranno tanta più conoscenza quanto meglio saranno organizzati.

I motori di ricerca mondiali iniziano a manifestare inefficienze legate alle tecniche di indicizzazione e ai loro limiti intriseci, per cui nasce l’esigenza di modificare alla radice il modo con cui si organizzano i documenti.

L’obiettivo della tesi è legato alla realizzazione di un’applicazione che permette di aggiungere informazione semantica ai documenti testuali. Tale informazione è realizzata aggiungendo dei marcatori[1] che descrivono il significato di un determinato paragrafo, porzione di testo o parola. I documenti etichettati in questo modo acquisiscono ulteriore conoscenza semantica e strutturale, pur mantenendo inalterato il loro contenuto.

“Il principio è semplice: più informazione viene aggiunta ad un documento e un miglior uso di esso ne può derivare”[2].

La marcatura è realizzata con l’utilizzo del linguaggio XML (Extensible Markup Language) che permette la definizione di tag da parte dell’utente, che non è così confinato ad uno schema predefinito.

Procedendo sistematicamente nell’analisi e generazione di documenti secondo questa metodologia di marcatura, si rendono più efficienti le ricerche in due modi[3] distinti:

·        Il primo è relativo al punto di vista dell’utente che limita la ricerca ad un certo numero di pagine con caratteristiche specifiche.

·        Il secondo è inerente all’apertura di grandi basi di dati attualmente chiuse[4] ai robot di ricerca che indicizzano il Web, con la possibilità di ricerche specifiche nei linguaggi[5] di markup specializzati, nati dal metalinguaggio XML.

Le possibilità di accrescimento della conoscenza intesa come patrimonio comune, insite nell’uso di questa metodologia, sono non indifferenti, perché sia grazie all’azione individuale di inserimento di ulteriore conoscenza nei documenti, che alla collaborazione globale delle persone che ne deriva mettendo a disposizione di altri i propri documenti XML così arricchiti, è possibile poter usufruire meglio di quel patrimonio comune all’umanità intera che è il sapere, da sempre trasmesso principalmente attraverso documenti.

Lo strumento realizzato in questa tesi, XMLStudio è un’applicazione, scritta in linguaggio Java, che permette di manipolare documenti testuali aggiungendo, rimuovendo tag, fornendo schemi (DTD) che potranno essere utilizzati per confrontare l’etichettatura dei documenti. Il tutto fornendo all’utente la possibilità di navigare anche in modo strutturale nel documento.

Il linguaggio Java è stato scelto per il suo ottimo connubio con XML e per la sua portabilità che consente al programma di essere eseguito su diversi sistemi operativi: Java è un linguaggio indipendente dalla piattaforma, XML è un modo di rappresentare i dati in modo indipendente dalla piattaforma per cui Java ed XML sono complementari per loro natura, specialmente in applicazioni legate ad internet.

Molti editor XML sono presenti sul mercato (alcuni di essi sono gratuiti mentre altri a pagamento) ma l’approccio di trasformazione di documenti secondo la metodologia di XMLStudio è seguita solo da un altro editor italiano relativo ad un progetto di nome Xdidattica, che verrà analizzato nella tesi.

L’utente che desiderasse imparare ad usare XMLStudio è aiutato nell’apprendimento dello stesso da un help, in formato JavaHelp, sensibile al contesto. Alcuni esempi, inclusi nella directory esempi di XMLStudio e riportati nell'Appendice B della tesi, permettono di rendersi conto di quale sia l’uso concreto del programma.

 

Organizzazione della tesi:

  •  Il primo capitolo è un’introduzione ad aspetti dell’XML utilizzati durante la progettazione dell’applicazione XMLStudio; vengono anche esposti dei concetti di base utili per il suo utilizzo.

  •  Il secondo capitolo illustra l’uso dei linguaggi Java e XML, che si integrano costituendo un ottimo connubio per la realizzazione di applicazioni.

  •  Il terzo capitolo mostra nel dettaglio l’editor integrato XMLStudio, specificando l’idea alla base della sua realizzazione ed alcuni elementi utili a comprenderne l’implementazione.

  •  Il quarto capitolo prende in esame altri editor XML e li confronta con XMLStudio per far emergere la differenza di approccio di base che essi hanno.

  • Il quinto capitolo elenca alcuni possibili sviluppi futuri del programma XMLStudio e riporta le conclusioni del lavoro di questa tesi.

  • Bibliografia essenziale.

 


[1] Nella tesi i vocaboli marcatore, tag, etichetta hanno lo stesso significato e si riferiscono a sequenze di caratteri delimitate dai segni < e > come ad esempio <nome> … </nome>.

[2] Jon Bosak – Sun Microsystem (frase estratta da un articolo pubblicato su Nature).

[3] W.Wayt Gibbs  – The Web Learns to Read (Scientific American - 1998).

[4] Ad esempio la FIAT (o qualsiasi altra casa automobilistica) potrebbe permettere l’indicizzazione da parte dei motori di ricerca di un suo catalogo di componenti e pezzi di ricambio per le automobili.

[5] Tra i linguaggi derivati dal metalinguaggio XML vi sono il Chemical Markup Language (CML) che mostra graficamente la struttura molecolare dei componenti descritti in pagine Web CML; il Math Markup Language (MathML) che rende immediata la visualizzazione di espressioni matematiche complesse nel browser: prima della creazione di questo linguaggio l’unico modo per visualizzare formule matematiche nel browser era salvarle come immagini mentre oggi vi è la possibilità di visualizzare equazioni con poche righe di testo; MusicML un linguaggio musicale costituito da un insieme di etichette per note, tempi e altri elementi, memorizzato come testo ma che nel browser viene visualizzato come pentagramma.

........................

» XMLStudio è un programma liberamente scaricabile ed utilizzabile da chiunque secondo licenza GPL.

 
  XMLStudio  

[ XMLStudio home | introduzione | bibliografia web ]