News

  • Web Semantico  - CMS Semantico
19.09.2011
news

Web Semantico – perché un CMS Semantico ?

I Content Management System si avvicinano alla Semantica

Il Web Semantico, sebbene con una certa lentezza sta iniziando a condizionare notevolmente i meccanismi di ricerca delle informazioni sul web, tanto che tutti i principali CMS si stanno adoperando per introdurre elementi semantici.

In generale si parla di Web semantico per indicare quelle tecnologie in grado di trasformare informazioni non strutturate, ad esempio i contenuti di un sito web, in un insieme (database) di informazioni strutturate che può essere interpretato ed elaborato automaticamente sulla base delle proprietà semantiche dei dati.

In altre parole, l'intelligenza semantica è in grado di lavorare con i "concetti": ciò è reso possibile dalla combinazione di analisi semantica e codici di markup, che riescono a tradurre in linguaggio informatico i domini della conoscenza (ottenendo le ontologie, uno schema concettuale esaustivo e rigoroso che rappresenta tutte le entità di contenuto rilevanti all'interno di un determinato dominio e le relazioni esistenti fra di esse).

Web 3.0

L'intelligenza semantica è il paradigma alla base del Web 3.0, oggi in piena evoluzione. In questa estensione, il World WideWeb si trasforma in un ambiente dove i documenti pubblicati (pagine HTML, file, immagini e così via) diventano interpretabili, cioè vengono associati a informazioni e metadati che ne specificano il contesto semantico in un formato adatto all'interrogazione, all'interpretazione e, più in generale, all'elaborazione automatica.

Per fare ciò Il web semantico si basa sul paradigma che qualunque tipo di fonte, e in particolare le fonti informative non strutturate, siano codificate tutte con gli stessi criteri. I documenti dovranno quindi condividere la lingua in cui sono scritti, secondo ad es. il Web Ontology Language (OWL), un linguaggio di markup che rappresenta esplicitamente significato e semantica dei termini con vocabolari e relazioni tra i termini, e l'RDF (Resource Description Framework), lo strumento base proposto dal W3C per la codifica, lo scambio e il riutilizzo di metadati strutturati e che consente l'interoperabilità tra applicazioni che si scambiano informazioni sul Web.)

Con l'interpretazione del contenuto dei documenti che il Web Semantico propugna, saranno possibili ricerche molto più evolute delle attuali ed altre operazioni specialistiche come la costruzione di reti di relazioni e connessioni tra documenti secondo logiche più elaborate del semplice link ipertestuale.

La tecnologia semantica dà rilevanza al significato reale dei termini e considera il contesto in cui sono inseriti, consentendo una ricerca più precisa, evitando un overload di risultati di ricerca inutili.

Dal web dei documenti al Web dei contenuti

Il Web semantico è una naturale evoluzione del web che in poco tempo è passato da Web dei documenti , dei dati fino ad arrivare a quello dei contenuti, per poter meglio gestire ed utiilizzare i dati strutturati.

Il web dei documenti è un'espressione utilizzata per indicare i siti tradizionali basati su una struttura incentrata sulle pagine web. Il testo aveva collegamenti ad altre pagine, come parte del contenuto. Il modello tradizionale inoltre era basato su una struttura ipertestuale ad albero, un sistema molto semplificato di presentare le informazioni che spesso portava a dei risultati di ricerca errati. Man mano che i siti web sono divenuti più complessi tale tipo di modello ha iniziato a presentare una serie di problemi, non essendo capace di gestire dei dati altamente strutturati, che originariamente erano stati strutturati per essere letti dalle persone. I sistemi di tagging e di classificazione sono stati utilizzati come espedienti per risolvere tale problema.

Inoltre, con la nascita di nuovi canali digitali per la pubblicazione di contenuti, per le aziende è divenuto fondamentale utilizzare gli stessi contenuti da riutilizzare sui diversi canali.

Il web dei dati nasce con l'intento di produrre siti web con una migliore struttura interna e si apre ad usi differenti da quelli basati sulle pagine web. Una navigazione basata sui contenuti dove le proprietà dei contenuti e come si relazionano ad altri contenuti, permette una navigazione più fluida e intuitiva. Un sito web non è più solo una raccolta di pagine di articoli. Il web semantico nasce per aiutare le macchine a comprendere il contenuto di una pagina web. Oggi, le macchine possono recuperare e visualizzare le pagine web richieste, ma il computer non ha modo di capire quello che le pagine web sono circa, ad eccezione di analisi del testo inesatto, come le attuali motori di ricerca stanno facendo. Le tecnologie del web semantico consentono ai computer di comprendere il significato del contenuto del sito web. Questo apre tutta una serie di miglioramenti:

  • Migliore ricerca e filtraggio di contenuti all'interno di un sito web
  • Navigazione basata sui contenuti
  • Migliroe esposizione dei dati per permettere una migliroe integrazione o distribuzione dei contenuti su altri canali (mobile, compresse, televisori ecc.)
  • Miglioramento dell'informazione nei risultati di ricerca su Google con Rich Snippets (siti web con tagging semantico).
  • Miglioramento nei risultati dei motori di ricerca, con l'indicazione del tipo di contenuto (persone, relazione, eventi, viaggi, ecc destinazioni) che si desidera cercare.
  • Ricerca dei contenuti correlati

Linguaggi di marcatura semantici

I dati semantici supplementari visualizzati dai motori di ricerca vengono presi dal codice speciale che è inserito nel file HTML di una pagina web.

I linguaggi di marcatura consentono ai motori di ricerca di identificare ed utilizzare i dati strutturati presenti in una pagina web. Attualmente Google sostiene tre linguaggi di marcatura per i dati strutturati:

  • I microformati - linguaggio di marcatura più utilizzato. Attualmente Google supporta recensioni,eventi, aziende e organizzazioni, profili persone, prodotti, video e ricette,
  • RDFa - linguaggio del W3C più complesso da padroneggiare in confronto ai microformati.
  • Microdata - nuovo linguaggio di marcatura semantico nato sulle specifiche dell HTML5, che utilizza un vocabolario di supporto per descrivere un elemento e coppie nome-valore per assegnare valori alle sue proprietà. Il Microdata è un tentativo di fornire un modo semplice di annotare elementi HTML con i tag leggibili rispetto ai microformati e RDFa.

Perché la semantica è ancora poco utilizzata?

Il costo e lo sforzo necessario per creare soluzioni per il web semantico è ancora molto alto. Ciò è dovuto principalmente ad una mancanza di supporto per le tecnologie semantiche nei Content MAnagement System. Oggi, la stragrande maggioranza dei siti web sono alimentati da un CMS che non possono supportare modelli di dati semantici (molti sono ancora nella fase Web di Documenti). Essi non sono in grado di supportare il web pienamente semantico.

Perché un CMS Semantico ?

Un CMS Semantico è in grado di mantenere il significato del contenuto, creando un modello di contenuto che si sposa perfettamente con il contenuto del tuo dominio aziendale. Descrivendo i diversi tipi di contenuto e le relazioni tra loro, si sta creando un modello di contenuto, o ontologia come viene anche chiamato, che si adatta alle vostre esigenze.

In un CMS semantico , il contenuto è memorizzato in un modo che non solo tiene traccia del senso del contenuto, ma è anche in grado di dedurre un significato da metadati che è generato automaticamente nel sistema, dando una netta separazione tra contenuto, presentazione e il significato del contenuto.

Definendo il contenuto, e le relazioni tra i diversi tipi di contenuti, gli utenti non solo possono ottenere un sito web su misura per le loro esigenze, ma possono anche strutturare i loro dati in base alle loro condizioni del dominio.

La Semantica permetterà ai motori di ricerca di comprendere le informazioni sulle pagine web, e loro fornire risultati di ricerca migliori. L'evoluzione del web semantico sarà anche rendere più facile agli utenti trovare informazioni utili sul web.

Ontologia, contenuto semantico e gestione dei contenuti
Ebbene, gran parte delle aziende opera in un mercato specifico con i termini specifici del dominio, dati e relazioni. La costruzione di una definizione del contenuto di un sito web che corrisponde al dominio che la conoscenza rende permette ai dipendenti delle società di mettere in relazione il contenuto sul sito con il dominio della conoscenza. Un'ontologia descrive i dati, dando senso ai dati, rendendoli semanticamente rilevanti.

I dati possono essere facilmente condivisi utilizzando un formato adatto, per esempio OData, Topic Maps, RDF, OWL o Atom.

Uno dei principali incentivi all'utilizzo delle tecnologie semantiche arriva ovviamente dai motori di ricerca e in particolare da Google, che al momento gestisce circa l'85% delle ricerche mondiali.

In generale tutti i motori di ricerca si stanno adoperando per creare un modello unico per concretizzare un web descrittivo, semantico, vicino alle esigenze degli utenti, tanto è vero che Google Yahoo e Bing sono arrivati a standardizzare le informazioni che ogni singola pagina web può contenere per permettere all'utente dei risultati collegati a una query suddivisi secondo uno schema logico.

Google è stata una delle prime aziende ad adottare tecnologie semantiche su vasta scala, introducendo nel 2009 le "Rich Snippets". Rich Snippets è un termine di marketing per il loro supporto per il tagging semantico. Quando Google indicizza il tuo sito, ricerca il tagging semantico che aiuta comprendere il significato del contenuto di una pagina web.

SEO e Semantica

L'utilizzo della Semantica nel prossimo futuro potrebbe essere di grande ausilio anche per la SEO.

I motori di ricerca possono trarre già adesso grandi vantaggi da un accesso diretto ai dati strutturati tramite l'utilizzo delle tecnologie semantiche.
Mentre è difficile dire se Google utilizza i tag semantici nella loro algoritmo di ranking, ci sono state numerose aziende che hanno ottenuto maggiore traffico organico da Google dopo l'aggiunta di tag semantici al sito (fino al 30% dell'aumento di traffico).

CERCA LE NEWS IN ARCHIVIO
scegli una data
Categorie: