Descriere
Evolutia internetului ca mijloc de transmitere a informatiilor a dus atat la cresterea volumului resurselor de cunostinte disponibile on-line cat si la diversificarea formelor si formatelor de stocare si transmitere a acestora: text, date, video, audio. Desi restrictiile hardware in ceea ce priveste spatiul de stocare si viteza de transmitere a datelor nu mai reprezinta o problema, textul ramane cea mai eficienta forma de prezentare a cunostintelor pe internet in comparatie cu diversele formate audio, video sau multimedia.
Webul a fost proiectat ca un spatiu informational cu scopul de a depasi barierele mijloacelor clasice de comunicatie si de a permite masinilor sa ajute utilizatorii sa comunice unii cu altii. Cel mai important obstacol in realizarea acestui deziderat este reprezentat de faptul ca informatiile si cunostintele existente pe internet sunt destinate exclusiv consumului uman. Acest obstacol poate fi depasit prin utilizarea unor metode si tehnici de reprezentare a cunostintelor existente in documentele text astfel incat acestea sa poata fi automat achizitionate si procesate de catre masini.
Capitolul „Text mining – caracteristici si domenii de aplicabilitate” prezinta evolutia internetului ca mijloc de transmitere a informatiilor, evidentiind eterogenitatea si diversitatea documentelor text existente pe web. Este prezentat stadiul cunoasterii in text mining, punandu-se accentul pe pe caracterul multidisciplinar, abordarile existente si domeniile de aplicabilitate ale acestui domeniu si descrise mai multe tipuri de arhitecturi functionale ale sistemelor de text mining.
Capitolul „Reprezentarea documentelor” analizeaza documentul ca element de baza al achizitiei cunostintelor prin text mining. Sunt prezentate mai multe tehnici de reprezentare descriptiva a documentelor, cu accent pe utilizarea tabelelor ca modalitate de organizare a informatiilor. Se definesc caracteristicile documentelor si se analizeaza tehnici de reprezentare a documentelor in spatiul vectorial.
Capitolul „Clasificarea automata a documentelor” abordeaza problematica achizitiei cunostintelor prin utilizarea algoritmilor de clasificare. Sunt identificati si analizati principalii algoritmi utilizati in clasificarea textelor. Se definesc masurile de evaluare a eficientei clasificatorilor de texte si sunt comparate performantele algoritmilor de clasificare.
Capitolul „Webul Semantic – Caracteristici si limbaje” abordeaza problematica reprezentarii cunostintelor in contextul Webului Semantic. Sunt comparate modelele de distribuire a informatiilor pe internet si se utilizeaza cadrul de descriere a resurselor pentru a reprezenta datele preluate din documentele web ale ASE. Sunt descrise modele de proces pentru servicii oferite in cadrul ASE si prezentate modalitatile de dezvoltare a ontologiilor prin text mining.
In capitolul „Reprezentarea documentelor web – sistemul OntoDev” este elaborat un algoritm de reprezentare a documentelor web cu pastrarea informatiilor legate de structura tabelara a acestora. Se analizeaza modul in care conceptele existente in cadrul ontologiilor sunt reprezentate in resursele web. Sunt prezentate tehnici de analiza a logurilor web prin care se identifica modele de comportament ale utilizatorilor de internet.
Recenzii
Nu există recenzii până acum.