Asa cum va anuntam intr`un post recent, de azi si pana pe 21 o sa fiu la Scoala de vara EUROLAN Junior, scoala ce doreste a ne initia in bazele teoretice si aplicative ale Natural Language Processing & Computational Linguistics.

Programul va fi de la 9 dimineata pana la 8 seara, cursuri si laboratoare, totul e destul de dragut in afara de caldura mare. Am inteles ca o sa fie si un cocktail intr`o seara, o zi o sa mergem in aer liber pe undeva, iar in ultima zi vom primi si o vizita surpriza. Sa vedem ce o sa iasa.

Azi a fost cam asa:

- ca introducere, dimineata, am avut parte de vizita unor persoane cu nume in domeniu, si am ascultat niste povesti destul de interesante
- first, Erhard Hinrichs ne`a vorbit despre ” interese “, aplicate in NLP, apoi o discutie ampla despre google, cum este el imbunatatit in fiecare zi, ne`a spus cum sta treaba cu interogarile google, si cam atat, foarte funny prezentare
- apoi a urmat Tamas Varadi ne vorbeste despre limbaj, calculatoare, si ne spune raspunsul la intrebarea:

Unde gasim noi limba romana? Limba maghiara?

- raspunsul a fost: IN OUR HEAD. Fiind romani, putem face diferenta intre limba romana si cea maghiara. Valabil si pentru cei din Ungaria. La fel face diferenta si calculatorul, explicandu`ne cum sta treaba si cu Google Translate.
- cea de`a 3`a persoana care a luat cuvantul a fost Bente Maegaard, de la Universitatea din Copenhaga, care ne`a vorbit despre sistemul Google Translate cu exemple ( Henrich a intervenit si a spus ca cel mai interesant cuvant din Romania e ” a inchide “, facand referire la expresia ” close the TV “, care ar suna foarte aiurea in engleza ). Pentru o traducere, avem mereu nevoie de un dictionar, o gramatica si o traducere aplicata in fiecare caz dupa context.
- intra in scena Martyn Wynne, de la Oxford, care sincer a avut cea mai anosta prezentare din cele de azi. Asta in comparatie cu stilul de prezentare al celorlalte persoane. O alta problema care a influentat prezentarea sa a fost engleza tipica pe care o vorbea, iar eu sincer nu am fost in stare sa inteleg chiar tot. No offense…
- ne vorbeste despre ” speech situations ” si despre British National Corpus, ce contine peste 100 milioane de cuvinte, mai face referire la XML`uri si la transformarile textelor electronice.
- In final, Peter Wittenburg din Olanda incearca sa ne arate cat de interesant este sa lucrezi cu limbajul natural
- in incheiere ne vorbeste despre experimentele care se fac pe copiii mici, in incercarea de ai vedea cum evolueaza cu limbajul natural, sau ceva de genul, eram obosit deja…

Dupa aceste prezentari am mai facut 2 sesiuni de tutoriale si o sesiune practica. O sesiune de tutoriale si cea de practica au fost bazate pe adnotari XML, DTD, XML Schema si tagsets, Parsere XML - SAX, sesiuni tinute de Ionut Pistol, care de altfel este si profesorul meu indrumator pentru licenta pe care o voi sustine peste un an.

In final, spre seara, Dl. profesor Dan Cristea ne`a facut o introducere in procesarea limbajului natural. Am vorbit putin despre cercetare, cat de importanta este aceasta. Apoi, ni s`a dezvaluit faptul ca aceasta scoala este una de test pentru a vedea cati dintre noi vor fi prinsi in mrejele NLP`ului. Am inteles si de ce avem nevoie de NLP - marea majoritate a textelor de pe web sunt de natura textuala, iar aceste informatii trebuie prelucrate automat, pentru ca volumul de informatii este imens, si de aici apare si nevoia de a avea ” tehnologia limbajului “. Cel mai bun exemplu este chiar gigantul google, care prelucreaza o imensitate te texte…

A fost o zi ok, ne`am intrat in ritm, am avut si pauze pentru socializare, locatia e foarte ok, participantii sunt si ei ” de gashca “, prevad prietenii noi. Pana pe 20 iunie, cand se va incheia EuroLan Junior, voi incerca sa va tin la curent atat cat pot.

Daca ai citit pana aici, esti pasionat de NLP? Ce parere ai despre NLP?