Login
atlantis_login
sitebuilder_login

Prva (znamenita :)) RacJez ekipa s MathOSa

... u društvu njihovih nastavnika na zadnjem satu vježbi (od ukupno 30+30 sati) iz Računalnoga jezikoslovlja.
Sretno dalje!

Mario Essert, 24.01.2018. 14:37

Zadnje ankete

Zahvaljujem se i srdačno pozdravljam (iz vlaka za ZG :))!
Vidimo se na ispitima. Sretno!!
   M. Essert

Mario Essert, 23.01.2018. 18:08

Student Patrick Nikić: drugi seminar

... kao primjer kako se može izvrsno načiniti zadani posao (seminari su dodijeljeni slučajnim izborom poglavlja iz knjige o sintaksi rečenice).  Patrickova prezentacija na predavanjima o ovoj temi kroz "Jupyter okoliš" bila je također sjajna. Čestitamo!

Mario Essert, 22.01.2018. 15:05

Predavanje_15: LLOD - lingvistics linked open data

U ovom predavanju uče se temelji povezanih (LOD) podataka s posebnim naglaskom na ontologijama. Pokazuju se primjeri stvaranja jednostavnih (gramatičkih/sintaksnih) ontologija (s pomocu Protege alata), njihovo spremanje u Virtuoso bazu i dohvaćanje s  jednostavnim SparQL naredbama. Na koncu se pokazuje dio hrvatskoga rječnika CroLLOD koji je već našao svoje mjesto na mreži (global network cloud) među drugim jezicima svijeta.

Mario Essert, 20.01.2018. 11:17

Predavanje_14: Strojno učenje

U ovom predavanju uče se osnove strojnog učenja preko alata najčešće korištenih u obradbi teksta: TFIDF, LSA, LDA, K-means, co-occurrence matrix, frekvencijski graf, WordCloud, disperzija i sličnosti termina i sl. Ne ulazi se u same algoritme (to je tema kolegija "Strojnog učenja") nego se daje pregled metoda nad vektoriziracijom sadržaja (CountVectorizer, DictVectorizer, TfIdfVecotrizer) tekstova/coprusa.

Mario Essert, 20.01.2018. 09:32

Predavanje_13: Rudarenje teksta

Elementi svakog medija (tekst, audio, video) mogu se preslikati u brojeve. Tako nastaju rudnici numeričkih podataka, koje onda treba "kopati" da bi se došlo do informacije. U ovom predavanju rudari silaze u okno rudnika s tri jaka alata: PANDAS, TEXTBLOB i SCIKIT-LEARN. Do prve razine, a idući (zadnji) put - još dublje!

Mario Essert, 07.01.2018. 08:21

Predavanje_12: Propozicijska i FO logika, L-račun

Implementacija formalne logike u semantiku nije laka! Nakon što ste upoznali novi pristup (M-brojeve), evo i klasičnoga: propozicijska logika, pa logika prvog reda (FOL), pa lambda-račun (u Pythonu umjesto u Haskellu). Tako gramatika dobiva još jedno formalizirano obilježje: semantiku.

Mario Essert, 01.01.2018. 12:07

Predavanje_11: Logika i jezikoslovlje

Semantika je utemeljena na logici. Ali kako formalizirati logiku u rečenici? Postoje pokušaji, više ili manje dobri, većinom umjetni. Postoji li neko prirodno rješenje? Predavanje nudi mogući odgovor preko M-brojeva prof. dr.sc. Miroslava Šare.

Mario Essert, 09.12.2017. 12:40

Rezultati pete ankete

... su u privitku. Do konca semestra ostale su nam još dvije ankete /upitnika/ i to u novoj godini.
U jednoj će se analizirati obradjene 4 preostale teme, a u zadnjoj sveukupan dojam o kolegiju. Hvala svima na pomoći!

Mario Essert, 05.12.2017. 13:48

Predavanje_10: SSF mrežni okvir

- integracija jezikoslovnih područja u deterministički računalni model jezika. Od apstraktnog, matematičkog modela do njegovog računalnog artefacta...

Mario Essert, 03.12.2017. 14:35

Predavanje_09: Statistika

- kad riječ postane broj u promatranom corpusu, onda na scenu stupa statistika. Budući da se radi o stohastičkim procesima, na predavanju ćemo upoznati uvjetovane i neuvjetovane vjerojatnosti, Markovljeve lance i Monte Carlo metodu, te brojne alate razvijene za obradbu (Numpy/Scipy, Scikit-learn, Pandas, Tensorflow, R).

Mario Essert, 29.11.2017. 11:08

Rezultati četvrte ankete

... je tu, na samoj granici quoruma, a mi u drugoj polovici semestra, jupiii!! :)

Mario Essert, 21.11.2017. 20:15

Predavanje_08: Semantika

 - kad izgleda da gramatički uzorci mogu sve riješiti, pojavi se nepremostivo značenje u odnosima riječi - s milijunima kombinacija i jezikoslovlje postane teško. Jako teško! Osim za matematičare koji dobro znaju računala :).

Mario Essert, 18.11.2017. 18:23

Predavanje_07: Corpus

- izvor riječi, uzoraka, gramatike, semantike ...

Mario Essert, 15.11.2017. 11:05

Rezultati treće ankete

... su u privitku. Hvala!

Mario Essert, 07.11.2017. 09:03

Predavanje_06: Gramatika

- skup strukturnih pravila, koja, s riječima u rječniku, daju (deriviraju) izjave i rečenice. Jednoznačne? Smislene?

Prema: https://www.inf.ed.ac.uk/teaching/courses/anlp/labs/lab5.html

Mario Essert, 02.11.2017. 23:30

Predavanje_05: Skladnja

- sveze i utjecaji riječi u rečenici.

Mario Essert, 01.11.2017. 12:57

Rezultati druge ankete

... su u privitku.

PS. Jedan upitnik je bio nepotpun, pa nije uzet u obzir (iako su odgovori bili super pohvalni. Hvala!)
PS2. S obzirom na prvi komentar, drugo predavanje od idućeg dolaska (03 - nadalje) može početi u 13.30, ako se svi slažu, što ćete potvrditi na jutarnjem predavanju. Vidite da ankete djeluju :))!

Mario Essert, 24.10.2017. 13:22

Predavanje_04: Sintagma

- skupina riječi u sintaktičkom odnosu, ali i niz (morfološki) generiranih riječi.

Mario Essert, 12.10.2017. 20:18

Predavanje_03: Oblikoslovlje

- nauk o promjeni riječi kojom se postižu konceptualne tematske uloge i sintaktička sročnost (eng. agreement).

Mario Essert, 12.10.2017. 10:09

Rezultati prve ankete

Uzorak je premali za pravu statistiku, ali mi smo zadovoljni i s malim :). Hvala!

Mario Essert, 10.10.2017. 21:19

Prvo predavanje

Početak izvođenja ovog kolegija bit će na MathOS-u u ponedjeljak, 9. listopada 2017, od 8.30 sati u predavaonici P23 (prizemlje).
DOBRO DOŠLI!

Mario Essert, 18.09.2017. 18:09