Govorne in slikovne tehnologije

Opis predmeta

Uvod: opis področja, kratek zgodovinski opis razvoja govornih in slikovnih tehnologij, značilnosti sistemov za razpoznavanje vzorcev in predstavitev govornih in slikovnih tehnologij v luči razpoznavanja vzorcev.

Osnovne značilnosti slušnega zaznavanja ter govorna komunikacija pri ljudeh. Predstavitve govora in kodiranje informacije z govorom.

Obdelava govora: zajem in predobdelava, značilke govornega signala, razčlenjevanje govornega signala, govorne podatkovne zbirke.

Procesiranje govora

Razpoznavanje govora: vrste sistemov za razpoznavanje, statistično modeliranje akustične in jezikovne predstavitve govora ter njegova pomenska analiza.

Umetni govor: zgradba sistemov za tvorjenje umetnega govora, grafemsko-fonemska pretvorba, modeliranje prozodije, načini tvorjenja umetnega govornega signala.

Dialog: zgradba sistemov za vodenje dialoga, načini vodenja dialoga, vrednotenje delovanja.

Slikovne tehnologije: osnovni pojmi, primeri uporabe, osnovne transformacije slikovnih podatkov, barvni prostori in kodiranje slik.

Obdelava slikovnih podatkov: obdelava slik v slikovnem in frekvenčnem prostoru, modeli šuma in obnavljanje, morfološke operacije in algoritmi, iskanje robov.

Napredni algoritmi: krajevni deskriptroji in njihovo uporaba, detekcija objektov v sliki, razpoznavanje objektov, pod-prostori za predstavitev podatkov.

Segmentacija slik: vrste rojenja in njihova uporaba pri segmentaciji, mean-shift.

Predmet učimo na programih

Multimedija 1. stopnja

Cilji in kompetence

Seznanjanje s področjem govornih in slikovnih tehnologij, spoznavanje samodejnih postopkov za izvajanje različnih nalog s tega področja.

Metode poučevanja in učenja

Predavanja

Sodelovalno učenje

Laboratorijske vaje

Predvideni študijski rezultati

Po uspešno opravljenem predmetu naj bi bili študenti zmožni:

  • opredeliti osnove načine za opis, predstavitev, tvorjenje ter razpoznavanje govornih in slikovnih signalov,
  • opisati osnovne značilnosti, gradnike, načine delovanja in zmogljivosti sistemov govornih in slikovnih tehnologij,
  • uporabiti izbrane programske rešitve za razvoj govorne komunikacije med človekom in strojem ter aplikacij za obdelavo in razpoznavanje slik,
  • razlikovati med različnimi nalogami govornih in slikovnih tehnologij ter   metodami predstavitve in obdelave, ki se pri tem uporabljajo,
  • združiti osnovne postopke predstavitve in obdelave govornih in slikovnih signalov v kompleksnejše sisteme za razpoznavanje in sintezo govora in slik,

ovrednotiti točnost in zanesljivost delovanja sistemov govornih in slikovnih tehnologij.

Temeljni viri in literatura

  1. Mihelič F., Žibert J., Hajdinjak M., Štruc V., Skripta za predmet Govorne in slikovne tehnologije, Izdaja, Ljubljana, Fakulteta za elektrotehniko, 2012.
  2. Mihelič F., Signali, Založba FE in FRI, Ljubljana, 2006.
  3. Pavešić N., Razpoznavanje vzorcev: uvod v analizo in razumevanje vidnih in slušnih vzorcev, Popravljena in dopolnjena izdaja, Založba FE in FRI, Ljubljana, 2012.
  4. Rabiner L., Schafer R., Theory and Applications of Digital Speech Processing, Prentince Hall, 1. Ed., 2010.
  5. Gonzales R. C., Woods, R.E., Digital Image Processing, 3 izdaja, Prentice Hall, 2007.
  6. R.C. Gonzales, R.E. Woods, S.L. Eddins, Digital image processing using Matlab, 2 izdaja. Gatesmark Publishing, 2009.

Bodi na tekočem

Univerza v Ljubljani, Fakulteta za elektrotehniko, Tržaška cesta 25, 1000 Ljubljana

E:  dekanat@fe.uni-lj.si T:  01 4768 411