Govorne in slikovne tehnologije

Visokošolski učitelji: Štruc Vitomir
Število kreditnih točk: 6
Semester izvajanja: poletni, poletni
Koda predmeta: 64154M



Opis predmeta

Pogoji za vključitev v delo oz. za opravljanje študijskih obveznosti:

  • vpis v 2. ali 3. letnik

Vsebina:

  • Uvod: opis področja, kratek zgodovinski opis razvoja govornih in slikovnih tehnologij, značilnosti sistemov za razpoznavanje vzorcev in predstavitev govornih in slikovnih tehnologij v luči razpoznavanja vzorcev.
  • Osnovne značilnosti slušnega zaznavanja ter govorna komunikacija pri ljudeh. Predstavitve govora in kodiranje informacije z govorom.
  • Obdelava govora: zajem in predobdelava, značilke govornega signala, razčlenjevanje govornega signala, govorne podatkovne zbirke.
  • Razpoznavanje govora: vrste sistemov za razpoznavanje, statistično modeliranje akustične in jezikovne predstavitve govora ter njegova pomenska analiza.
  • Umetni govor: zgradba sistemov za tvorjenje umetnega govora, grafemsko-fonemska pretvorba, modeliranje prozodije, načini tvorjenja umetnega govornega signala.
  • Dialog: zgradba sistemov za vodenje dialoga, načini vodenja dialoga, vrednotenje delovanja.
  • Slikovne tehnologije: osnovni pojmi, primeri uporabe, osnovne transformacije slikovnih podatkov, barvni prostori in kodiranje slik.
  • Obdelava slikovnih podatkov: obdelava slik v slikovnem in frekvenčnem prostoru, modeli šuma in obnavljanje, morfološke operacije in algoritmi, iskanje robov.
  • Napredni algoritmi: krajevni deskriptroji in njihovo uporaba, detekcija objektov v sliki, razpoznavanje objektov, pod-prostori za predstavitev podatkov.
  • Segmentacija slik: vrste rojenja in njihova uporaba pri segmentaciji, mean-shift.

Cilji in kompetence:

Poznavanje in razumevanje področja govornih in slikovnih tehnologij, poznavanje samodejnih postopkov za izvajanje različnih nalog s tega področja.

Predvideni študijski rezultati:

Po uspešno opravljenem predmetu bodo študenti zmožni:

  • opredeliti osnove načine za opis, predstavitev, tvorjenje ter razpoznavanje govornih in slikovnih signalov,
  • opisati osnovne značilnosti, gradnike, načine delovanja in zmogljivosti sistemov govornih in slikovnih tehnologij,
  • uporabiti izbrane programske rešitve za razvoj govorne komunikacije med človekom in strojem ter aplikacij za obdelavo in razpoznavanje slik,
  • razlikovati med različnimi nalogami govornih in slikovnih tehnologij ter metodami predstavitve in obdelave, ki se pri tem uporabljajo,
  • združiti osnovne postopke predstavitve in obdelave govornih in slikovnih signalov v kompleksnejše sisteme za razpoznavanje in sintezo govora in slik,
  • ovrednotiti točnost in zanesljivost delovanja sistemov govornih in slikovnih tehnologij.

Metode poučevanja in učenja:

Snov se pri predmetu podaja v obliki predavanj. Teoretično znanje študenti nato uporabijo v okviru več praktičnih vaj, ki se izvajajo v sodobno opremljeni laboratorijski učilnici.





Gradiva

  1. Mihelič F., Žibert J., Hajdinjak M., Štruc V., Skripta za predmet Govorne in slikovne tehnologije, 1. Izdaja, Ljubljana, Fakulteta za elektrotehniko, 2012
  2. Mihelič F., Signali, Založba FE in FRI, Ljubljana, 2006
  3. Pavešić N., Razpoznavanje vzorcev: uvod v analizo in razumevanje vidnih in slušnih vzorcev, 3. Popravljena in dopolnjena izdaja, Založba FE in FRI, Ljubljana, 2012
  4. Rabiner L., Schafer R., Theory and Applications of Digital Speech Processing, Prentince Hall, 1. Ed., 2010
  5. Gonzales R. C., Woods, R.E., Digital Image Processing, 3 izdaja, Prentice Hall, 2007
  6. R.C. Gonzales, R.E. Woods, S.L. Eddins, Digital image processing using Matlab, 2 izdaja. Gatesmark Publishing, 2009



Študiji na katerih se predmet izvaja

  • 2 letnik - 1. stopnja - Multimedija
  • 3 letnik - 1. stopnja - Multimedija