Govorne in slikovne tehnologije
Visokošolski učitelji: Dobrišek Simon
Visokošolski učitelji: , Štruc Vitomir
Število kreditnih točk: 6
Semester izvajanja: poletni, poletni
Koda predmeta: 64154M
Opis predmeta
Pogoji za vključitev v delo oz. za opravljanje študijskih obveznosti:
- vpis v 2. ali 3. letnik
Vsebina:
- Uvod: opis področja, kratek zgodovinski opis razvoja govornih in slikovnih tehnologij, značilnosti sistemov za razpoznavanje vzorcev in predstavitev govornih in slikovnih tehnologij v luči razpoznavanja vzorcev.
- Osnovne značilnosti slušnega zaznavanja ter govorna komunikacija pri ljudeh. Predstavitve govora in kodiranje informacije z govorom.
- Obdelava govora: zajem in predobdelava, značilke govornega signala, razčlenjevanje govornega signala, govorne podatkovne zbirke.
- Razpoznavanje govora: vrste sistemov za razpoznavanje, statistično modeliranje akustične in jezikovne predstavitve govora ter njegova pomenska analiza.
- Umetni govor: zgradba sistemov za tvorjenje umetnega govora, grafemsko-fonemska pretvorba, modeliranje prozodije, načini tvorjenja umetnega govornega signala.
- Dialog: zgradba sistemov za vodenje dialoga, načini vodenja dialoga, vrednotenje delovanja.
- Slikovne tehnologije: osnovni pojmi, primeri uporabe, osnovne transformacije slikovnih podatkov, barvni prostori in kodiranje slik.
- Obdelava slikovnih podatkov: obdelava slik v slikovnem in frekvenčnem prostoru, modeli šuma in obnavljanje, morfološke operacije in algoritmi, iskanje robov.
- Napredni algoritmi: krajevni deskriptroji in njihovo uporaba, detekcija objektov v sliki, razpoznavanje objektov, pod-prostori za predstavitev podatkov.
- Segmentacija slik: vrste rojenja in njihova uporaba pri segmentaciji, mean-shift.
Cilji in kompetence:
Poznavanje in razumevanje področja govornih in slikovnih tehnologij, poznavanje samodejnih postopkov za izvajanje različnih nalog s tega področja.
Predvideni študijski rezultati:
Po uspešno opravljenem predmetu bodo študenti zmožni:
- opredeliti osnove načine za opis, predstavitev, tvorjenje ter razpoznavanje govornih in slikovnih signalov,
- opisati osnovne značilnosti, gradnike, načine delovanja in zmogljivosti sistemov govornih in slikovnih tehnologij,
- uporabiti izbrane programske rešitve za razvoj govorne komunikacije med človekom in strojem ter aplikacij za obdelavo in razpoznavanje slik,
- razlikovati med različnimi nalogami govornih in slikovnih tehnologij ter metodami predstavitve in obdelave, ki se pri tem uporabljajo,
- združiti osnovne postopke predstavitve in obdelave govornih in slikovnih signalov v kompleksnejše sisteme za razpoznavanje in sintezo govora in slik,
- ovrednotiti točnost in zanesljivost delovanja sistemov govornih in slikovnih tehnologij.
Metode poučevanja in učenja:
Snov se pri predmetu podaja v obliki predavanj. Teoretično znanje študenti nato uporabijo v okviru več praktičnih vaj, ki se izvajajo v sodobno opremljeni laboratorijski učilnici.
Gradiva
- Mihelič F., Žibert J., Hajdinjak M., Štruc V., Skripta za predmet Govorne in slikovne tehnologije, 1. Izdaja, Ljubljana, Fakulteta za elektrotehniko, 2012
- Mihelič F., Signali, Založba FE in FRI, Ljubljana, 2006
- Pavešić N., Razpoznavanje vzorcev: uvod v analizo in razumevanje vidnih in slušnih vzorcev, 3. Popravljena in dopolnjena izdaja, Založba FE in FRI, Ljubljana, 2012
- Rabiner L., Schafer R., Theory and Applications of Digital Speech Processing, Prentince Hall, 1. Ed., 2010
- Gonzales R. C., Woods, R.E., Digital Image Processing, 3 izdaja, Prentice Hall, 2007
- R.C. Gonzales, R.E. Woods, S.L. Eddins, Digital image processing using Matlab, 2 izdaja. Gatesmark Publishing, 2009
Študiji na katerih se predmet izvaja
- 2 letnik - 1. stopnja - Multimedija
- 3 letnik - 1. stopnja - Multimedija