Govorne in slikovne tehnologije

Visokošolski učitelji: Mihelič France
Število kreditnih točk: 12
Semester izvajanja: poletni, poletni
Kodo predmeta: 64154



Opis predmeta

Pogoji za vključitev v delo oz. za opravljanje študijskih obveznosti:

  • vpis v 3. letnik

Vsebina:

  • Uvod: opis področja, kratek zgodovinski opis razvoja govornih in slikovnih tehnologij, značilnosti sistemov za razpoznavanje vzorcev in predstavitev govornih in slikovnih tehnologij v luči razpoznavanja vzorcev.
  • Osnovne značilnosti slušnega zaznavanja ter govorna komunikacija pri ljudeh. Predstavitve govora in kodiranje informacije z govorom.
  • Obdelava govora: zajem in predobdelava, značilke govornega signala, razčlenjevanje govornega signala, govorne podatkovne zbirke.
  • Razpoznavanje govora: vrste sistemov za razpoznavanje, statistično modeliranje akustične in jezikovne predstavitve govora ter njegova pomenska analiza.
  • Umetni govor: zgradba sistemov za tvorjenje umetnega govora, grafemsko-fonemska pretvorba, modeliranje prozodije, načini tvorjenja umetnega govornega signala.
  • Dialog: zgradba sistemov za vodenje dialoga, načini vodenja dialoga, vrednotenje delovanja.
  • Slikovne tehnologije: osnovni pojmi, primeri uporabe, osnovne transformacije slikovnih podatkov, barvni prostori in kodiranje slik.
  • Obdelava slikovnih podatkov: obdelava slik v slikovnem in frekvenčnem prostoru, modeli šuma in obnavljanje, morfološke operacije in algoritmi, iskanje robov.
  • Napredni algoritmi: krajevni deskriptroji in njihovo uporaba, detekcija objektov v sliki, razpoznavanje objektov, pod-prostori za predstavitev podatkov.
  • Segmentacija slik: vrste rojenja in njihova uporaba pri segmentaciji, mean-shift.

Cilji in kompetence:

Seznanjanje s področjem govornih in slikovnih tehnologij, spoznavanje samodejnih postopkov za izvajanje različnih nalog s tega področja.

Predvideni študijski rezultati:

Znanje o načinu opisov, predstavitev in umetnem tvorjenju ter razpoznavanju govornih in slikovnih signalov. Razumevanje kompleksnosti in interdisciplinarnosti področja. Znanje in razumevanje o zgradbi, načinu delovanja in zmogljivosti sistemov govornih in slikovnih tehnologij.

Metode poučevanja in učenja:

  • predavanja,
  • sodelovalno učenje,
  • laboratorijske vaje.





Gradiva

  1. Mihelič F., Žibert J., Hajdinjak M., Štruc V., Skripta za predmet Govorne in slikovne tehnologije, 1. Izdaja, Ljubljana, Fakulteta za elektrotehniko, 2012
  2. Mihelič F., Signali, Založba FE in FRI, Ljubljana, 2006
  3. Pavešić N., Razpoznavanje vzorcev: uvod v analizo in razumevanje vidnih in slušnih vzorcev, 3. Popravljena in dopolnjena izdaja, Založba FE in FRI, Ljubljana, 2012
  4. Rabiner L., Schafer R., Theory and Applications of Digital Speech Processing, Prentince Hall, 1. Ed., 2010
  5. Gonzales R. C., Woods, R.E., Digital Image Processing, 3 izdaja, Prentice Hall, 2007
  6. R.C. Gonzales, R.E. Woods, S.L. Eddins, Digital image processing using Matlab, 2 izdaja. Gatesmark Publishing, 2009



Študiji na katerih se predmet izvaja

  • 2 letnik - 1. stopnja - Multimedija
  • 3 letnik - 1. stopnja - Multimedija