Örömmel adunk hírt hallgatóink eredményeiről, akik önálló labor és/vagy szakdolgozatírás keretében a LingArt csoporthoz kapcsolódó artikulációs témával foglalkoztak.
Ha szeretnél csatlakozni a csapatunkhoz, itt tudsz. A BME-s “önálló labor”-témákat itt találod: http://iw.tmit.bme.hu/education/tematic/studenttopics
Eloi Moliner a BSc szakdolgozatát artikulácó->akusztikus beszédszintézis témában (“némabeszéd-interfész”, angolul Silent Speech Interface, SSI) írta, nyelvultrahang-adatok felhasználásával, és különböző deep learning módszereket hasonlított össze (pl. előrecsatolt, konvolúciós és rekurrens neurális hálózatok), Tamás témavezetése alatt. A kimagasló eredményei alapján egy tudományos publikáció is folyamatban van.
A szakdolgozata: BScThesis_EloiMoliner
Nadia Hajjej MSc-s önálló laboratóriumot végző hallgató realisztikus nyelvultrahang-képek szintézisével foglalkozott, Generative Adversarial Network típusú hálózatok felhasználásával. Bár rengeteg nyelvészeti kutatás használ 2D ultrahangot, viszonylag kevés ingyenesen elérhető adatbázis van, mely nagy mennyiségű ultrahang-képet tartalmazna. A realisztikus nyelvultrahang-képek szintézise a beszédkutatás számos területén hasznos lehet. A hallgató az eredményeit a Beszédkutatás 2018 konferencián fogja a szélesebb közösség előtt ismertetni.
Bárány Bálint (MSc önálló laboratórium, BME) némabeszéd-interfész (SSI) rendszereket vizsgált, és egy előrecsatolt neurális hálózat hiperparaméter-optimalizálását végezte el.
Balaton Tamás (szintén MSc önálló laboratórium, BME) a munkája során nyelvultrahang-képek felügyelet nélküli osztályozásával foglalkozott. Variational AutoEncoder típusú hálózatokkal nagy mennyiségű ultrahang-képet dolgozott fel. A végeredmény pedig az lett, hogy bizonyos magánhangzó-csoportokat kizárólag artikulációs adatok alapján is el tudunk különíteni.
Várjuk a további szép hallgatói eredményeket!