Csapó Tamás Gábor

dr-csapo-tamas-gaborE-mail:  csapot[kukac]tmit.bme.hu

Kutatási területek: artikuláció, gépi szövegfelolvasás, jelfeldolgozás, ember-gép interfészek.

Végzettség

2014: PhD-fokozat: 2013, disszertáció címe: A rejtett Markov-modell alapú beszédszintézis természetességének növelése
2014 jan-júl.: Fulbright-ösztöndíj, Department of Speech and Hearing Sciences, Indiana University, Bloomington, IN, USA, kutatási téma: a nyelvmozgás vizsgálata ultrahanggal beszéd közben

2008–2013: PhD-tanulmányok: Informatikai program, BME (állami ösztöndíjas, summa cum laude, 100%).
2008: MSc-fokozat: 2008, a dolgozat címe: A prozódiai variáció implementációja a beszédszintézisbe.

2003–2008: MSc Technikai informatikus mérnök, BME, Major: Következő generációs hálózatok, (4.29/5.00)
1999–2003: Kossuth Lajos Gimnázium (emelt szintű matematika)

 

Munkahelyek

2016-tól: résszmunkaidős tudományos munkatárs, MTA

2014 november óta: tudományos segédmunkatárs, BME TMIT Beszédtechnológiai és Intelligens Interakciók Laboratórium.

2014 jan-júl.: Hallgatói vendégkutató, Speech Production Laboratory, Department of Speech and Hearing Sciences, Indiana University, Bloomington, IN, USA.
2011–2014: PhD-jelölt, BME TMIT Beszédtechnológiai és Intelligens Interakciók Laboratórium
2008–2011: PhD-hallgató, BME TMIT Beszédtechnológiai és Intelligens Interakciók Laboratórium

 

Oktatás

2016–: Smart City laboratory, (in Hungarian), compiled and supervised a new lab on augmented reality applications. BME.
2015–: Software laboratory – databases, (in Hungarian), taught lectures and rated midterm work. BME.
2014–: Infocommunication, (in English), developed course material for English, taught lectures. BME.
2010–: Human-Computer Interaction, (in English and Hungarian), developed course material, assisted and taught lectures, rated mid-term project work.
2010–: Project Laboratory and thesis writing, (in Hungarian), supervised BSc and MSc students. BME and IU.
2008–2015: Measurement Laboratory, (in English and Hungarian), compiled and supervised a new lab on VoiceXML dialog planning and taught Speech Coding Lab. BME.

 

Témavezetés

Sikeres védés:

2015: BSc-dolgozat: Umlauf Zoltán, Beszédtechnológiával kiegészített üzenetkezelő rendszer Androidon, BME TMIT.

2015: BSc-dolgozat: Csopor Dávid, Mély neuronhálók alkalmazása ultrahangos nyelvkontúr követésre, BME TMIT.

2012: BSc-dolgozat: Bárány Balázs, Beszéd alapú távvezérlő OkosTV-hez, BME TMIT.

2012: BSc-dolgozat: Weller Barnabás Péter , Akusztikus ikonok tervezése és alkalmazása, BME TMIT.

2011: BSc-dolgozat: Porció Roland, Spontán jellegű beszéd mesterséges előállítása, BME TMIT.

 

Ösztöndíjak, kitüntetések

2016. júl.: NVidia Hardware Ösztöndíj(Titan X GPU)

2016. márc. : Nemzeti Fejlesztési Minisztérium, Információs Társadalomért szakmai érem.
2015. ápr.: Huszty Dénes Alapítvány, Disszertáció-pályázat: 1. hely.
2014. jan-júl.: Fulbright-ösztöndíj, Indiana University, Bloomington, IN, Unites States of America.
2014. júl.: utazástámogatási ösztöndíj: Magyar Mérnök Akadémia, Bloomington.
2013. okt.: BME kutatói pályázat, honlaptervezési verseny, 3. hely.
2013. júl.: Campus Hungary utazási ösztöndíj, 8th Speech Synthesis Workshop
2013. máj.: Microsoft No Time to W8 verseny, 1. helyezés. ,,Időjárás mindenkinek” Windows 8 alkalmazás (megosztva más kollégákkal a BME-TMIT-ről).
2010. ápr.: Acoustical Society of America, International Student Grant.
2009. szept.: Bizáky Puky Péter Alapítvány, utazási ösztöndíj, Interspeech 2009
2009. máj.: OPAKFI Diplomamunka pályázat, 3. helyezés.
2007. nov.: BME VIK Tudományos Diákköri Konferencia, 2. helyezés.
2007. nov.: BME GTK Tudományos Diákköri Konferencia, 1. helyezés.
2007. szept.-2008. aug.: Országos Tudományos Diákköri Konferencia, 1. helyezés.
2007. szept.-2008. jan.: Köztársasági ösztöndíj, Oktatási Minisztérium.
2007. szept.-2008. jan.: Kari BME ösztöndíj, BME VIK.
2007. aug.: Egyetemi BME ösztöndíj, BME.

2007. International Speech Communication Association, utazási ösztöndíj, Interspeech 2007
2007. ápr.: Országos Tudományos Diákköri Konferencia, 1. hely.
2006. nov.: BME VIK Tudományos Diákköri Konferencia, 1. helyezés

 

Kutatási projektek, ösztöndíjak

2016–: MTA-ELTE Lendület Lingvális Artikuláció Kutatócsoport, vezető: Markó Alexandra

2014. jan-júl.: Fulbright-ösztöndíj, Indiana University, Bloomington, IN, Unites States of America. Témavezető: Steven M. Lulich.

 

Szakmai tevékenységek:

Lektorálás: IEEE Signal Processing Letters, Journal on Multimodal User Interfaces, Intelligent Decision Technologies, International Journal of Speech Technology, IETE Technical Review, SPECOM (2016), RADIOELEKTRONIKA (2016), Interspeech (2013), CogInfoCom (2013)

 

Tudományos testületi tagságok:

Magyar Tudományos Akadémia köztestületi tag

International Speech Communication Association (ISCA) diák tag

IEEE Signal Processing Society diák tag

Hírközlési és Informatikai Tudományos Egyesület diák tag

 


Publikációk: (MTMT) Összesen 43 publikáció, ebből

  • 15 folyóiratcikk (11 nemzetközi, 4 magyar)
  • 18 konferenciacikk (13 nemzetközi, 5 magyar)
  • 2 könyvfejezet (2 magyar)
  • 8 egyéb

  1. Markó Alexandra, Csapó Tamás Gábor, Takács Karolina, Listeners' evaluation of voice quality in Hungarian speakers, In: BESZÉDKUTATÁS, vol. 2017, 2017, pp. 55-66 DOI
  2. Kele Xu, Pierre Roussel, Tamás Gábor Csapó, Bruce Denby, Convolutional neural network-based automatic classification of midsagittal tongue gestural targets using B-mode ultrasound images, In: JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, vol. 141, no. 6, 2017, pp. EL531-EL537 DOI cikk
  3. Csapó Tamás Gábor, Deme Andrea, Gráczi Tekla Etelka, Markó Alexandra, Varjasi Gergely, Szinkronizált beszéd- és nyelvultrahang-felvételek a SonoSpeech rendszerrel, In: XIII. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY2017), Szeged, Magyarország, 2017, pp. 339-346 cikk
  4. Csapó Tamás Gábor, Németh Géza, Folytonos paraméterű vokóder rejtett Markov-modell alapú beszédszintézisben - magyar nyelvű kísérletek 12 beszélővel, In: XIII. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY2017), Szeged, Magyarország, 2017, pp. 308-315 poszter cikk
  5. Csapó Tamás Gábor, Grósz Tamás, Tóth László, Markó Alexandra, Beszédszintézis ultrahangos artikulációs felvételekből mély neuronhálók segítségével, In: XIII. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY2017), Szeged, Magyarország, 2017, pp. 181-192 előadás cikk
  6. Tamás Gábor Csapó, Géza Németh, Milos Cernak, Philip N Garner, Modeling Unvoiced Sounds In Statistical Parametric Speech Synthesis with a Continuous Vocoder, In: 24th European Signal Processing Conference, EUSIPCO 2016, Budapest, Magyarország, 2016, pp. 1338-1342 DOI Scopus pdf
  7. Milan Sečujski, Branislav Gerazov, Tamás Gábor Csapó, Vlado Delić, Philip N Garner, Aleksandar Gjoreski, David Guennec, Zoran Ivanovski, Aleksandar Melov, Géza Németh, Ana Stojković, György Szaszák, Design of a Speech Corpus for Research on Cross-Lingual Prosody Transfer, In: LECTURE NOTES IN ARTIFICIAL INTELLIGENCE, Budapest, Magyarország, vol. 9811, 2016, pp. 199-206 WoS DOI Scopus
  8. Kele Xu, Tamás Gábor Csapó, Pierre Roussel, Bruce Denby, A comparative study on the contour tracking algorithms in ultrasound tongue images with automatic re-initialization, In: JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, vol. 139, no. 5, 2016, pp. EL154-EL160 WoS DOI Scopus
  9. Bálint Pál Tóth, Tamás Gábor Csapó, Continuous Fundamental Frequency Prediction with Deep Neural Networks, In: European Signal Processing Conference (EUSIPCO 2016), Budapest, Magyarország, 2016, pp. 1348-1352 DOI Scopus pdf
  10. Tamás Gábor Csapó, Géza Németh, Milos Cernak, Residual-based excitation with continuous F0 modeling in HMM-based speech synthesis, In: LECTURE NOTES IN ARTIFICIAL INTELLIGENCE, Budapest, Magyarország, vol. 9449, 2015, pp. 27-38 DOI Scopus pdf
  11. Tamás Gábor Csapó, Steven M Lulich, Error analysis of extracted tongue contours from 2D ultrasound images, In: Proceedings of the Annual Conference of the International Speech Communication Association (INTERSPEECH 2015), Dresden, Németország, 2015, pp. 2157-2161 Scopus pdf
  12. Tamás Gábor Csapó, Géza Németh, Automatic transformation of irregular to regular voice by residual analysis and synthesis, In: Proceedings of the Annual Conference of the International Speech Communication Association (INTERSPEECH 2015), Dresden, Németország, 2015, pp. 613-617 Scopus pdf
  13. Markó Alexandra, Gráczi Tekla Etelka, Csapó Tamás Gábor, Tetten érhető-e a beszédalkalmazkodás a glottalizáció gyakoriságában?, In: Első- és második nyelv: Interdiszciplináris megközelítések. First and second language: Interdisciplinary approaches, 2015, pp. 225-238
  14. Markó Alexandra, Csapó Tamás Gábor, Az automatikus irreguláriszönge-detekció sikeressége az irregularitás mintázatának függvényében magyar (spontán és olvasott) beszédben, In: XI. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY 2015), Szeged, Magyarország, 2015, pp. 290-297
  15. Kálmán Abari, Tamás Gábor Csapó, Bálint Pál Tóth, Gábor Olaszy, From text to formants - indirect model for trajectory prediction based on a multi-speaker parallel speech database, In: Proceedings of the Annual Conference of the International Speech Communication Association (INTERSPEECH 2015), Dresden, Németország, 2015, pp. 623-627 Scopus pdf
  16. Csapó Tamás Gábor, Csopor Dávid, Ultrahangos nyelvkontúrkövetés automatikusan: A mély neuronhálókon alapuló AutoTrace eljárás vizsgálata, In: BESZÉDKUTATÁS, vol. 23, 2015, pp. 176-186 link
  17. Tamás Gábor Csapó, Géza Németh, Statistical parametric speech synthesis with a novel codebook-based excitation model, In: INTELLIGENT DECISION TECHNOLOGIES, vol. 8, no. 4, 2014, pp. 289-299 Scopus
  18. Tamás Gábor Csapó, Géza Németh, Modeling irregular voice in statistical parametric speech synthesis with residual codebook based excitation, In: IEEE JOURNAL ON SELECTED TOPICS IN SIGNAL PROCESSING, vol. 8, no. 2, 2014, pp. 209-220 WoS DOI Scopus
  19. Gy Szaszák, T Gábor Csapó, P N Garner, B Gerazov, Z Ivanovski, G Németh, B Tóth, Sečujski, and V Delić, The SP2 SCOPES project on speech prosody, In: Proceedings of DOGS2014 - Digital speech and image processing, Novi Sad, Szerbia, 2014, pp. 2-10
  20. Csapó Tamás Gábor, Németh Géza, Irreguláris beszéd regulárissá alakitása beszédkódoláson alapuló módszerrel, In: BESZÉDKUTATÁS, vol. 22, 2014, pp. 193-204
  21. Csapó Tamás Gábor, A gépi beszéd-előállítás természetességének növelése rejtett Markov-modell alapú szövegfelolvasó rendszerben, PhD disszertáció, 2014, p. 112 pdf
  22. António Teixeira, Annika Hämäläinenc, Jairo Avelar, Nuno Almeida, Géza Németh, Tibor Fegyó, Csaba Zainkó, Tamás Csapó, Bálint Tóth, André Oliveira, Miguel Sales Dias, Speech-centric Multimodal Interaction for Easy-to-access Online Services – A Personal Life Assistant for the Elderly, In: PROCEDIA COMPUTER SCIENCE, Vigo, Spanyolország, vol. 27, 2014, p. 8 WoS DOI Scopus
  23. Tamás Gábor Csapó, Géza Németh, A novel irregular voice model for HMM-based speech synthesis, In: ISCA 8th Speech Synthesis Worksop (SSW8), Barcelona, Spanyolország, 2013, pp. 229-234
  24. Tamás Gábor Csapó, Géza Németh, A novel codebook-based excitation model for use in speech synthesis, In: Cognitive Infocommunications (CogInfoCom), Košice, Szlovákia, 2012, pp. 661-665 WoS DOI Scopus pdf Google scholar
  25. Éva Székely, Tamás Gábor Csapó, Bálint Tóth, Péter Mihajlik, Julie Carson-Berndsen, Synthesizing Expressive Speech from Amateur Audiobook Recordings, In: IEEE Workshop on Spoken Language Technology, Miami, Amerikai Egyesült Államok, 2012, pp. 297-302 WoS DOI Scopus pdf
  26. Gráczi TE, Lulich SM, Csapó TG, Beke A, Context and speaker dependency in the relation of vowel formants and subglottal resonances : Evidence from Hungarian, In: Interspeech 2011, 12th Annual Conference of the International Speech Communication Association, Firenze, Olaszország, 2011, pp. 1901-1904 WoS Scopus pdf
  27. Géza Németh, Gábor Olaszy, Tamás Gábor Csapó, Spemoticons: Text-To-Speech based emotional auditory cues, In: ICAD 2011, Budapest, Magyarország, 2011, pp. 1-7 pdf Google scholar
  28. Csapó Tamás Gábor, Németh Géza, Prozódiai változatosság rejtett Markov-modell alapú szövegfelolvasóval, In: VIII. Magyar Számítógépes Nyelvészeti Konferencia [Eighth Hungarian Conference on Computational Linguistics], Szeged, Magyarország, 2011, pp. 167-177 pdf
  29. Tamás Gábor Csapó, Csaba Zainkó, Géza Németh, A Study of Prosodic Variability Methods in a Corpus-Based Unit Selection Text-To-Speech System, In: INFOCOMMUNICATIONS JOURNAL, vol. LXV, no. 1, 2010, pp. 32-37 pdf
  30. Csapó TG, Bárkányi Zs, Gráczi TE, Bőhm T, Lulich SM, Relation of formants and subglottal resonances in Hungarian vowels, In: 10th annual conference of the International Speech Communication Association 2009 (INTERSPEECH 2009), Egyesült Királyság / Anglia, 2010, pp. 484-487 WoS Scopus pdf
  31. Csaba Zainkó, Tamás Gábor Csapó, Géza Németh, Special Speech Synthesis for Social Network Websites, In: LECTURE NOTES IN ARTIFICIAL INTELLIGENCE, vol. 6231, 2010, pp. 455-463 WoS DOI Scopus Google scholar
  32. Géza Németh, Tamás Gábor Csapó, Bálint Tóth, Improving the Quality of Unit Selection and HMM based Speech Synthesis, 2009 link
  33. Csapó TG, Gráczi TE, Bárkányi Zs, Beke A, Lulich SM, Patterns of Hungarian vowel production and perception with regard to subglottal resonances, In: PHONETICIAN, vol. 99-100, 2009, pp. 7-28 link
  34. Csapó Tamás Gábor, Változatos prozódia megvalósítása szövegfelolvasó rendszerekben, In: AKUSZTIKAI SZEMLE, vol. IX, no. III, 2009, pp. 16-18
  35. Csapó Tamás Gábor, Zainkó Csaba, Németh Géza, Szintetizált beszéd prozódiai változatosságának növelése spontán beszéd alapján, 2009
  36. Csapó Tamás Gábor, Németh Géza, Mássalhangzó-magánhangzó kapcsolatok automatikus osztályozása szubglottális rezonanciák alapján, In: VI. Magyar Számítógépes Nyelvészeti Konferencia [Sixth Hungarian Conference on Computational Linguistics], Szeged, Magyarország, 2009, pp. 226-237 pdf Google scholar
  37. Csapó Tamás Gábor, Bárkányi Zsuzsanna, Gráczi Tekla Etelka, Beke András, Bőhm Tamás, A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben, 2009
  38. Csapó Tamás Gábor, Változatos prozódia megvalósítása szövegfelolvasó rendszerekben, 2008 pdf
  39. Csapó Tamás Gábor, Németh Géza, Fék Márk, Szövegfelolvasó természetességének növelése, In: HIRADÁSTECHNIKA, vol. LXIII, no. 5, 2008, pp. 7-11 pdf
  40. Németh G, Fék M, Csapó T G, Increasing Prosodic Variability of Text-To-Speech Synthesizers, In: Interspeech 2007, Antwerpen, Belgium, 2007, pp. 474-477 WoS Scopus Google scholar
  41. Csapó Tamás Gábor, Steigerung der Natürlichkeit synthetisierter Sprache, 2007 pdf
  42. Csapó Tamás Gábor, Beszédszintetizátor prozódiai változatosságának növelése, 2007 pdf
  43. Csapó Tamás Gábor, Szintetizált beszéd természetesebbé tétele, 2006 pdf