Csapó Tamás Gábor

dr-csapo-tamas-gaborE-mail:  csapot[kukac]tmit.bme.hu

Kutatási területek: artikuláció, gépi szövegfelolvasás, jelfeldolgozás, ember-gép interfészek.

Végzettség

2014: PhD-fokozat: 2013, disszertáció címe: A rejtett Markov-modell alapú beszédszintézis természetességének növelése
2014 jan-júl.: Fulbright-ösztöndíj, Department of Speech and Hearing Sciences, Indiana University, Bloomington, IN, USA, kutatási téma: a nyelvmozgás vizsgálata ultrahanggal beszéd közben

2008–2013: PhD-tanulmányok: Informatikai program, BME (állami ösztöndíjas, summa cum laude, 100%).
2008: MSc-fokozat: 2008, a dolgozat címe: A prozódiai variáció implementációja a beszédszintézisbe.

2003–2008: MSc Technikai informatikus mérnök, BME, Major: Következő generációs hálózatok, (4.29/5.00)
1999–2003: Kossuth Lajos Gimnázium (emelt szintű matematika)

 

Munkahelyek

2016-tól: résszmunkaidős tudományos munkatárs, MTA

2014 november óta: tudományos segédmunkatárs, BME TMIT Beszédtechnológiai és Intelligens Interakciók Laboratórium.

2014 jan-júl.: Hallgatói vendégkutató, Speech Production Laboratory, Department of Speech and Hearing Sciences, Indiana University, Bloomington, IN, USA.
2011–2014: PhD-jelölt, BME TMIT Beszédtechnológiai és Intelligens Interakciók Laboratórium
2008–2011: PhD-hallgató, BME TMIT Beszédtechnológiai és Intelligens Interakciók Laboratórium

 

Oktatás

2016–: Smart City laboratory, (in Hungarian), compiled and supervised a new lab on augmented reality applications. BME.
2015–: Software laboratory – databases, (in Hungarian), taught lectures and rated midterm work. BME.
2014–: Infocommunication, (in English), developed course material for English, taught lectures. BME.
2010–: Human-Computer Interaction, (in English and Hungarian), developed course material, assisted and taught lectures, rated mid-term project work.
2010–: Project Laboratory and thesis writing, (in Hungarian), supervised BSc and MSc students. BME and IU.
2008–2015: Measurement Laboratory, (in English and Hungarian), compiled and supervised a new lab on VoiceXML dialog planning and taught Speech Coding Lab. BME.

 

Témavezetés

Sikeres védés:

2015: BSc-dolgozat: Umlauf Zoltán, Beszédtechnológiával kiegészített üzenetkezelő rendszer Androidon, BME TMIT.

2015: BSc-dolgozat: Csopor Dávid, Mély neuronhálók alkalmazása ultrahangos nyelvkontúr követésre, BME TMIT.

2012: BSc-dolgozat: Bárány Balázs, Beszéd alapú távvezérlő OkosTV-hez, BME TMIT.

2012: BSc-dolgozat: Weller Barnabás Péter , Akusztikus ikonok tervezése és alkalmazása, BME TMIT.

2011: BSc-dolgozat: Porció Roland, Spontán jellegű beszéd mesterséges előállítása, BME TMIT.

 

Ösztöndíjak, kitüntetések

2016. júl.: NVidia Hardware Ösztöndíj(Titan X GPU)

2016. márc. : Nemzeti Fejlesztési Minisztérium, Információs Társadalomért szakmai érem.
2015. ápr.: Huszty Dénes Alapítvány, Disszertáció-pályázat: 1. hely.
2014. jan-júl.: Fulbright-ösztöndíj, Indiana University, Bloomington, IN, Unites States of America.
2014. júl.: utazástámogatási ösztöndíj: Magyar Mérnök Akadémia, Bloomington.
2013. okt.: BME kutatói pályázat, honlaptervezési verseny, 3. hely.
2013. júl.: Campus Hungary utazási ösztöndíj, 8th Speech Synthesis Workshop
2013. máj.: Microsoft No Time to W8 verseny, 1. helyezés. ,,Időjárás mindenkinek” Windows 8 alkalmazás (megosztva más kollégákkal a BME-TMIT-ről).
2010. ápr.: Acoustical Society of America, International Student Grant.
2009. szept.: Bizáky Puky Péter Alapítvány, utazási ösztöndíj, Interspeech 2009
2009. máj.: OPAKFI Diplomamunka pályázat, 3. helyezés.
2007. nov.: BME VIK Tudományos Diákköri Konferencia, 2. helyezés.
2007. nov.: BME GTK Tudományos Diákköri Konferencia, 1. helyezés.
2007. szept.-2008. aug.: Országos Tudományos Diákköri Konferencia, 1. helyezés.
2007. szept.-2008. jan.: Köztársasági ösztöndíj, Oktatási Minisztérium.
2007. szept.-2008. jan.: Kari BME ösztöndíj, BME VIK.
2007. aug.: Egyetemi BME ösztöndíj, BME.

2007. International Speech Communication Association, utazási ösztöndíj, Interspeech 2007
2007. ápr.: Országos Tudományos Diákköri Konferencia, 1. hely.
2006. nov.: BME VIK Tudományos Diákköri Konferencia, 1. helyezés

 

Kutatási projektek, ösztöndíjak

2016–: MTA-ELTE Lendület Lingvális Artikuláció Kutatócsoport, vezető: Markó Alexandra

2014. jan-júl.: Fulbright-ösztöndíj, Indiana University, Bloomington, IN, Unites States of America. Témavezető: Steven M. Lulich.

 

Szakmai tevékenységek:

Lektorálás: IEEE Signal Processing Letters, Journal on Multimodal User Interfaces, Intelligent Decision Technologies, International Journal of Speech Technology, IETE Technical Review, SPECOM (2016), RADIOELEKTRONIKA (2016), Interspeech (2013), CogInfoCom (2013)

 

Tudományos testületi tagságok:

Magyar Tudományos Akadémia köztestületi tag

International Speech Communication Association (ISCA) diák tag

IEEE Signal Processing Society diák tag

Hírközlési és Informatikai Tudományos Egyesület diák tag

 


Publikációk: (MTMT) Összesen 51 publikáció, ebből

  • 17 folyóiratcikk (13 nemzetközi, 4 magyar)
  • 23 konferenciacikk (18 nemzetközi, 5 magyar)
  • 3 könyvfejezet (3 magyar)
  • 8 egyéb

  1. Tamás Gábor Csapó, Tamás Grósz, Gábor Gosztolya, László Tóth, Alexandra Markó, DNN-based ultrasound-to-speech conversion for a silent speech interface, In: 18th Annual Conference of the International Speech Communication Association, INTERSPEECH 2017, Stockholm, Svédország, 2017, pp. 3672-3676 DOI cikk Scopus előadás
  2. Mohammed Salah Al-Radhi, Tamás Gábor Csapó, Géza Németh, Time-domain envelope modulating the noise component of excitation in a continuous residual-based vocoder for statistical parametric speech synthesis, In: Interspeech 2017, Stockholm, Svédország, 2017, pp. 434-438 DOI cikk Scopus
  3. Mohammed Salah Al-Radhi, Tamás Gábor Csapó, Géza Németh, Effects of adding a Harmonic-to-Noise Ratio parameter to a Continuous vocoder, In: UK Speech Conference 2017, Cambridge, Egyesült Királyság / Anglia, 2017, pp. 27-27 poszter pdf
  4. Mohammed Salah Al-Radhi, Tamás Gábor Csapó, Géza Németh, Deep recurrent neural networks in speech synthesis using a continuous vocoder, In: LECTURE NOTES IN ARTIFICIAL INTELLIGENCE, Hatfield, Egyesült Királyság / Anglia, vol. 10458 LNAI, 2017, pp. 282-291 DOI Scopus pdf
  5. Mohammed Salah Al-Radhi, Tamás Gábor Csapó, Géza Németh, Continuous vocoder in feed-forward deep neural network based speech synthesis, In: Digital speech and image processing, Novi Sad, Szerbia, 2017, pp. 1-4
  6. Markó Alexandra, Deme Andrea, Varjasi Gergely, Bartók Márton, Gráczi Tekla Etelka, Csapó Tamás Gábor, Word-initial irregular phonation as a function of speech rate and vowel quality in Hungarian, In: International Seminar on Speech Production, Tianjin, Kína, 2017, p. 2
  7. Markó Alexandra, Csapó Tamás Gábor, Deme Andrea, Gráczi Tekla Etelka, Varjasi Gergely, A gyermeki artikuláció vizsgálata – Új lehetőségek a hazai kutatásban, In: Új utak a gyermeknyelvi kutatásokban, 2017, pp. 65-95 cikk
  8. Kele Xu, Pierre Roussel, Tamás Gábor Csapó, Bruce Denby, Convolutional neural network-based automatic classification of midsagittal tongue gestural targets using B-mode ultrasound images, In: JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, vol. 141, no. 6, 2017, pp. EL531-EL537 DOI cikk WoS
  9. Csapó Tamás Gábor, Deme Andrea, Gráczi Tekla Etelka, Markó Alexandra, Varjasi Gergely, Szinkronizált beszéd- és nyelvultrahang-felvételek a SonoSpeech rendszerrel, In: XIII. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY2017), Szeged, Magyarország, 2017, pp. 339-346 cikk
  10. Csapó Tamás Gábor, Németh Géza, Folytonos paraméterű vokóder rejtett Markov-modell alapú beszédszintézisben - magyar nyelvű kísérletek 12 beszélővel, In: XIII. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY2017), Szeged, Magyarország, 2017, pp. 308-315 cikk poszter
  11. Csapó Tamás Gábor, Grósz Tamás, Tóth László, Markó Alexandra, Beszédszintézis ultrahangos artikulációs felvételekből mély neuronhálók segítségével, In: XIII. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY2017), Szeged, Magyarország, 2017, pp. 181-192 cikk előadás
  12. Alexandra Markó, Tamás Gábor Csapó, Karolina Takács, Listeners’ evaluation of voice quality in Hungarian speakers, In: BESZÉDKUTATÁS, vol. 25, 2017, pp. 55-66 DOI
  13. Tamás Gábor Csapó, Géza Németh, Milos Cernak, Philip N Garner, Modeling Unvoiced Sounds In Statistical Parametric Speech Synthesis with a Continuous Vocoder, In: 24th European Signal Processing Conference, EUSIPCO 2016, Budapest, Magyarország, 2016, pp. 1338-1342 DOI Scopus előadás cikk pdf WoS
  14. Milan Sečujski, Branislav Gerazov, Tamás Gábor Csapó, Vlado Delić, Philip N Garner, Aleksandar Gjoreski, David Guennec, Zoran Ivanovski, Aleksandar Melov, Géza Németh, Ana Stojković, György Szaszák, Design of a Speech Corpus for Research on Cross-Lingual Prosody Transfer, In: LECTURE NOTES IN ARTIFICIAL INTELLIGENCE, Budapest, Magyarország, vol. 9811, 2016, pp. 199-206 DOI Scopus WoS
  15. Kele Xu, Tamás Gábor Csapó, Pierre Roussel, Bruce Denby, A comparative study on the contour tracking algorithms in ultrasound tongue images with automatic re-initialization, In: JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, vol. 139, no. 5, 2016, pp. EL154-EL160 DOI Scopus WoS
  16. Bálint Pál Tóth, Tamás Gábor Csapó, Continuous Fundamental Frequency Prediction with Deep Neural Networks, In: European Signal Processing Conference (EUSIPCO 2016), Budapest, Magyarország, 2016, pp. 1348-1352 DOI Scopus előadás cikk pdf WoS
  17. Tamás Gábor Csapó, Géza Németh, Milos Cernak, Residual-based excitation with continuous F0 modeling in HMM-based speech synthesis, In: LECTURE NOTES IN ARTIFICIAL INTELLIGENCE, Budapest, Magyarország, vol. 9449, 2015, pp. 27-38 DOI Scopus hangminták előadás cikk pdf
  18. Tamás Gábor Csapó, Steven M Lulich, Error analysis of extracted tongue contours from 2D ultrasound images, In: Proceedings of the Annual Conference of the International Speech Communication Association (INTERSPEECH 2015), Dresden, Németország, 2015, pp. 2157-2161 kép poszter videos Scopus cikk pdf WoS
  19. Tamás Gábor Csapó, Géza Németh, Automatic transformation of irregular to regular voice by residual analysis and synthesis, In: Proceedings of the Annual Conference of the International Speech Communication Association (INTERSPEECH 2015), Dresden, Németország, 2015, pp. 613-617 kép poszter Scopus cikk pdf WoS
  20. Markó Alexandra, Gráczi Tekla Etelka, Csapó Tamás Gábor, Tetten érhető-e a beszédalkalmazkodás a glottalizáció gyakoriságában?, In: Első- és második nyelv: Interdiszciplináris megközelítések. First and second language: Interdisciplinary approaches, 2015, pp. 225-238 cikk
  21. Markó Alexandra, Csapó Tamás Gábor, Az automatikus irreguláriszönge-detekció sikeressége az irregularitás mintázatának függvényében magyar (spontán és olvasott) beszédben, In: XI. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY 2015), Szeged, Magyarország, 2015, pp. 290-297 cikk poszter
  22. Kálmán Abari, Tamás Gábor Csapó, Bálint Pál Tóth, Gábor Olaszy, From text to formants - indirect model for trajectory prediction based on a multi-speaker parallel speech database, In: Proceedings of the Annual Conference of the International Speech Communication Association (INTERSPEECH 2015), Dresden, Németország, 2015, pp. 623-627 poszter Scopus demo cikk pdf WoS
  23. Csapó Tamás Gábor, Csopor Dávid, Ultrahangos nyelvkontúrkövetés automatikusan: A mély neuronhálókon alapuló AutoTrace eljárás vizsgálata, In: BESZÉDKUTATÁS, vol. 23, 2015, pp. 176-186 cikk link
  24. Tamás Gábor Csapó, Géza Németh, Statistical parametric speech synthesis with a novel codebook-based excitation model, In: INTELLIGENT DECISION TECHNOLOGIES, vol. 8, no. 4, 2014, pp. 289-299 cikk Scopus
  25. Tamás Gábor Csapó, Géza Németh, Modeling irregular voice in statistical parametric speech synthesis with residual codebook based excitation, In: IEEE JOURNAL ON SELECTED TOPICS IN SIGNAL PROCESSING, vol. 8, no. 2, 2014, pp. 209-220 DOI cikk Scopus WoS
  26. Gy Szaszák, T Gábor Csapó, P N Garner, B Gerazov, Z Ivanovski, G Németh, B Tóth, Sečujski, and V Delić, The SP2 SCOPES project on speech prosody, In: Proceedings of DOGS2014 - Digital speech and image processing, Novi Sad, Szerbia, 2014, pp. 2-10 cikk
  27. Csapó Tamás Gábor, Németh Géza, Irreguláris beszéd regulárissá alakitása beszédkódoláson alapuló módszerrel, In: BESZÉDKUTATÁS, vol. 22, 2014, pp. 193-204 cikk
  28. Csapó Tamás Gábor, A gépi beszéd-előállítás természetességének növelése rejtett Markov-modell alapú szövegfelolvasó rendszerben, PhD disszertáció, 2014, p. 112 disszertáció tézisfüzet (magyar) tézisfüzet (angol) pdf
  29. António Teixeira, Annika Hämäläinenc, Jairo Avelar, Nuno Almeida, Géza Németh, Tibor Fegyó, Csaba Zainkó, Tamás Csapó, Bálint Tóth, André Oliveira, Miguel Sales Dias, Speech-centric Multimodal Interaction for Easy-to-access Online Services – A Personal Life Assistant for the Elderly, In: PROCEDIA COMPUTER SCIENCE, Vigo, Spanyolország, vol. 27, 2014, p. 9 DOI cikk Scopus WoS
  30. Tamás Gábor Csapó, Géza Németh, A novel irregular voice model for HMM-based speech synthesis, In: ISCA 8th Speech Synthesis Worksop (SSW8), Barcelona, Spanyolország, 2013, pp. 229-234 cikk hangminták előadás
  31. Tamás Gábor Csapó, Increasing the naturalness of synthesized speech (PhD summary), In: PHONETICIAN, vol. 105-106, 2012, pp. 88-97 honlap cikk pdf
  32. Tamás Gábor Csapó, Géza Németh, A novel codebook-based excitation model for use in speech synthesis, In: Cognitive Infocommunications (CogInfoCom), Košice, Szlovákia, 2012, pp. 661-665 DOI kép Scopus előadás video cikk Google scholar pdf WoS
  33. Éva Székely, Tamás Gábor Csapó, Bálint Tóth, Péter Mihajlik, Julie Carson-Berndsen, Synthesizing Expressive Speech from Amateur Audiobook Recordings, In: IEEE Workshop on Spoken Language Technology, Miami (FL), Amerikai Egyesült Államok, 2012, pp. 297-302 DOI cikk Scopus pdf WoS
  34. Gráczi TE, Lulich SM, Csapó TG, Beke A, Context and speaker dependency in the relation of vowel formants and subglottal resonances : Evidence from Hungarian, In: Interspeech 2011, 12th Annual Conference of the International Speech Communication Association, Firenze, Olaszország, 2011, pp. 1901-1904 kép poszter Scopus cikk pdf WoS
  35. Géza Németh, Gábor Olaszy, Tamás Gábor Csapó, Spemoticons: Text-To-Speech based emotional auditory cues, In: ICAD 2011, Budapest, Magyarország, 2011, pp. 1-7 cikk Google scholar pdf
  36. Csapó Tamás Gábor, Németh Géza, Prozódiai változatosság rejtett Markov-modell alapú szövegfelolvasóval, In: VIII. Magyar Számítógépes Nyelvészeti Konferencia [Eighth Hungarian Conference on Computational Linguistics], Szeged, Magyarország, 2011, pp. 167-177 cikk poszter pdf
  37. Tamás Gábor Csapó, Csaba Zainkó, Géza Németh, A Study of Prosodic Variability Methods in a Corpus-Based Unit Selection Text-To-Speech System, In: INFOCOMMUNICATIONS JOURNAL, vol. LXV, no. 1, 2010, pp. 32-37 cikk pdf
  38. Csapó TG, Bárkányi Zs, Gráczi TE, Bőhm T, Lulich SM, Relation of formants and subglottal resonances in Hungarian vowels, In: 10th annual conference of the International Speech Communication Association 2009 (INTERSPEECH 2009), Egyesült Királyság / Anglia, 2010, pp. 484-487 kép poszter Scopus cikk pdf WoS
  39. Csaba Zainkó, Tamás Gábor Csapó, Géza Németh, Special Speech Synthesis for Social Network Websites, In: LECTURE NOTES IN ARTIFICIAL INTELLIGENCE, vol. 6231, 2010, pp. 455-463 DOI kép Scopus előadás cikk Google scholar WoS
  40. Géza Németh, Tamás Gábor Csapó, Bálint Tóth, Improving the Quality of Unit Selection and HMM based Speech Synthesis, 2009 link
  41. Csapó TG, Gráczi TE, Bárkányi Zs, Beke A, Lulich SM, Patterns of Hungarian vowel production and perception with regard to subglottal resonances, In: PHONETICIAN, vol. 99-100, 2009, pp. 7-28 honlap cikk link
  42. Csapó Tamás Gábor, Változatos prozódia megvalósítása szövegfelolvasó rendszerekben, In: AKUSZTIKAI SZEMLE, vol. IX, no. III, 2009, pp. 16-18 összefoglaló
  43. Csapó Tamás Gábor, Zainkó Csaba, Németh Géza, Szintetizált beszéd prozódiai változatosságának növelése spontán beszéd alapján, 2009
  44. Csapó Tamás Gábor, Németh Géza, Mássalhangzó-magánhangzó kapcsolatok automatikus osztályozása szubglottális rezonanciák alapján, In: VI. Magyar Számítógépes Nyelvészeti Konferencia [Sixth Hungarian Conference on Computational Linguistics], Szeged, Magyarország, 2009, pp. 226-237 cikk Google scholar pdf előadás
  45. Csapó Tamás Gábor, Bárkányi Zsuzsanna, Gráczi Tekla Etelka, Beke András, Bőhm Tamás, A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben, 2009
  46. Csapó Tamás Gábor, Változatos prozódia megvalósítása szövegfelolvasó rendszerekben, 2008 pdf
  47. Csapó Tamás Gábor, Németh Géza, Fék Márk, Szövegfelolvasó természetességének növelése, In: HIRADÁSTECHNIKA: HÍRKÖZLÉS-INFORMATIKA, vol. LXIII, no. 5, 2008, pp. 7-11 cikk pdf
  48. Németh G, Fék M, Csapó T G, Increasing Prosodic Variability of Text-To-Speech Synthesizers, In: Interspeech 2007, Antwerpen, Belgium, 2007, pp. 474-477 poszter hangminták Scopus cikk Google scholar WoS
  49. Csapó Tamás Gábor, Steigerung der Natürlichkeit synthetisierter Sprache, 2007 pdf
  50. Csapó Tamás Gábor, Beszédszintetizátor prozódiai változatosságának növelése, 2007 pdf
  51. Csapó Tamás Gábor, Szintetizált beszéd természetesebbé tétele, 2006 pdf