Modelling filled pauses prosody to synthesise disfluent speech

Modelling filled pauses prosody to synthesise disfluent speech. Adell, J., Bonafonte, A., & Escudero, D. In Speech Prosody 2010. Proceedings of the 5th International Conference on Speech Prosody, pages 1–4, 2010.

Paper abstract bibtex

In the present paper we present a new approach to the synthesis of filled pauses since they are as frequent as most frequent words in conversational speech. The problem is tackled from the point of view of disfluent speech synthesis. Based on the synthetic disfluent speech model, we analyse the features that describe filled pauses and propose a model to predict them. The model was implemented and perceptually evaluated with successful results.

@inproceedings{adell_modelling_2010,
	Author = {Adell, Jordi and Bonafonte, Antonio and Escudero, David},
	Booktitle = {Speech Prosody 2010. Proceedings of the 5th International Conference on Speech Prosody},
	Date = {2010},
	Date-Modified = {2018-05-13 21:55:14 +0000},
	Eventdate = {2010-05-11/2010-05-14},
	Keywords = {conversation, disfluencies, duration, filled pauses, pause duration, pauses, phonetics, prosody, rhythm, segmental lengthening, Spanish, speaking styles, speech synthesis, speech technology, temporal factors, text-to-speech},
	Location = {Chicago, IL, USA},
	Pages = {1--4},
	Title = {Modelling filled pauses prosody to synthesise disfluent speech},
	Url = {http://www.isca-speech.org/archive/sp2010/sp10_624.html},
	Year = {2010},
	Abstract = {In the present paper we present a new approach to the synthesis of filled pauses since they are as frequent as most frequent words in conversational speech. The problem is tackled from the point of view of disfluent speech synthesis. Based on the synthetic disfluent speech model, we analyse the features that describe filled pauses and propose a model to predict them. The model was implemented and perceptually evaluated with successful results.},
	Bdsk-File-1 = {YnBsaXN0MDDUAQIDBAUGJCVYJHZlcnNpb25YJG9iamVjdHNZJGFyY2hpdmVyVCR0b3ASAAGGoKgHCBMUFRYaIVUkbnVsbNMJCgsMDxJXTlMua2V5c1pOUy5vYmplY3RzViRjbGFzc6INDoACgAOiEBGABIAFgAdccmVsYXRpdmVQYXRoWWFsaWFzRGF0YV8QVC4uLy4uLy4uL0JpYmxpb2dyYWZpYS9QYXBlcnMvQWRlbGwvTW9kZWxsaW5nIGZpbGxlZCBwYXVzZXMgcHJvc29keSB0byBzeW50aGVzaXNlLnBkZtIXCxgZV05TLmRhdGFPEQI2AAAAAAI2AAIAAAxNYWNpbnRvc2ggSEQAAAAAAAAAAAAAAAAAAADL9h/OSCsAABCGZaofTW9kZWxsaW5nIGZpbGxlZCBwIzEwODY2NUFDLnBkZgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAEIZlrNQJ0uUAAAAAAAAAAAADAAQAAAkgAAAAAAAAAAAAAAAAAAAABUFkZWxsAAAQAAgAAMv2A64AAAARAAgAANQJtsUAAAABABQQhmWqEIZljgAF/EcABfuYAADARgACAGNNYWNpbnRvc2ggSEQ6VXNlcnM6AGpvYXF1aW1fbGxpc3RlcnJpOgBCaWJsaW9ncmFmaWE6AFBhcGVyczoAQWRlbGw6AE1vZGVsbGluZyBmaWxsZWQgcCMxMDg2NjVBQy5wZGYAAA4AZAAxAE0AbwBkAGUAbABsAGkAbgBnACAAZgBpAGwAbABlAGQAIABwAGEAdQBzAGUAcwAgAHAAcgBvAHMAbwBkAHkAIAB0AG8AIABzAHkAbgB0AGgAZQBzAGkAcwBlAC4AcABkAGYADwAaAAwATQBhAGMAaQBuAHQAbwBzAGgAIABIAEQAEgBjVXNlcnMvam9hcXVpbV9sbGlzdGVycmkvQmlibGlvZ3JhZmlhL1BhcGVycy9BZGVsbC9Nb2RlbGxpbmcgZmlsbGVkIHBhdXNlcyBwcm9zb2R5IHRvIHN5bnRoZXNpc2UucGRmAAATAAEvAAAVAAIAGP//AACABtIbHB0eWiRjbGFzc25hbWVYJGNsYXNzZXNdTlNNdXRhYmxlRGF0YaMdHyBWTlNEYXRhWE5TT2JqZWN00hscIiNcTlNEaWN0aW9uYXJ5oiIgXxAPTlNLZXllZEFyY2hpdmVy0SYnVHJvb3SAAQAIABEAGgAjAC0AMgA3AEAARgBNAFUAYABnAGoAbABuAHEAcwB1AHcAhACOAOUA6gDyAywDLgMzAz4DRwNVA1kDYANpA24DewN+A5ADkwOYAAAAAAAAAgEAAAAAAAAAKAAAAAAAAAAAAAAAAAAAA5o=},
	Bdsk-Url-1 = {http://www.isca-speech.org/archive/sp2010/sp10_624.html}}

Downloads: 0

{"_id":"HrP7qQPE9FoR27mCP","bibbaseid":"adell-bonafonte-escudero-modellingfilledpausesprosodytosynthesisedisfluentspeech-2010","downloads":0,"creationDate":"2016-09-21T09:08:37.871Z","title":"Modelling filled pauses prosody to synthesise disfluent speech","author_short":["Adell, J.","Bonafonte, A.","Escudero, D."],"year":2010,"bibtype":"inproceedings","biburl":"https://joaquimllisterri.cat/phonetics/ESTIVOZ/ESTIVOZ.bib","bibdata":{"bibtype":"inproceedings","type":"inproceedings","author":[{"propositions":[],"lastnames":["Adell"],"firstnames":["Jordi"],"suffixes":[]},{"propositions":[],"lastnames":["Bonafonte"],"firstnames":["Antonio"],"suffixes":[]},{"propositions":[],"lastnames":["Escudero"],"firstnames":["David"],"suffixes":[]}],"booktitle":"Speech Prosody 2010. Proceedings of the 5th International Conference on Speech Prosody","date":"2010","date-modified":"2018-05-13 21:55:14 +0000","eventdate":"2010-05-11/2010-05-14","keywords":"conversation, disfluencies, duration, filled pauses, pause duration, pauses, phonetics, prosody, rhythm, segmental lengthening, Spanish, speaking styles, speech synthesis, speech technology, temporal factors, text-to-speech","location":"Chicago, IL, USA","pages":"1–4","title":"Modelling filled pauses prosody to synthesise disfluent speech","url":"http://www.isca-speech.org/archive/sp2010/sp10_624.html","year":"2010","abstract":"In the present paper we present a new approach to the synthesis of filled pauses since they are as frequent as most frequent words in conversational speech. The problem is tackled from the point of view of disfluent speech synthesis. Based on the synthetic disfluent speech model, we analyse the features that describe filled pauses and propose a model to predict them. The model was implemented and perceptually evaluated with successful results.","bdsk-file-1":"YnBsaXN0MDDUAQIDBAUGJCVYJHZlcnNpb25YJG9iamVjdHNZJGFyY2hpdmVyVCR0b3ASAAGGoKgHCBMUFRYaIVUkbnVsbNMJCgsMDxJXTlMua2V5c1pOUy5vYmplY3RzViRjbGFzc6INDoACgAOiEBGABIAFgAdccmVsYXRpdmVQYXRoWWFsaWFzRGF0YV8QVC4uLy4uLy4uL0JpYmxpb2dyYWZpYS9QYXBlcnMvQWRlbGwvTW9kZWxsaW5nIGZpbGxlZCBwYXVzZXMgcHJvc29keSB0byBzeW50aGVzaXNlLnBkZtIXCxgZV05TLmRhdGFPEQI2AAAAAAI2AAIAAAxNYWNpbnRvc2ggSEQAAAAAAAAAAAAAAAAAAADL9h/OSCsAABCGZaofTW9kZWxsaW5nIGZpbGxlZCBwIzEwODY2NUFDLnBkZgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAEIZlrNQJ0uUAAAAAAAAAAAADAAQAAAkgAAAAAAAAAAAAAAAAAAAABUFkZWxsAAAQAAgAAMv2A64AAAARAAgAANQJtsUAAAABABQQhmWqEIZljgAF/EcABfuYAADARgACAGNNYWNpbnRvc2ggSEQ6VXNlcnM6AGpvYXF1aW1fbGxpc3RlcnJpOgBCaWJsaW9ncmFmaWE6AFBhcGVyczoAQWRlbGw6AE1vZGVsbGluZyBmaWxsZWQgcCMxMDg2NjVBQy5wZGYAAA4AZAAxAE0AbwBkAGUAbABsAGkAbgBnACAAZgBpAGwAbABlAGQAIABwAGEAdQBzAGUAcwAgAHAAcgBvAHMAbwBkAHkAIAB0AG8AIABzAHkAbgB0AGgAZQBzAGkAcwBlAC4AcABkAGYADwAaAAwATQBhAGMAaQBuAHQAbwBzAGgAIABIAEQAEgBjVXNlcnMvam9hcXVpbV9sbGlzdGVycmkvQmlibGlvZ3JhZmlhL1BhcGVycy9BZGVsbC9Nb2RlbGxpbmcgZmlsbGVkIHBhdXNlcyBwcm9zb2R5IHRvIHN5bnRoZXNpc2UucGRmAAATAAEvAAAVAAIAGP//AACABtIbHB0eWiRjbGFzc25hbWVYJGNsYXNzZXNdTlNNdXRhYmxlRGF0YaMdHyBWTlNEYXRhWE5TT2JqZWN00hscIiNcTlNEaWN0aW9uYXJ5oiIgXxAPTlNLZXllZEFyY2hpdmVy0SYnVHJvb3SAAQAIABEAGgAjAC0AMgA3AEAARgBNAFUAYABnAGoAbABuAHEAcwB1AHcAhACOAOUA6gDyAywDLgMzAz4DRwNVA1kDYANpA24DewN+A5ADkwOYAAAAAAAAAgEAAAAAAAAAKAAAAAAAAAAAAAAAAAAAA5o=","bdsk-url-1":"http://www.isca-speech.org/archive/sp2010/sp10_624.html","bibtex":"@inproceedings{adell_modelling_2010,\n\tAuthor = {Adell, Jordi and Bonafonte, Antonio and Escudero, David},\n\tBooktitle = {Speech Prosody 2010. Proceedings of the 5th International Conference on Speech Prosody},\n\tDate = {2010},\n\tDate-Modified = {2018-05-13 21:55:14 +0000},\n\tEventdate = {2010-05-11/2010-05-14},\n\tKeywords = {conversation, disfluencies, duration, filled pauses, pause duration, pauses, phonetics, prosody, rhythm, segmental lengthening, Spanish, speaking styles, speech synthesis, speech technology, temporal factors, text-to-speech},\n\tLocation = {Chicago, IL, USA},\n\tPages = {1--4},\n\tTitle = {Modelling filled pauses prosody to synthesise disfluent speech},\n\tUrl = {http://www.isca-speech.org/archive/sp2010/sp10_624.html},\n\tYear = {2010},\n\tAbstract = {In the present paper we present a new approach to the synthesis of filled pauses since they are as frequent as most frequent words in conversational speech. The problem is tackled from the point of view of disfluent speech synthesis. Based on the synthetic disfluent speech model, we analyse the features that describe filled pauses and propose a model to predict them. The model was implemented and perceptually evaluated with successful results.},\n\tBdsk-File-1 = {YnBsaXN0MDDUAQIDBAUGJCVYJHZlcnNpb25YJG9iamVjdHNZJGFyY2hpdmVyVCR0b3ASAAGGoKgHCBMUFRYaIVUkbnVsbNMJCgsMDxJXTlMua2V5c1pOUy5vYmplY3RzViRjbGFzc6INDoACgAOiEBGABIAFgAdccmVsYXRpdmVQYXRoWWFsaWFzRGF0YV8QVC4uLy4uLy4uL0JpYmxpb2dyYWZpYS9QYXBlcnMvQWRlbGwvTW9kZWxsaW5nIGZpbGxlZCBwYXVzZXMgcHJvc29keSB0byBzeW50aGVzaXNlLnBkZtIXCxgZV05TLmRhdGFPEQI2AAAAAAI2AAIAAAxNYWNpbnRvc2ggSEQAAAAAAAAAAAAAAAAAAADL9h/OSCsAABCGZaofTW9kZWxsaW5nIGZpbGxlZCBwIzEwODY2NUFDLnBkZgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAEIZlrNQJ0uUAAAAAAAAAAAADAAQAAAkgAAAAAAAAAAAAAAAAAAAABUFkZWxsAAAQAAgAAMv2A64AAAARAAgAANQJtsUAAAABABQQhmWqEIZljgAF/EcABfuYAADARgACAGNNYWNpbnRvc2ggSEQ6VXNlcnM6AGpvYXF1aW1fbGxpc3RlcnJpOgBCaWJsaW9ncmFmaWE6AFBhcGVyczoAQWRlbGw6AE1vZGVsbGluZyBmaWxsZWQgcCMxMDg2NjVBQy5wZGYAAA4AZAAxAE0AbwBkAGUAbABsAGkAbgBnACAAZgBpAGwAbABlAGQAIABwAGEAdQBzAGUAcwAgAHAAcgBvAHMAbwBkAHkAIAB0AG8AIABzAHkAbgB0AGgAZQBzAGkAcwBlAC4AcABkAGYADwAaAAwATQBhAGMAaQBuAHQAbwBzAGgAIABIAEQAEgBjVXNlcnMvam9hcXVpbV9sbGlzdGVycmkvQmlibGlvZ3JhZmlhL1BhcGVycy9BZGVsbC9Nb2RlbGxpbmcgZmlsbGVkIHBhdXNlcyBwcm9zb2R5IHRvIHN5bnRoZXNpc2UucGRmAAATAAEvAAAVAAIAGP//AACABtIbHB0eWiRjbGFzc25hbWVYJGNsYXNzZXNdTlNNdXRhYmxlRGF0YaMdHyBWTlNEYXRhWE5TT2JqZWN00hscIiNcTlNEaWN0aW9uYXJ5oiIgXxAPTlNLZXllZEFyY2hpdmVy0SYnVHJvb3SAAQAIABEAGgAjAC0AMgA3AEAARgBNAFUAYABnAGoAbABuAHEAcwB1AHcAhACOAOUA6gDyAywDLgMzAz4DRwNVA1kDYANpA24DewN+A5ADkwOYAAAAAAAAAgEAAAAAAAAAKAAAAAAAAAAAAAAAAAAAA5o=},\n\tBdsk-Url-1 = {http://www.isca-speech.org/archive/sp2010/sp10_624.html}}\n\n","author_short":["Adell, J.","Bonafonte, A.","Escudero, D."],"key":"adell_modelling_2010","id":"adell_modelling_2010","bibbaseid":"adell-bonafonte-escudero-modellingfilledpausesprosodytosynthesisedisfluentspeech-2010","role":"author","urls":{"Paper":"http://www.isca-speech.org/archive/sp2010/sp10_624.html"},"keyword":["conversation","disfluencies","duration","filled pauses","pause duration","pauses","phonetics","prosody","rhythm","segmental lengthening","Spanish","speaking styles","speech synthesis","speech technology","temporal factors","text-to-speech"],"metadata":{"authorlinks":{}},"downloads":0,"html":""},"search_terms":["modelling","filled","pauses","prosody","synthesise","disfluent","speech","adell","bonafonte","escudero"],"keywords":["conversation","disfluencies","duration","filled pauses","pause duration","pauses","phonetics","prosody","rhythm","segmental lengthening","spanish","speaking styles","speech synthesis","speech technology","temporal factors","text-to-speech"],"authorIDs":[],"dataSources":["qBn3jEfYwFvzHJsYh","BrMmNtBqG9aDvpsZn"]}