AHC-NAIST:Research (Paper Fiscal Year 2011)

Research

Publication List: Paper (Fiscal Year 2011: April/2011-March/2012)

Commentary Article
- Tomoki Toda
  "Modeling of speech parameter sequence considering global variance for HMM-based speech synthesis"
  Hidden Markov Models, Theory and Applications, Editor: Przemyslaw Dymarski, InTech, pp.131-150, April 2011．(ISBN 978-953-307-208-1)
Scientific Journals [Peer Reviewed]
- Sakriani Sakti, Michael Paul, Andrew Finch, Shinsuke Sakai, Thang Tat Vu, Noriyuki Kimura, Chiori Hori, Eiichiro Sumita, Satoshi Nakamura, Jun Park, Chai Wutiwiwatchai, Bo Xu, Hammam Riza, Karunesh Arora, Chi Mai Luong, Haizhou Li.
  "A-STAR: Toward Translating Asian Spoken Languages"
  Computer Speech and Language Journal (Elsevier), Special issue on Speech-to-Speech Translation, available online August 2011, DOI = 10.1016/j.csl.2011.07.001.
- Keigo Nakamura, Tomoki Toda, Hiroshi Saruwatari, and Kiyohiro Shikano
  "Evaluation of speaking-aid systems using GMM-based voice conversion for electrolaryngeal speech"
  Speech Communication, vol.54, no.1, pp.134-146, January 2012.
- Takatomi Kubo, Tomoki Toda, Masaki Yoshida, Takumu Hattori, Kazushi Ikeda.
  "Vowel recognition based on surface electromyography with electrode grid on submental region."
  Transactions of Japanese Society for Medical and Biological Engineering, Vol. 50, No. 1, pp. 38-46, Feb. 2012.
- [In JAPANESE] Tomoaki Nakamura, Muhammad Attamimi, Komei Sugiura, Takayuki Nagai, Naoto Iwahashi, Tomoki Toda, Hiroyuki Okada, Takashi Omori.
  "An Extended Mobile Manipulation Robot Learning Novel Objects"
  Journal of the Robotics Society of Japan, Vol. 30, No. 2, pp. 213-224, Mar. 2012.
International Conference [Peer Reviewed]
- Sakriani Sakti, Andrew Finch, Ryosuke Isotani, Hisashi Kawai, and Satoshi Nakamura.
  "Unsupervised determination of efficient Korean LVCSR units using a Bayesian Dirichlet process model."
  Proc. of International Conference on Acoustics, Speech, and Signal Processing 2011 (ICASSP2011), pp.4664-4667, Prague, Czech Republic, May 2011.
- Hironori Doi, Keigo Nakamura, Tomoki Toda, Hiroshi Saruwatari, and Kiyohiro Shikano.
  "An evaluation of alaryngeal speech enhancement methods based on voice conversion techniques."
  Proc. of International Conference on Acoustics, Speech, and Signal Processing 2011 (ICASSP2011), pp.5136-5139, Prague, Czech Republic, May 2011.
- Denis Babani, Tomoki Toda, Hiroshi Saruwatari, and Kiyohiro Shikano.
  "Acoustic model training for non-audible murmur recognition using transformed normal speech data."
  Proc. of International Conference on Acoustics, Speech, and Signal Processing 2011 (ICASSP2011), pp.5224-5227, Prague, Czech Republic, May 2011.
- Yu Tsao, Ryosuke Isotani, Hisashi Kawai, and Satoshi Nakamura.
  "Increasing discriminative capability on MAP-based mapping function estimation for acoustic model adaptation."
  Proc. of International Conference on Acoustics, Speech, and Signal Processing 2011 (ICASSP2011), pp.5320-5323, Prague, Czech Republic, May 2011.
- Yu Tsao, Shigeki Matsuda, Shinsuke Sakai, Ryosuke Isotani, Hisashi Kawai, and Satoshi Nakamura.
  "A sampling-based environment population projection approach for rapid acoustic model adaptation."
  Proc. of International Conference on Acoustics, Speech, and Signal Processing 2011 (ICASSP2011), pp.5504-5507, Prague, Czech Republic, May 2011.
- Teruhisa Misu, Kiyonori Ohtake, Chiori Hori, Hisashi Kawai, and Satoshi Nakamura.
  "User study of spoken decision support system."
  Proc. of INTERSPEECH2011, pp.797-800, Florence, Italy, August 2011.
- Xugang Lu, Masashi Unoki, Ryosuke Isotani, Hisashi Kawai, and Satoshi Nakamura.
  "Adaptive regularization framework for robust voice activity detection."
  Proc. of INTERSPEECH2011, pp.2653-2656, Florence, Italy, August 2011.
- Nobuhiko Hattori, Tomoki Toda, Hisashi Kawai, Hiroshi Saruwatari, and Kiyohiro Shikano.
  "Speaker-adaptive speech synthesis based on eigenvoice conversion and language-dependent prosodic conversion in speech-to-speech translation.
  Proc. of INTERSPEECH2011, pp.2769-2772, Florence, Italy, August 2011.
- Hiroki Tanaka, Nick Campbell
  "Acoustic Features of Four Types of Laughter in Natural Conversational Speech"
  in Proc. ICPhS XVII, pp.1958-1961, Hong Kong, Aug. 2011.
- Hiroki Tanaka, Hideki Kashioka, Nick Campbell
  "Laughter as a gesture accompanying speech - towards the creation of a tool for the support of children on the autistic dimension"
  in Proc. GESPIN2011, Bielefeld, Sep. 2011.
- Daisuke Deguchi, Tomoki Toda, Hironori Doi, Hiroshi Saruwatari, and Kiyohiro Shikano.
  "Computationally efficient body-conducted voice conversion with original excitation signals."
  Proc. of APSIPA ASC, Xi'an, China, Oct. 2011.
- Shunta Ishii, Tomoki Toda, Hiroshi Saruwatari, Sakriani Sakti, and Satoshi Nakamura.
  "Blind noise suppression for non-audible murmur recognition with stereo signal processing."
  IEEE 2011 Automatic Speech Recognition and Understanding Workshop (ASRU2011), pp.494-499, Hawaii, USA, December 2011.
- Kenzo Yamamoto, Tomoki Toda, Hironori Doi, Hiroshi Saruwatari, Kiyohiro Shikano.
  "Statistical approach to voice quality control in esophageal speech enhancement."
  Proc. of ICASSP, pp. 4497-4500, Kyoto, Japan, Mar. 2012.
Research Report
- [In JAPANESE] Shunta Ishii, Tomoki Toda, Hiroshi Saruwatari, Sakriani Sakti, Satoshi Nakamura.
  "Blind Noise Suppression for Non-Audible Murmur Recognition with Stereo Signals"
  Research Report of IPSJ, Vol. 2011-SLP-88, No. 1, pp. 1-8, Oct. 2011.
- [In JAPANESE] Mayumi Kishimoto, Hironori Doi, Tomoki Toda, Sakriani Sakti, Satoshi Nakamura.
  "Addressing the mismatch of pause position in training data for statistical alaryngeal speech enhancement"
  Technical Research Report of IEICE, SP2011-77, pp. 49-54, Nov. 2011.
- [In JAPANESE] Hiroki Tanaka, Hideki Kashioka, Nick Cambell
  "Analysis of laughter annotation: towards support for children with autistic spectrum disorders"
  Technical Research Report of IEICE，SP2011-60, WIT2011-42，Oct. 2011.
- [In JAPANESE] Shunta Ishii, Tomoki Toda, Hiroshi Saruwatari, Sakriani Sakti, Satoshi nakamura.
  "Improvements of blind noise suppression method for Non-Audible Murmur recognition tolerating user movement"
  Technical Research Report of IEICE, SP2011-148, pp. 213-218, Feb. 2012.
Conference Presentation
- [In JAPANESE] Shunta Ishii, Tomoki Toda, Hiroshi Saruwatari, Sakriani Sakti, Satoshi Nakamura.
  "Reduction of performance degradation of non-audible murmur recognition caused by noise generated depending on speaker's movements."
  Proceeding of ASJ, 3-10-5, pp. 79-80, Sep. 2011.
- [In JAPANESE] Tomoki Toda
  "Voice quality analysis, conversion, and control techniques based on statistical approaches and their applications"
  Proceeding of ASJ, 1-8-11, pp. 257-260, Sep. 2011. (Guest Speech)
- [In JAPANSESE]Mayumi Kishimoto, Hironori Doi, Toda Tomoki, Sakriani Sakti, Satoshi Nakamura.
  "統計的無喉頭音声強調における学習データのポーズ位置不一致についての検討."
  ASJ2011, Dec. 2011.
- [In JAPANSESE]Shunta Ishii, Tomoki Toda, Hiroshi Saruwatari, Sakriani Sakti, Satoshi Nakamura.
  "非可聴つぶやき認識におけるステレオ信号を用いたブラインド雑音抑圧法."
  ASJ2011, Dec. 2011.
- [In JAPANESE] Yuki Yamauchi, Komei Sugiura, Naoto Iwahashi, Sakriani Sakti, Tomoki Toda, Satoshi Nakamura.
  "Motion Generation and Obstacle Avoidance Using HMMs in Object Manipulation Tasks"
  The 12th conference of SICE System Integration Division（SI2011）, 2L1-3, pp. 1614-1617, Dec. 2011.
- [In JAPANESE] Shunta Ishii, Tomoki Toda, Hiroshi Saruwatari, Sakriani Sakti, Satoshi Nakamura.
  "Stereo signal integration in blind noise suppression for Non-Audible Murmur recognition"
  Proceeding of ASJ, 1-7-11, pp. 27-28, Mar. 2012.
- [In JAPANESE] Shinnosuke Takamichi, Tomoki Toda, Yoshinori Shiga, Hisashi Kawai, Sakriani Sakti, Satoshi Nakamura.
  "A Study on the E?ectiveness of Full-context Models with Tied-covariance Matrices in HMM-based Speech Synthesis"
  Proceeding of ASJ, 1-11-4, pp. 301-302, Mar. 2012.
- [In JAPANESE] Mayumi Kishimoto, Hironori Doi, Tomoki Toda, Sakriani Sakti, Satoshi Nakamura.
  "Model training using training data including mismatched pause positions in statistical esophageal speech enhancement"
  Proceeding of ASJ, 2-11-15, pp. 367-368, Mar. 2012.