研究
論文リスト (2012年度:2012年4月-2013年3月)
-
学術論文[査読あり]
- Tomoaki Nakamura, Komei Sugiura, Takayuki Nagai, Naoto Iwahashi, Tomoki Toda, Hiroyuki Okada, Takayuki Omori. "Learning novel objects for extended mobile manipulation." Journal of Intelligent and Robotic Systems, Vol. 66, No. 1-2, pp. 187-204, Apr. 2012.
- Graham Neubig, Taro Watanabe, Eiichiro Sumita, Shinsuke Mori, Tatsuya Kawahara. "Joint Phrase Alignment and Extraction for Statistical Machine Translation" Journal of Information Processing, 20-2, pp.512-523. April 2012.
- Sakriani Sakti, Michael Paul, Andrew Finch, Xinhui Hu, Jinfu Ni, Noriyuki Kimura, Shigeki Matsuda, Chiori Hori, Yutaka Ashikari, Hisashi Kawai, Hideki Kashioka, Eiichiro Sumita, Satoshi Nakamura "Distributed Speech Translation Technologies for Multiparty Multilingual Communication" ACM Trans. Speech Lang. Process., vol. 9, Issue 2, Article 4, July 2012, DOI = 10.1145/2287710.2287712.
- Hansjorg Hofmann, Sakriani Sakti, Chiori Hori, Hideki Kashioka, Satoshi Nakamura, Wolfgang, Minker. "Sequence-based Pronunciation Variation Modeling for Spontaneous ASR using a Noisy Channel Approach" IEICE Trans. Inf. & Syst., vol. E95-D, pp. 2084-2093, August 2012
- Tomoki Toda, Mikihiro Nakagiri, Kiyohiro Shikano. "Statistical voice conversion techniques for body-conducted unvoiced speech enhancement." IEEE Transactions on Audio, Speech and Language Processing, Vol. 20, No. 9, pp. 2505-2517, Sep. 2012.
- Daniel Flannery, Yusuke Miyao, Graham Neubig, Shinsuke Mori. "A Pointwise Approach to Training Dependency Parsers from Partially Annotated Corpora" Journal of Natural Language Processing, 19-3, pp.167-192. September 2012.
-
国際会議[査読あり]
- Tomoki Toda. "Statistical approaches to enhancement of body-conducted speech detected with non-audible murmur microphone." Proc. of ICME CME, pp. 623-628, Hyogo, Japan, July 2012.
- Graham Neubig, Taro Watanabe, Shinsuke Mori. "Inducing a Discriminative Parser to Optimize Machine Translation Reordering" Conference on Empirical Methods in Natural Language Processing and Natural Language Learning (EMNLP-CoNLL), pp.843-853. July 2012.
- Graham Neubig, Taro Watanabe, Shinsuke Mori, Tatsuya Kawahara. "Machine Translation without Words through Substring Alignment" The 50th Annual Meeting of the Association for Computational Linguistics (ACL), pp.165-174. July 2012.
- Tomoki Toda, Takashi Muramatsu, Hideki Banno. "Implementation of computationally efficient real-time voice conversion." Proc. of INTERSPEECH, Portland, USA, Sep. 2012.
- Shinnosuke Takamichi, Tomoki Toda, Yoshinori Shiga, Hisashi Kawai, Sakriani Sakti, Satoshi Nakamura. "An evaluation of parameter generation methods with rich context models in HMM-based speech synthesis." Proc. of INTERSPEECH, Portland, USA, Sep. 2012.
- Mayumi Kishimoto, Tomoki Toda, Hironori Doi, Sakriani Sakti, Satoshi Nakamura. "Model training using parallel data with mismatched pause positions in statistical esophageal speech enhancement." Proc. ICSP, pp. 590-594, Beijing, China, Oct. 2012.
- Lasguido, Sakriani Sakti, Graham Neubig, Tomoki Toda, Mirna Adriani, Satoshi Nakamura. "Developing Non-Goal Dialog System based on Examples of Drama Television." Proc. of the 4th International Workshop on Spoken Dialog Systems (IWSDS 2012), pp. 315-320, Ermenonville, France, Nov. 2012.
- Hiroki Tanaka, Sakriani Sakti, Graham Neubig, Tomoki Toda, Nick Campbell and Satoshi Nakamura. "Non-verbal Cognitive Skills and Autistic Conditions: An Analysis and Training Tool." in Proc. 3rd IEEE CogInfoCom 2012, pp. 41-46, Kosice, Slovakia, Dec. 2012.
- Hironori Doi, Tomoki Toda, Tomoyasu Nakano, Masataka Goto, and Satoshi Nakamura. "Singing Voice Conversion Method Based on Many-to-Many Eigenvoice Conversion and Training Data Generation Using A Singing-to-Singing Synthesis System." APSIPA ASC 2012, Dec. 2012. [THE BEST PAPER AWARD (Short Paper in Regular Session Category)]
- Graham Neubig, Kevin Duh, Masaya Ogushi, Takatomo Kano, Tetsuo Kiso, Sakriani Sakti, Tomoki Toda, Satoshi Nakamura. "The NAIST MachineTranslation System for IWSLT2012." IWSLT 2012, pp54-60, HongKong, China, Dec. 2012
- Michael Heck, Keigo Kubo, Matthias Sperber, Sakriani Sakti, Sebastian Stuker, Christian Saam, Kelvin Kilgour, Christian Mohr, Graham Neubig, Tomoki Toda, Satoshi Nakamura, Alexander Waibel "The KIT-NAIST (Contrastive) English ASR System for IWSLT 2012." IWSLT 2012, pp91-95, HongKong, China, Dec. 2012
- Takatomo Kano, Sakriani Sakti, Shinnosuke Takamichi, Graham Neubig, Tomoki Toda, Satoshi Nakamura. "A Method for Translation of Paralinguistic Information." IWSLT 2012, pp158-163, HongKong, China, Dec. 2012.
- Hiroaki Shimizu, Masao Utiyama, Eiichiro Sumita, Satoshi Nakamura. "Minimum Bayes-Risk Decoding Extended with Two Methods: NAIST-NICT at IWSLT 2012." IWSLT 2012, pp117-120, HongKong, China, Dec. 2012.
- Christian Saam, Christian Mohr, Kelvin Kilgour, Michael Heck, Matthias Sperber, Keigo Kubo, Sebastian Stuker, Sakriani Sakti, Graham Neubig, Tomoki Toda, Satoshi Nakamura, Alexander Waibel "The 2012 KIT and KIT-NAIST English ASR Systems for the IWSLT Evaluation." IWSLT 2012, pp87-90, HongKong, China, Dec. 2012.
- Auliya Sani, Sakriani Sakti, Graham Neubig, Tomoki Toda, Adi Mulyanto, Satoshi Nakamura. "TOWARDS LANGUAGE PRESERVATION: PRELIMINARY COLLECTION AND VOWEL ANALYSIS OF INDONESIAN ETHNIC SPEECH DATA." Proc. of Oriental COCOSDA 2012, Macau China, pp. 118-122, Macau, China, Dec. 2012. [BEST STUDENT PAPER AWARD]
- Miyuki Itoi, Ryoichi Miyazaki, Tomoki Toda, Hiroshi Saruwatari, Kiyohiro Shikano. "Blind speech extraction for non-audible murmur speech with speaker's movement noise." Proc. ISSPIT, Ho Chi Minh City, Vietnam, Dec. 2012.
- Graham Neubig, Kevin Duh. "How Much is Said in a Tweet? A Multilingual, Information-theoretic Perspective" AAAI Spring Symposium on Analyzing Microtext. March 2013.
-
国際会議[査読なし]
- T. Toda. General concepts and framework of HMM-based speech synthesis. Tutorial on HMM-based statistical speech synthesis in Workshop at Shanghai Jiao Tong University, Shanghai, China, Oct. 2012 (Tutorial).
- Y. Odagaki, S. Sakti, G. Neubig, T. Toda, S. Nakamura. An ERP Analysis of the World-Sense and Semantics Mismatches in Japanese Sentences. The Australasian Cognitive Neuroscience Conference (ACNS-2012), Brisbane, Australia, Nov. 2012.
- T. Toda. Statistical voice conversion and its real-time applications. Workshop on Frontiers in Speech and Language Technologies and Their Applications, Hefei, China, Dec. 2012 (招待講演).
- T. Toda. Statistical approach to voice conversion and its applications for augmented human communication. The 8th International Symposium on Chinese Spoken Language Processing (ISCSLP-2012), Hong Kong, China, Dec. 2012 (チュートリアル).
- T. Toda. Voice conversion. Winter School on Speech and Audio Processing (WiSSAP 2013), Chennai, India, Feb. 2013 (招待講演).
-
研究会
- 糸井 三由希, 宮崎 亮一, 戸田 智基, 猿渡 洋, 鹿野 清宏. 「ユーザ動作を伴う雑音を含む非可聴つぶやき音声におけるブラインド音声抽出」 電子情報通信学会技術研究報告, Vol. 112, No. 76, EA2012-40, pp. 43-48, June 2012.
- 笹田 鉄郎, 森 信介, Graham Neubig, 河原 達也. 「素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習」 情報処理学会 第207回自然言語処理研究会 (NL-207). 北海道. 2012年7月.
- 高道 慎之介, 戸田 智基, 志賀 芳則, 河井 恒, Sakriani Sakti, Graham Neubig, 中村 哲. 「分散共有フルコンテキストモデルによるHMM音声合成に関する検討」 情報処理学会研究報告, Vol. 2012-SLP-92, No. 10, pp. 1-6, July 2012.
- 土井 啓成, 戸田 智基, 中野 倫靖, 後藤 真孝, 中村 哲. ・uVocaListenerによる学習データ生成を利用した多対多固有声変換に基く歌声声質変換」 情報処理学会研究報告[音楽情報科学], Vol. 2012-MUS-96, No. 5, pp. 1-9, Aug. 2012. [ベストプレゼンテーション賞(最多得票)]
- 森口 拓人, 戸田 智基, 佐野 元明, 佐藤 宏, Graham Neubig, Sakriani Sakti, 中村 哲. 「統計的手法に基づくリアルタイム声質変換処理のDSP上への実装」 電子情報通信学会技術研究報告, SP2012-73, pp. 7-12, Nov. 2012.
- 犬飼 辰夫, 戸田 智基, Graham Neubig, Sakriani Sakti, 中村 哲. 「同一文発話間における話者内スペクトル特徴量変動とその予測」 電子情報通信学会技術研究報告, SP2012-74, pp.13-18, Nov. 2012.
- 高道 慎之介, 戸田 智基, 志賀 芳則, Sakriani Sakti, Graham Neubig, 中村 哲. 「分散共有フルコンテキストモデルによるHMM音声合成の改善」 電子情報通信学会技術研究報告, SP2012-78, pp.37-42, Nov. 2012.
- 田中 宏季,Sakriani Sakti, Graham Neubig,戸田 智基,中村 哲. 「非言語認知スキルからの自閉症スペクトラム指数の自動測定」 教育システム情報学会研究報告,vol. 27, no. 4, pp. 44-46, Nov. 2012.
- 藤田 朋希, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲. 「同時性を考慮した音声翻訳システムの検討」 情報処理学会研究報告, Vol. 2012-NL-209, No. 13, pp. 1-5, Nov. 2012.
- 山内 祐輝, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲. 「対話システムにおける単語間の関係性を用いた話題誘導応答文生成」 情報処理学会研究報告, Vol. 2012-SLP-94, No. 3, pp. 1-7, Dec. 2012.
- 平岡 拓也, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲. 「説得対話システムにおける話題誘導に基づく対話制御」 情報処理学会研究報告, Vol. 2012-SLP-94, No. 4, pp. 1-6, Dec. 2012.
- 高道 慎之介, 戸田 智基, 志賀 芳則, Sakriani Sakti, Graham Neubig, 中村 哲. 「HMM音声合成における分散共有フルコンテキストモデルによるF0パターン生成」 電子情報通信学会技術研究報告, SP2012-104, pp. 37-42, Jan. 2013.
- 糸井 三由希, 宮崎 亮一, 戸田 智基, 猿渡 洋, 鹿野 清宏. 「ユーザ動作雑音を含む非可聴つぶやき音声における多チャネル異種センサ統合に基づくブラインド音声抽出」 電子情報通信学会技術研究報告, Vol. 112, No. 388, EA2012-119, pp. 1-6, Jan. 2013.
- 田中 宏季,サクリアニ サクティ,グラム ニュービッグ,戸田 智基,中村 哲. 「非言語情報読み取りスキルを用いた自閉症スペクトラム指数の測定」 電子情報通信学会技術研究報告,IMQ2012-34-IMQ2012-91,pp. 223-226, Mar. 2013.
大会講演
- 山内 祐輝, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲. 「対話システムにおける話題誘導のための単語間の関係を用いた応答文生成」 日本音響学会講演論文集, 2-1-11, pp. 81-82, Sep. 2012.
- 平岡 拓也, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲. 「説得対話システムにおける対話制御に関する検討」 日本音響学会講演論文集, 2-1-12, pp. 83-84, Sep. 2012.
- 叶 高朋, Sakriani Sakti, Graham Neubig, 戸田 智基, 中村 哲. 「入力音声の継続長を考慮した音声翻訳システム」 日本音響学会講演論文集, 3-P-23, pp. 181-182, Sep. 2012.
- 森口 拓人, 戸田 智基, 佐野 元明, 佐藤 宏, Graham Neubig, Sakriani Sakti, 中村 哲. 「リアルタイム肉伝導音声変換処理のDSP上への実装」 日本音響学会講演論文集, 1-2-2, pp. 217-218, Sep. 2012.
- 土井 啓成, 戸田 智基, 中野 倫靖, 後藤 真孝, 中村 哲. 「多対多固有声変換に基づく歌声声質変換及び歌声合成を用いた学習データ生成」 日本音響学会講演論文集, 1-2-7, pp. 231-232, Sep. 2012.
- 高道 慎之介, 戸田 智基, 志賀 芳則, Sakriani Sakti, Graham Neubig, 中村 哲. 「HMM音声合成における分散共有フルコンテキストモデルの選択法に関する検討」 日本音響学・・u演論文集, 2-2-1 pp. 273-274, Sep. 2012.
- 犬飼 辰夫, 戸田 智基, Graham Neubig, Sakriani Sakti, 中村 哲. 「特定話者の同一文発話間におけるスペクトル特徴量変動とその予測」 日本音響学会講演論文集, 2-2-8, pp. 291-292, Sep. 2012.
- 糸井 三由希, 宮崎 亮一, 戸田 智基, 猿渡 洋, 鹿野 清宏. 「異種センサを用いて収録された非可聴つぶやき音声におけるブラインド音声抽出」 日本音響学会講演論文集, 3-9-10, pp. 695-698, Sep. 2012.
- 小田垣 佑,Sakriani Sakti,Graham Neubig,戸田 智基,中村 哲 「ERPによる日本語文での知識と意味のミスマッチ分析」 第35回日本神経科学大会,名古屋, Sep. 2012
- 糸井 三由希, 宮崎 亮一, 戸田 智基, 猿渡 洋, 鹿野 清宏. 「ユーザ動作に伴う雑音を含む非可聴つぶやき音声における6チャネルブラインド音声抽出」 第15回日本音響学会関西支部若手研究者交流研究発表会, Dec. 2012.
- 大串正矢, Graham Neubig, Sakriani Sakti, 戸田智基, 中村哲. 「音声認識と機械翻訳のランク学習による同時最適化」 言語処理学会第19回年次大会,pp.564-567,Mar. 2013
- 森口 拓人, 戸田 智基, 佐野 元明, 佐藤 宏, グラム・ニュービッグ, サクリアニ・サクティ, 中村 哲. 「無喉頭音声から通常音声へのリアルタイム声質変換処理のDSP上への実装」 日本音響学会講演論文集, 1-7-2, pp. 265-266, Mar. 2013.
- 高道 慎之介,戸田 智基,志賀 芳則,Sakriani Sakti,Graham Neubig,中村 哲. 「HMM音声合成におけるスペクトル・F0の分散共有フルコンテキストモデルによる音質改善」 日本音響学会講演論文集, 1-7-10, pp. 287-288, Mar. 2013.
- 田中 宏, 戸田 智基, Graham Neubig, Sakriani Sakti, 中村 哲. 「統計的手法に基づく電気音声変換における変換特徴量に関する調査」 日本音響学会講演論文集, 2-7-8, pp. 331-332, Mar. 2013.
- 小林 和弘, 土井 啓成, 戸田 智基, 中野 倫靖, 後藤 真孝, ニュービッグ グラム, サクリアニ サクテイ, 中村 哲 「歌声の知覚年齢に沿った声質制御に向けた音響特徴量の調査」 日本音響学会講演論文集, 2-7-14, pp. 347-348, Mar. 2013.
- 糸井 三由希, 宮崎 亮一, 戸田 智基, 猿渡 洋, 鹿野 清宏. 「ユーザ動作雑音を含む非可聴つぶやき音声における多チャネル異種センサ統合に基づくブラインド音声抽出の評価」 日本音響学会講演論文集, 2-10-2, pp. 725-728, Mar. 2013.
- 犬飼 辰夫, 戸田 智基, Graham Neubig, Sakriani Sakti, 中村 哲. 「同一文発話間におけるスペクトル特徴量変動予測の評価」 日本音響学会講演論文集, 3-7-3, pp. 357-358, Mar. 2013.
- 山内 祐輝, Graham Neubig, Sakti Sakriani, 戸田 智基, 中村 哲. 「対話システムにおける用語間の関係性を用いた話題誘導応答文生成の拡張と評価」 日本音響学会講演論文集, 3-9-2, pp. 87-88, Mar. 2013.
- 平岡 拓也, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲. 「説得対話システム構築のための対話コーパス分析」 日本音響学会講演論文集, 3-9-3, pp. 89-90, Mar. 2013.
解説記事
- 戸田 智基 「音声合成技術 進化の行方」 PROJECT DESIGN 月刊「事業構想」2012年11月号, Oct. 2012.
- 戸田 智基 「サイレント音声コミュニケーションのための音声強調技術」 ケミカルエンジニヤリング, Vol. 58, No. 3, pp. 25-30, Mar. 2013.