狩野 芳伸

English Japanese

氏名 狩野 芳伸 (かの よしのぶ、Yoshinobu Kano)
所属・職名 科学技術振興機構 さきがけ研究者
  情報・システム研究機構 国立情報学研究所 外来研究員
学位 博士(情報理工学) 東京大学
研究領域 自然言語処理・計算言語学
連絡先

〒101-8430 東京都千代田区一ツ橋2-1-2
大学共同利用機関法人 情報・システム研究機構
国立情報学研究所
狩野 芳伸

E-mail: kano at nii dot ac dot jp

研究テーマ

U-Compare: 統合自然言語処理システムと互換言語資源群

私の主導するU-Compareプロジェクトでは、国際標準フレームワーク UIMA を基盤とした統合自然言語処理システムと世界最大の互換言語資源群をオープンソースで開発提供しています。

UIMA準拠の統合自然言語処理システム

U-Compareプラットフォームは、様々な観点から相互運用性を考慮することで、徹底した自動化と汎用機能によりユーザをサポートできるよう設計された、UIMA準拠の統合自然言語処理システムです。

UIMAのコンポーネント・ワークフロー指向を徹底することで、UIMAコンポーネントの組み合わせによるワークフロー作成を容易にし、コンポーネントの自動組み合わせ比較、統計評価、ワークフロー実行と結果の視覚化など、自然言語処理ユーザが必要とする基盤機能を提供しています。自動化により基本的にプログラミング作業は不要です。

新たな機能として、分散処理の自動実行や機械学習手法の統合を進めています。

国内・海外の機関との協力による互換UIMAコンポーネント群

UIMAコンポーネント同士は形式的な互換性がありますが、意味的には必ずしも互換ではありません。私は国内外の研究機関と連携し、英語・日本語の言語資源を意味的なレベルでも互換化したコンポーネント群にした上で公開しています。上記の統合システムからの利用であれば、ドラッグ&ドロップするだけで実行可能です。

英語の言語資源については、東京大学(辻井研)・マンチェスター大学(NaCTeM)・コロラド大学(CCP/UCHSC)を中心に収集し、現在欧米7か国以上でウェブサービスコンポーネントがホストされています。日本語については、産総研・国語学研究所などと連携し、主要なコーパスやツールを公開しています。

U-Compare は DBCLS において私が設計開発しています。詳細はU-Compareウェブサイト(http://u-compare.org/)をご覧ください。

心理学的妥当性を考慮した構文解析

人間の自然言語処理に対する計算機的アプローチとその工学的応用に興味があります。詳細は後日更新します。

リンク

DBCLS Logo

U-Compare logo

略歴・社会活動・外部資金等

略歴

平成9年 栄光学園高等学校 卒業
平成13年 東京大学理学部物理学科 卒業
平成15年 東京大学情報理工学系研究科コンピュータ科学専攻 修士課程修了 (指導教官: 辻井潤一 教授)
平成19年 東京大学情報理工学系研究科コンピュータ科学専攻 博士課程単位取得退学 (指導教官: 辻井潤一 教授)
平成19年 東京大学情報理工学系研究科コンピュータ科学専攻 学術研究支援員
平成20年

東京大学情報理工学系研究科コンピュータ科学専攻 特任研究員に職名変更

平成21年 東京大学情報学環 特任研究員に異動
平成23年 大学共同利用機関法人 情報・システム研究機構
ライフサイエンス統合データベースセンター 特任助教
平成23年

独立行政法人 科学技術振興機構 さきがけ研究者
大学共同利用機関法人 情報・システム研究機構 国立情報学研究所 外来研究員

外部資金

独立行政法人 科学技術振興機構 戦略的創造研究推進事業 個人型研究 さきがけ
「情報環境と人(研究総括: 石田亨教授)」研究代表者 (2011年度-2014年度 予定)

 文部科学省 科学研究費補助金 基盤研究(C) 研究代表者 (2009-2011年度)
「自然言語処理特化型の視覚的・対話的な半自動エラー解析のできる統合機械学習システム」
(直接経費総額 3300千円・間接経費総額 990千円)

受賞

IBM UIMA Innovation Award (2008) IBMのページ 東京大学情報理工学系研究科のニュース

学会活動

Program Committee Member, CoNLL 2010 Shared Task. (2010)
Program Committee Member, Web Services and Processing Pipelines in HLT (WSPP), Workshop on LREC 2010. (2010)
Program Committee Member, New Challenges for NLP Frameworks, Workshop on LREC 2010. (2010)

Co-organizer, BIoHackaton 2011 workshop. (2011)
Co-organizer, NAACL BioNLP '09 Shared Task on Event Extraction. (2009)

査読委員, 電子情報通信学会英文論文誌D. (2011)
査読委員, 人工知能学会誌. (2011)
Reviewer, Bioinformatics, Oxford journals. (2010)

社会活動

経済産業省 情報大航海プロジェクト 専門委員 (2009年)
株式会社ミログ 技術顧問 (2009年-2010年)
国際標準化団体 OASIS UIMA 委員会委員 (2007年-2010年)

所属学会

言語処理学会 正会員
 ACL (Association for Computational Linguistics) Member
 ISCB (International Society for Computational Biology) Member

業績一覧

査読付き雑誌論文

Original Papers

Y. Kano, M. Miwa, K. Cohen, L. Hunter, S. Ananiadou, and J. Tsujii, U-Compare: a modular NLP workflow construction and evaluation system. IBM Journal of Research and Development, vol. 55, no. 3, pp. 11:1-11:10, 2011.
[IEEE Explore]

Kano, Yoshinobu, Paul Dobson, Mio Nakanishi, Jun'ichi Tsujii and Sophia Ananiadou. Text Mining Meets Workflow: Linking U-Compare with Taverna. Bioinformatics. 26(19). pp. 2486-2487, Oxford Journals, October 2010.
[Journal Website]

Sætre, Rune, Kazuhiro Yoshida, Makoto Miwa, Takuya Matsuzaki, Yoshinobu Kano and Junichi Tsujii. Extracting Protein-Interactions from Text with the Unified AkaneRE Event Extraction System. Transactions on Computational Biology and Bioinformatics (TCBB), 7(3), pp. 442-453, 2010.

Kim, Jin-Dong, Tomoko Ohta, Sampo Pyysalo, Yoshinobu Kano and Jun'ichi Tsujii. Extracting bio-molecular events from literature - the BioNLP09 shared task. Computational Intelligence. 2010. (in print)

Kano, Yoshinobu, William A. Baumgartner Jr, Luke McCrohon, Sophia Ananiadou, K. Bretonnel Cohen, Lawrence Hunter and Jun'ichi Tsujii. U-Compare: share and compare text mining tools with UIMA. Bioinformatics. 25(15). pp. 1997-1998, Oxford Journals, May 2009.

Review Papers

T. Katayama, K. Arakawa, M. Nakao, K. Ono, K. Aoki-Kinoshita, Y. Yamamoto, A. Yamaguchi, S. Kawashima, H.-W. Chun, J. Aerts, B. Aranda, L. Barboza, R. Bonnal, R. Bruskiewich, J. Bryne, J. Fernandez, A. Funahashi, P. Gordon, N. Goto, A. Groscurth, A. Gutteridge, R. Holland, Y. Kano, E. Kawas, A. Kerhornou, E. Kibukawa, A. Kinjo, M. Kuhn, H. Lapp, H. Lehvaslaiho, H. Nakamura, Y. Nakamura, T. Nishizawa, C. Nobata, T. Noguchi, T. Oinn, S. Okamoto, S. Owen, E. Pafilis, M. Pocock, P. Prins, R. Ranzinger, F. Reisinger, L. Salwinski, M. Schreiber, M. Senger, Y. Shigemoto, D. Standley, H. Sugawara, T. Tashiro, O. Trelles, R. Vos, M. Wilkinson, W. York, C. Zmasek, K. Asai, and T. Takagi
The DBCLS BioHackathon: standardization and interoperability for bioinformatics web services and workflows. Journal of Biomedical Semantics, 1(1), 8. 2010.

査読付き国際会議論文

Kano, Yoshinobu, Ruben Dorado, Luke McCrohon, Sophia Ananiadou and Jun'ichi Tsujii. U-Compare: An integrated language resource evaluation platform including a comprehensive UIMA resource library. In the Seventh International Conference on Language Resources and Evaluation (LREC 2010). Valletta, Malta, pp. 428--434, European Language Resources Association (ELRA), May 2010.

Sætre, Rune, Kazuhiro Yoshida, Makoto Miwa, Takuya Matsuzaki, Yoshinobu Kano and Jun'ichi Tsujii. AkaneRE Relation Extraction: Protein Interaction and Normalization in the BioCreAtIvE II.5 Challenge. In the BioCreative II.5 Workshop 2009 special session | Digital Annotations. Madrid, Spain, pp. 33, CNIO, October 2009.

Kim, Jin-Dong, Tomoko Ohta, Sampo Pyysalo, Yoshinobu Kano and Jun'ichi Tsujii. Overview of BioNLP'09 Shared Task on Event Extraction. In the Proceedings of the BioNLP 2009 Workshop Companion Volume for Shared Task. pp. 1--9, 2009.

Kano, Yoshinobu, Luke McCrohon, Sophia Ananiadou and Jun'ichi Tsujii. Integrated NLP Evaluation System for Pluggable Evaluation Metrics with Extensive Interoperable Toolkit. In the Software engineering, testing, and quality assurance for natural language processing workshop (SETQA-NLP), NAACL-HLT. Boulder, Colorado, USA, pp. 22-30, June 2009.

Kano, Yoshinobu, Ngan Nguyen, Rune Sætre, Kazuhiro Yoshida, Yusuke Miyao, Yoshimasa Tsuruoka, Yuichiro Matsubayashi, Sophia Ananiadou and Jun'ichi Tsujii. Filling the Gaps Between Tools and Users: A Tool Comparator, Using Protein-Protein Interactions as an Example. In the Proceedings of The Pacific Symposium on Biocomputing (PSB). (13). Hawaii, USA, pp. 616-627, January 2008.

Kano, Yoshinobu, Ngan Nguyen, Rune Sætre, Kazuhiro Yoshida, Keiichiro Fukamachi, Yusuke Miyao, Yoshimasa Tsuruoka, Sophiha Ananiadou and Jun'ichi Tsujii. Towards Data And Goal Oriented Analysis: Tool Inter-Operability And Combinatorial Comparison. In the Proceedings of the 3rd International Joint Conference on Natural Language Processing (IJCNLP). Hyderabad, India, pp. 859-864, January 2008.

Kano, Yoshinobu, Ngan Nguyen, Rune Sætre, Keiichiro Fukamachi, Kazuhiro Yoshida, Yusuke Miyao, Yoshimasa Tsuruoka, Sophia Ananiadou and Jun'ichi Tsujii. Sharable type system design for tool inter-operability and combinatorial comparison. In the Proceedings of the First International Conference on Global Interoperability for Language Resources (ICGL). Hong Kong, pp. 122-129, January 2008.

国内発表等

狩野 芳伸, 橋田浩一. 日本語言語資源の相互運用.
言語処理学会全国大会, 豊橋技術科学大学. March 2011.

狩野 芳伸, 辻井 潤一. UIMA を基盤とする相互運用性の向上と自動組み合わせ比較国際共同プロジェクト U-Compare. 情報処理学会自然言語処理研究会(IPSJ-NL-186). pp. 37-42, July 2008. (in Japanese).

狩野 芳伸, 宮尾祐介, 辻井潤一. 純粋な逐次処理による構文解析での探索候補数の削減. 情報処理学会研究報告, 2006-NL-175, pp.113-118, September 2006.

招待講演等

Yoshinobu Kano. UIMA based solution and U-Compare.
Invited tutorial, Text Mining Hands-on course and Training seminar. EBI (European Bioinformatics Institute), Hinxton, Cambridge, UK. October 2010.

狩野 芳伸. 自然言語処理プラットフォームの現状と利用.
英語コーパス学会第36回大会シンポジウム招待講演, 東京大学駒場キャンパス, 2010年10月.

狩野 芳伸. U-Compare: ユーザのための統合自然言語処理システム. 医療情報学若手の会. 東京大学附属病院, 2010年8月.

狩野 芳伸. ユーザのための統合自然言語処理システムU-Compare.
名古屋地区自然言語処理セミナー招待講演, 名古屋大学, 2010年8月.

Yoshinobu Kano, Sophia Ananiadou. U-Compare: an interoperable platform for sharing and evaluating text mining components.
LREC 2010 workshop on Language Technology issues for International Cooperation. Malta, June 2010.

Yoshinobu Kano. U-Compare: an integrated natural language processing platform based on UIMA (Multi-language integration).
Seminar in Department of Computer Science. Ho-Chi-Minh city University of Natural Sciences, Viet Nam. August 2009.

Yoshinobu Kano. U-Compare: an integrated natural language processing platform based on UIMA (BioNLP).
Seminar in Department of Computer Science. KAIST, Korea. July 2009.

Yoshinobu Kano. U-Compare: an integrated natural language processing platform based on UIMA (link with Taverna).
Nactem Seminar Series. National Centre for Text Mining, University of Manchester, UK. July 2009.

Yoshinobu Kano. U-Compare: an integrated natural language processing platform based on UIMA (Oscar Integration).
Oscar and Ospin Workshop. University of Cambridge, UK. July 2009.

狩野 芳伸. U-Compare: an integrated natural language processing platform based on UIMA (U-Compare: UIMA を基盤とする統合自然言語処理環境).
IBM東京基礎研究所, NLP Professional Interest Communities Seminar. IBM大和事業所, 2009年5月.

狩野 芳伸. 国際共同プロジェクト U-Compare: UIMA を基盤とする統合自然言語処理システム.
東京大学大学院新領域創成科学研究科 高木研究室セミナー. 東京大学柏の葉キャンパス, 2009年2月.

狩野 芳伸. U-Compare: share and compare tools with UIMA.
ライフサイエンス統合データベースセンター テキストマイニングチーム勉強会. 2008年10月.

狩野 芳伸. UIMA を基盤とするツール間相互運用性の向上.
言語グリッドプロジェクト全体会議. NICTけいはんな研究所, 2007年9月.

技術報告等

Ngan, Nguyen, Yoshinobu Kano, Jun'ichi Tsujii. Tsujii Lab Tools for UIMA. Technical Report (TR-NLP-UT-2006-7). Tsujii Laboratory, University of Tokyo, 2006.