プロフィール
Research Scientist at Google DeepMind, Japan. 博士(工学).
興味
- AIエージェント, 言語モデルエージェント (AI Agent, LLM Agent)
- AIアラインメント (AI Alignment, RLHF)
- 機構的解釈性 (Mechanistic Interpretability)
- 大規模言語モデル (LLM)
- 深層強化学習・ロボット学習
業績
日本語での発表のみ. 英語論文等についてはPublicationsをご覧ください.
総説・解説
- 古田 拓毅. データ中心の視点から捉える深層強化学習. 人工知能, 37(4), 507-515. 2022.
国内会議
峰岸 剛基, 古田 拓毅, 谷口 尚平, 岩澤 有祐, 松尾 豊. 文脈内学習による多段階回路の形成. 人工知能学会全国大会 (JSAI 2025), 2025.
大島 佑太, 古田 拓毅, 鈴木 雅大, 松尾 豊. ビーム探索を用いた動画拡散モデルの推論時アラインメント. 人工知能学会全国大会 (JSAI 2025), 2025.
佐藤 誠人, 海野 良介, 古田 拓毅, 松嶋 達也, 岡田 領, PAVEL Savkin, 佐野 元紀, 松尾 豊. 画像のMid-Levelな表現による物体操作の模倣学習手法の検討. 人工知能学会全国大会 (JSAI 2022), 2022.
松嶋 達也, 古田 拓毅, 顧 世翔, 松尾 豊. オフラインデータを利用したモデルベース強化学習. 人工知能学会全国大会 (JSAI 2020), 2020.
講演・発表
- 古田 拓毅. Webナビゲーションにおける言語モデルエージェントの展望と課題. 応用機械学習と人工知能セミナー: AIエージェント. Tokyo AI Talks (TAI). 2024.
- 古田 拓毅. Webナビゲーションにおける言語モデルエージェントの展望と課題. NLPコロキウム. 2024.
- 古田 拓毅. 大規模モデルに基づく意思決定エージェントの構築. 2023年中日青年博士フォーラム ー人工知能技術の応用と発展. 2023.
表彰等
- 工学系研究科長賞(研究・博士課程)(2025年 3月)
- Forbes JAPAN 30 UNDER 30 2023 (2023年 8月)
- 日本学術振興会 特別研究員 (DC1) (2022年 4月 - 2025年 3月)
- 工学系研究科長賞(研究・修士課程)(2022年 3月)
- トヨタ・ドワンゴ高度人工知能人材奨学金 (2021年 4月 - 2022年 3月)
経歴
- 東京大学工学系研究科 技術経営戦略学専攻 博士課程 修了 (2025年 3月, 指導教員: 松尾 豊)
- 東京大学工学系研究科 技術経営戦略学専攻 修士課程 修了 (2022年 3月, 指導教員: 松尾 豊)
- 東京大学 工学部システム創成学科 卒業 (2020年 3月, 指導教員: 宮本 英昭)