プロフィール
東京大学工学系研究科 技術経営戦略学専攻 博士課程在籍 (指導教員: 松尾 豊). 日本学術振興会 特別研究員 (DC1).
興味
- 大規模言語モデル (LLM)
- 言語モデルエージェント (LLM Agent, LM Agent)
- Reinforcement Learning from Human Feedback (RLHF)
- 深層強化学習
- オフライン強化学習
業績
日本語での発表のみ. 英語論文等についてはPublicationsをご覧ください.
総説・解説
- 古田 拓毅. データ中心の視点から捉える深層強化学習. 人工知能, 37(4), 507-515. 2022.
国内会議
佐藤 誠人, 海野 良介, 古田 拓毅, 松嶋 達也, 岡田 領, PAVEL Savkin, 佐野 元紀, 松尾 豊. 画像のMid-Levelな表現による物体操作の模倣学習手法の検討. 人工知能学会全国大会 (JSAI 2022), 2022.
松嶋 達也, 古田 拓毅, 顧 世翔, 松尾 豊. オフラインデータを利用したモデルベース強化学習. 人工知能学会全国大会 (JSAI 2020), 2020.
講演・発表
- 古田 拓毅. Webナビゲーションにおける言語モデルエージェントの展望と課題. 応用機械学習と人工知能セミナー: AIエージェント. Tokyo AI Talks (TAI). 2024.
- 古田 拓毅. Webナビゲーションにおける言語モデルエージェントの展望と課題. NLPコロキウム. 2024.
- 古田 拓毅. 大規模モデルに基づく意思決定エージェントの構築. 2023年中日青年博士フォーラム ー人工知能技術の応用と発展. 2023.
表彰等
- Forbes JAPAN 30 UNDER 30 2023 (2023年 8月)
- 日本学術振興会 特別研究員 (DC1) (2022年 4月 - 2025年 3月)
- 工学系研究科長賞 (2022年 3月)
- トヨタ・ドワンゴ高度人工知能人材奨学金 (2021年 4月 - 2022年 3月)
経歴
- 東京大学工学系研究科 技術経営戦略学専攻 修士課程 修了 (2022年 3月, 指導教員: 松尾 豊)
- 東京大学 工学部システム創成学科 卒業 (2020年 3月, 指導教員: 宮本 英昭)