タイトル:安全性を考慮した強化学習:基礎から応用まで
講演者:和地 瞭良氏(LINEヤフー株式会社 LINEヤフー研究所 Chief Research Scientist)
概要:強化学習とは、機械学習の一分野であり、AlphaGo等のゲームAIでその性能の高さが証明されるにつれ、盛んに研究されてきた。一方で、強化学習は、報酬関数という一元的な指標に基づいて方策を試行錯誤的に学習するため、実応用上は安全性の懸念がある。本講演では、安全性を考慮した強化学習に関する基礎を解説したのち、言語モデルのアライメント等への応用例について紹介する。
- 日時
-
2024年12月6日(金)18:00~20:00
- 場所
-
オンライン開催
- 主催
-
共催(HRAM 日本応用数理学会 D-DRIVE全国ネットワーク)
- 参加費
-
無料(事前登録要)
https://www-mmds.sigmath.es.osaka-u.ac.jp/structure/activity/ai_data.php?id=84
- web
-
https://www-mmds.sigmath.es.osaka-u.ac.jp/structure/activity/ai_data.php?id=84
- 問合せ先
-
大阪大学 数理・データ科学教育研究センター
鈴木 貴
suzuki@sigmath.es.osaka-u.ac.jp