SREはサイバネティクスの夢を みるか? ークラウドにおけるテレメトリー技術の 博士論文とその後
情報処理学会 第18回 インターネットと運用技術シンポジウム 招待講演
坪内 佑樹 (@yuuk1t) さくらインターネット研究所
1948年初版のウィーナー著『サイバネティックス』には,制御できない変量と調節できる変量があるとき,制御できない変量の過去から現在までの値に基づいて調節可能な変量を適切に定め,われわれにとって最も都合のよい状況をもたらしたいという望みを実現する方法がCyberneticsであると記されています.現代のクラウドにおけるシステム運用の最先端であるSRE(Site Reliability Engineering)の深化を通じて,私はこの望みの実現を今も探究し続けています.本講演では,その探究の中核である「テレメトリー」,すなわちシステムの状態に関する変量を計測する技術を基軸とした私の博士論文とその後の研究を紹介します.具体的には,テレメトリーデータ量の増大がもたらす副作用,AIによる運用自動化,そしてAIスーパーコンピュータそのものを支えるテレメトリー技術について論じます.加えて,9年前のIOTS2016で招待講演を務めさせていただいた後,エンジニアから研究者へと転向し,博士号を取得するまでの道中での思索についても交えたいと思います.