Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AIデータはどうためる、テープアーカイブの復権

kkojima
November 12, 2020
140

 AIデータはどうためる、テープアーカイブの復権

Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 3」
2020.11.12

テープアーカイブについての俯瞰的なおはなし

kkojima

November 12, 2020
Tweet

More Decks by kkojima

Transcript

  1. ネットワーク ゲートウェイ サーバ AI(学習) データ保存 データ 解析・保存 Camera など 5G,

    LTE または 有線接続サービス 現地機器 AI(推論) データ保存 ハードウェアの配置 この辺にテープ アーカイブ
  2. なんで5G通信が必要? TCP/IP の限界 平均: 9.9 G bit/秒 3.0 PB/⽉ 平均:

    16 M bit/秒 0.0046 PB/⽉ 平均: 1.5 G bit/秒 0.5 PB/⽉ 10Gbps 0 2秒 レイテンシ 170ms レイテンシ170ms + パケットロス0.5% 10Gbps 2秒 10Gbps 2秒 0 0 構内接続に類似 遠距離接続に類似 インターネットに類似 レイテンシが⼤きい環境ではデータが思ったように送られない しかもパケットロスがあると壊滅的になる レイテンシ 1ms以下 10 Gbps で測ってみた!
  3. かつてない⼤量データの保管 データ容量単価が1-2桁変わる IBM TS1160 ネイティブ・データ速度: 400 MB/s テープ1巻あたり最⼤20TB ハードウェア圧縮と LTFS

    をつかうと もうなしでは仕事ができない LTFSとは: テープをUSBメモリのようにマウントできる ようにした標準規格
  4. 100 PB / 40 Gbit x 6 80 TB /

    100 Gbit バルク転送課題: AWSの解決策例
  5. やっぱりネットワーク経由がいい IBM Cloud AS 36351 NTT Docomo NTT AS 9605

    AS 9598 AS 3635 1 AS 3635 1 インターネットや閉域の経路はASというルータがつなぐ それぞれのAS保有者どおしが通⾏料⾦を決めている AS管理者の仲が良ければ通⾏料無料も でもご注意 ! 通⾏料⾦が意外と⾼いことは知られていない クラウドのテープアーカイブサービスの盲点