Upgrade to Pro — share decks privately, control downloads, hide ads and more …

OpenStackで拡げる○○○な世界~HPE Helion の歩みとこれから~

OpenStackで拡げる○○○な世界~HPE Helion の歩みとこれから~

Avatar for thatsdone

thatsdone

July 07, 2016
Tweet

More Decks by thatsdone

Other Decks in Technology

Transcript

  1. Agenda HPE Helionの戦略: Right Mix 1 HPE Helion OpenStack 3.0

    2 デリバリの現場より ~切り分け君の心得とは~ 3 2 まとめ 4
  2. 自己紹介 3 伊藤 雅典 (いとう まさのり) 略歴 日系総合電気メーカー (~2004) 大手SIer

    (~2014) 2010年から OpenStack にかかわる 日本ヒューレット・パッカード (現在に至る) Helion Professional Services (post sales) 所属, 肩書きは Solutions Architect APACのお客様向けの各種構築案件対応  オープンソース とのかかわり Linux kernel から OpenStack、その上に載せるものまで何でも (トラブル含む…orz)  趣味 子育て
  3. HPE Helionの戦略: Right Mix It’s Time to Transform to Hybrid

    Infrastructure 19% Public Cloud 81% Private Cloud
  4. アプリケーションがアイデアエコノミーを推進 SLA、SLA、SLA 規制 レイテンシ ディザスタトレランス 信頼性 収益 市場投入期間 カスタマーエクスペリエンス 需要の急増

    パフォーマンス 統合 コンプライアンス データ移植性 セキュリティ コスト 従来型アプリケーションと新しいスタイルのアプリケーションにわたる何百もの多様な要件
  5. 価値を創出し、新旧の環境を橋渡しする役割を求められるIT部門 コストの抑制 成果の実現 システムとネットワーク の強化 リスクの管理と 低減 ワークロードとサービスの 効率的な管理 新しいサービスの継続的な

    創出と提供 データの保存と管理 ソフトウェアによるビジネス システムの自動化 サービスのパフォーマンス とビジネスニーズの整合 リアルタイムの情報の提供と 把握
  6. ”Right Mix”の実現例 Private IaaS / 仮想化基盤 商用OS 商用 アプリ ユーザ作成

    アプリ オープンソース OS ユーザ作成 アプリ オープン ソースアプリ Public Cloud オープンソース OS オープンソース OS ユーザ作成 アプリ オープン ソースアプリ 従来型OS、商用アプリの受け 皿 •フリーLinux上で起きた不具 合を再現し、OSベンダーのサ ポートを得る •コンパクトに保つ、集約する クラウドネイティブアプリの受け皿、大胆なコスト削減と迅速 性/柔軟性/拡張性の劇的な向上 •規模拡張してもアプリのライセンスを気にする必要はない •アプリケーションのライフサイクルと変動するワークロード に柔軟に対応 •新たに作るアプリはこちらを優先 安心を目指す 従来型システム Private PaaS ユーザ作成 アプリ オープン ソースアプリ ビジネス改革を目指す クラウドネイティブアーキテクチャ コスト削減を目指す OSSの活用 従来型アーキテクチャにOSS を活用することでコストを削 減 Mode 1 Mode 2
  7. © Copyright 2015 Hewlett Packard Enterprise Development LP.2015 Internal Use

    Only (社外秘)。本書の内容は、将来予告なく変更されることがあります。 HPE Helionポートフォリオ
  8. © Copyright 2015 Hewlett Packard Enterprise Development LP.2015 Internal Use

    Only (社外秘)。本書の内容は、将来予告なく変更されることがあります。 HPE Helionポートフォリオ
  9. HPE Helion OpenStack概要 -商用環境のニーズに応えるOpenStackディストリビューション 既存IT資産の活用 • HPEサーバ・非HPEサーバに関わらずインス トール可能 • ネットワーク・ストレージにおける3rdパーティ

    製品対応をさらに拡大 • 既存の運用・監視ツールとの統合を考慮 シンプルなインストーラ・運用機能 セキュリティ・保護機能の強化 • セキュリティ強化された”Linux for HPE Helion” • 標準でコントローラノードのHA化とバックアップ・リ ストア機能を搭載 • 要件に応じたネットワークトラフィック分離/NIC bondingが可能 • クラウド基盤の企画/検証/導入からサービス 立ち上げ/運用までOpenStackエキスパートチー ムがお客様を強力に支援 • OpenStackコミュニティにおけるリーダシップ • 24x7グローバルサポート • 新たなWeb UIインストーラを搭載 • 新しいOpsConsoleによる管理の可視化・一元化 • ダウンタイムのないアップデート・アップグレード • 運用管理機能をAnsibleで自動化 お客様への各種支援サービス “オープンソースOpenStack”との互換性を損なわずに、エンタープライズ向け クラウドコントローラとして、数々の機能やサポート体制を強化した進化型の OpenStackディストリビューション 21
  10. HPE Helion OpenStack 3.0 ブロック構成図 23 OpenStack (Liberty) Plug-ins HPE

    Value-add (Open Source) UI UI Running Environment Operations Environment Infrastructure Services Identity Service (Keystone) Physical Infrastructure – Servers, Networking, Storage Operational Services Deployment (Ansible) Service  Deployment Artifacts  Boot Images  Service Playbooks  Deployment Templates Sub Systems Object (Swift) Storage Service Image (Glance) Library Service Compute (Nova) Service Network (Neutron) Service Block Storage (Cinder) Service Linux for HPE Helion (Debian) Operations (OpsConsole) Dashboard RH KVM FC Local LDAP/AD Swift OpenStack Dashboard (Horizon) ESX iSCSI LHN 3PAR VMDK Storage (StoreVirtual Dashboard CMC) Key Management Service (Barbican) DVR VXLAN VLAN Bare Metal (Cobbler) Provisioning Service Metering Service (Ceilometer) OVSvApp IPMI PXE Ceph ML2 Network Services DNS (DNSaaS) Service DNSaaS Recovery (Freezer) Management (Backup/Restore Scripts) Service Fail-over Management (HAProxy, Keepalived) MySQL Rabbit MQ Centralized Logging (Logstash, ElasticSearch) Infrastructure Monitoring Service (Monasca) HTTPS Termination (Stunnel) Logstash Monasca FW (FWaaS) Service VPN (VPNaaS) Service Federation Configuration Processor LB (LBaaS) Service Vertica Nova ESX (EON) Configuration Logging Search (Kibana) Dashboard HPE Value-add (HPE Assets) UEFI Day Zero Installer LBaaS VPNaaS FWaaS VSA Swift Ceph InfluxDB KVM Orchestration Service (Heat) Octavia Bare Metal Service (Ironic)
  11. HPE Helion OpenStack 3.0 仕様 24 HPE Helion OpenStack 3.0仕様

    OpenStack 《Liberty》 (HPEによるコードの変更はありません) Identity(Keystone)、Image(Glance)、Compute(Nova)、Block Storage(Cinder)、Object Storage(Swift)、Networking(Neutron)、Dashboard(Horizon)、Orchestration(Heat)、 DNSaaS(Designate)、LBaaS(Octavia)、FWaaS、VPNaaS、Metering(Ceilometer)、Bare Metal Provisioning(Ironic)、Key Management(Barbican) サポートハイパーバイザー Linux for HPE Helion KVM(バンドル)、VMware ESX、Red Hat KVM サポートストレージ HPE StoreVirtual VSA/P4000(バンドル)、HPE StoreServ 3PAR、Ceph(バンドル) All 3rd party Liberty Cinder block storage drivers サポートネットワーク Open vSwitch for KVM、Open vSwitch vApp for ESX サポートサーバー Debianが動作するx86サーバーで、 認定プログラムによるH/Wテスト (http://helionready.hpcloud.com/ihv )によって動作確認が可能 コントロールプレーン冗長化 HAProxy、keepalived、RabbitMQ Cluster、MySQL Galera Cluster インフラモニタリング,ログ管理 Monasca、ELK(Elasticsearch/Logstash/Kibana) その他運用支援機能 Operations Consoleによるcloudのステータスやパフォーマンス監視 Freezer によるコントロール・プレーンのBackup/Recovery Gitリポジトリによる構成バージョンの管理とアップデート
  12. HPE Helion OpenStack 3.0 のメリット Based on “Liberty” release of

    OpenStack Expanded app support – Red Hat KVM のサポートを追加 Linux for HPE Helion KVM と ESXあわ せて。計3種類のハイパーバイザーを サポート – ベアメタル・サーバーのプロビジョニン グ – 1リージョン内のコンピュートノードでマ ルチハイパーバイザーを サポート – VMのライブ・マイグレーション 機能 をサポート Manageability – VM の死活監視やパフォーマンスモニ タリング – オペレーションコンソールから、コン ピュートノードの追加/削除が可能 – コンピュートノード 200台まで拡張可能 – 課金情報の元となるメータリング 機 能 – 3rd partyのビリングシステムが利用可 能 Security – PCI 準拠システムの構築が可能 (PCI ready、PCI準拠ではない) – データの暗号化(Barbican) – KMIP 暗号鍵デバイスが統合可能 – 内部間通信もTSLで暗号化 (external already supported) – Hardening & Auditing インストール時にランダムパスワード を生成。監査ログの取得 – ポリシー設定によるロールベースのア クセス制御が可能 – パスワード管理機能の拡張 ランダムなデフォルトパスワードの変 更がHLMから可能 (Horison,OpsConsole,Kibana) Enterprise grade – CVR mode使用時のVRRP対応 – Zoneをまたいだデータ・リプリケーショ ンでデータを保護 – Pluggable IPAMにより、3rd Party製の IPAM(IPアドレス管理)が利用可能 25
  13. HPE Helion OpenStack 3.0 構成例 Nova Glance Cinder Neutron Horizon

    Initial Swift Nova compute Heat Keystone deploy Novaコンピュートノード ブロックストレージノード VSA コントローラ・管理ノード サブスクリプション必要 (5サーバー分) サブスクリプション不要 – compute node x2台 – cinder node x3台 必要サーバー台数 計 8台 • seed vm / Under Cloud が不要 (seed vm のOS:Ubuntuも 不要) Helion Lifecycle Management 26
  14. Transform Advise HPE Helion Professional Services • クラウド戦略立案支援 • アセスメント

    • コンサルティング • アプリケーション移行 • クラウド基盤設計 • クラウド基盤構築 • クラウド技術支援 Manage • 保守 • 運用 • トレーニング • 日本ヒューレット・パッカード株式会社のインフラ 構築部隊(テクノロジーコンサルティング統括 本部)は500人規模の要員を擁しています。 • 2014年、Helion Professional Servicesチームが 発足。 • OpenStackコミュニティへのContributor • OpenStack Summitでの発表者 • OpenStack関連書籍の著者 • JOSUGの中心メンバー といったタレント集団が、お客様のOpenStack 導入プロジェクトに参画します。 OpenStackの専任デリバリー組織としては 国内最大規模。 日本随一の”オープンソース・クラウド”エキスパートチーム HPE Helion Professional Services 30
  15. 切り分け君の心得 現場系 1. 混乱に巻き込まれるな 2. 事実をおさえろ 1. 全体を俯瞰しろ 2. スケールを変えてみろ(時間・空間)

    3. 複雑な問題/事象は、簡単な問題/事象に 分解しろ 3. 理解して使え 1. 本当の問題は何なのか、常に考えろ 2. 何が現象で何が原因なのか? 3. 「なぜ?」は5回くりかえせ 4. 「エイヤ」のセンスを身につけろ 5. 制約は常に意識しておけ 普段の行動系 1. アラームは早めにあげろ 2. 常に勉強しておけ 3. ノウハウは横展開しろ 4. トラブル事例も横展開しろ
  16. 話者が直近2年くらいで遭遇したトラブルたち(のごく一部) RabbitMQがうごいているマシンで disk full がおきた。全系ダウンした ELKいれたはいいが、RabbitMQがダウンした 拠点またがりでGarelaクラスタ組もうって言いはじめた人がいる(((( ;゚Д゚)))) L3-HAの router

    が偏る問題 (F/OはするがF/Bしないので偏ったままになる。Upstrteam問題) tripleo の heat stack の status が ERROR になってしまった(((( ;゚Д゚)))) undercloud にFCの (本当は同一)device が見えてしまって tripleo がコケた…(等々) BFVの一斉起動試験(50VM)したら cinder が刺さった FC multipath が動かない… Compute ノードが kernel panicした! (TSOなどNICオフロード機能がONだった) TCP offload 系のせいで TCP セッションが突然切れる Horizon の volume 操作が「何かがおこって」エラーになる 急にVMのNWスループットが急に低下 or 接続できなくなる(ufwの threasholdにひっかかった) …
  17. トラブル事例(1):FCマルチパスががが…(((( ;゚Д゚)))) 事象 Cinder volume の接続に失敗する or Boot-from-Volumeインスタンスの起動に失敗する 等、見え方はさまざま 調査の経緯

    Cinder/Nova API の操作に伴う、ホスト上の multipath device の状態ほかを逐一確認。 原因 bugdb調査により、Upstreamの linux kernel/multipath-tools/Cinder/Nova それぞれに問題 があることを確認。 結局、Work Around と Cinder/Nova をデリバリ部隊でパッチを作成して対応。 教訓 最後に頼りになるのは自分…(なので、「勉強しておけ」「理解して使え!」)
  18. トラブル事例(2):Horizon のボリューム操作が突然「何かおかしく」なった 事象 Horizon 経由のボリューム操作が「何かがおかしくなりました」で失敗するようになった 調査の経緯 当初、Cinder の API レベルでの挙動を中心に調査。該当するエラーが見当たらず、難航

    Horizon/Apache/Browserも視野にいれ、Chrome の “Developer Tool“ で確認したところ、ボ リューム一覧表示で HTTP 500 が返っていることが判明 原因 Horizon からボリューム操作をする際に一覧のリフレッシュ表示がかかる。多数の Cinder ボリュームがあり、VMから使用中の場合、すべての attach 情報について nova APIが発行 され、非常に長時間かかり、タイムアウト。 ポイント End-to-end の全体像を概観すること
  19. トラブル事例(3):RabbitMQ実行サーバがDISK full 事象 OpenStackが全系ダウン 調査の経緯 ELKでログサーチ。しかし、特に異常なログはない…? RabbitMQ実行サーバで何がDISK容量を使っているのか確認 RabbitMQの状態確認 原因 ログ収集に導入していた

    ELK の、ELKサーバ側の LogStash が落ちていた。このため、ログ を送り出す側がローカルにデータを滞留させていた ポイント 全体を俯瞰すること 個別のサーバで発生している事実を落ち着いて把握すること