今年もJTFに登壇します

毎年行われるITエンジニアの祭典JTF(July Tech Festa 2017)に、今年も登壇いたします。今年はJulyではなく8/27(日)開催ですが、会場はいつもの産業技術大学院大学@品川シーサイドです。

昨年はSREの話をご紹介しましたが、今年は趣向を変えて運用ダッシュボードとしてのGrafanaをご紹介します。

内容はこれから考えますが、まずは皆様のお申込みをお待ちしています。

JCLI – JobScheduler Powershell Command Line 紹介記事を公開

JobSchedulerの操作は、WEB GUI(JOC Cockpit)、WEBサービスAPI(REST-JSON/SOAP-XML)、コマンドライン(jobscheduler.sh|cmd)などがありましたが、V.1.10からJCLI(JobScheduler Powershell CLI)が新たに加わりました。
JCLIはPowershellのコマンドレットで作成され、Powershell 2.0以降(Windows7以降)であれば動作します。(もちろんLinux/Mac環境ではまだサポートされていませんが、Powershell 6.0ではLinux/Macもサポートされる予定なので楽しみです)

JCLIの概要は以下のとおりです。

  • 既存コマンドラインの置き換え
    – .\bin\jobscheduler.sh|cmdコマンド
    – .\bin\jobeditor.cmdコマンド
    – .\bin\jobscheduler_event.cmd
  • 一括操作
    – 従来のWEB GUIやWEBサービスAPI、コマンドラインでは難しかった、JobSchedulerオブジェクト(jobs, job chains, orders, tasks, event)に対する開始・停止・作成・削除などの操作を一括で実行
  • エージェント管理
    • エージェント状態の取得
    • Windowsサービスのインストール・アンインストール

http://qiita.com/satoruf/items/4b721cd91e5483cb6409

Site Reliability Engineering (SRE)について

Googleが提唱し始めたSite Reliability Engineering (SRE)という考え方が最近注目されるようになってきています。もともと、Googleの運用部隊を率いているBen Treynorが始めた考え方でしたが、これまで明確な定義がなくいろんな人がいろんな言い方をしていたのですが、今年オライリーから「Site Reliability Engineering – How Google Runs Production Systems」という公式な書籍が出版されましたので、紹介資料を作ってみました。

昨日開催された、July Tech Festa 2016Site Reliability Engineering (SRE)で拡がる運用の世界 - Googleでの展開から、エンタープライズへの夢は見れるかとして講演した資料です。

内容をかいつまんでご紹介すると、GoogleでのSREとは、製品開発チームと人材を共有し、サービスの信頼性を上げるためのあらゆる方法を開発している組織であり、単なるDevOpsだけにとどまらない内容です。もちろんGoogleのサービスを支えるシステムは、世界最大級の分散処理システムであり、かつソフトウエアからハードウェアやデータセンター、ネットワークに至るまでほとんど独自開発のものを使用している特異な環境ですが、普通のエンタープライズIT環境にも通じる考え方があるのではないかと思っています。

 

元ネタのオライリー本は残念ながら英語版だけで500ページ以上の大部ですが、インフラ関係者には一読をお勧めします。

OpenPIEを公開しました

 

データセンター向け運用管理自動化基盤として弊社が開発した、OpenPIEのソースコードをGithubに公開しました。インストール方法や使用方法も掲載していますので、ぜひお試しください。https://github.com/oss-laboratries/OpenPIE

OpenPIE (Open Programmable Infrastructure Environment)とは、オープンソースのクラウド/データセンター運用自動化基盤です。 ポータル、システム監視、構成管理、ジョブ管理、チケット管理などの様々なツールを組み合わせて、自動連携することを可能にするツールチェーンです。 構成コンポーネントはAPIによる疎結合構造になっていますので、必要な機能だけ選んで使用できます。対象とするシステムは、VrirtualBox、AWSなどのパブリッククラウドから、オンプレミスのVMware、OpenStack環境まで対応予定です。OpenPIEの目的は運用自動化そのものではなく、すべてのオペレーション、機器情報や障害対応を記録し、情報共有・分析によるSRE (Site Reliability Engineering)を可能にすることです。