よかろうもん!

アプリからインフラまで幅広くこなすいまどきのクラウドエンジニアが記す技術ブログ

インフラエンジニア討論会に参加してきた!

パソナテック10周年記念 PTカンファレンスVol.6 インフラエンジニア討論会2008〜インフラエンジニア進化論〜』に参加してきました。
討論会の内容を簡単にまとめてみましたので、このブログの情報が参加されていない方のインプットとなれば幸いです。

パネラー紹介

楽天株式会社 和田さん id:wadap (Unix的なあれ)

・得意分野
 ・apache関連
 ・storage関連

・仕事
 ・台湾システムの運用
  ・キーはネットワーク遅延

・最近の興味
 ・ストレージと仮想化
 ・iSCSIストレージ

・私個人が感じたこと
 ・とにかく技術が好きそう

株式会社スカイホビット 越川さん

・仕事
 ・物理運用からソフトウェア(M/Wかな)の運用まで
 ・OSSを利用した運用
  ・BigBrother,Hobbit,Xymon
  ・MRTG
  ・Tripwire

・最近の興味
 ・個人のスキルに依存した運用
  ・世の中の動きと矛盾しているが、担当者の創意工夫でやる気&組織改善を実現したい
 ・壊れない機械の利用
  ・HDDは壊れやすいのでSSDがおすすめ

・私個人が感じたこと
 ・個人のスキルに依存した運用について共感
  ・設計方針など最低限は共有し、それ以降は個人スキルに依存するようにすればエンジニアも成長

株式会社ミクシィ 長野さん id:kazeburo

・得意分野
 ・Perl
 ・memcached
 ・Q4M
・仕事
 ・システム運用の中のアプリ運用
  ・mixiアプリの運用
  ・スケーラビリティ・性能・可用性向上
  ・セキュリティ
 ・画像配信システムの構築
 ・アプリケーションのバックエンド部分についてはコードを書いたりもしている

・最近の興味
 ・非同期処理、分散処理
  ・大規模なデータ処理のためのプラットフォームの整備

・私個人が感じたこと
 ・Perl好き
 ・とにかく技術が好きそう(若い頃から技術に触れているとのことなので)

モトローラ株式会社 石原さん

・得意分野
 ・ネットワーク

・仕事
 ・エンジニアというよりプランナー
  ・より顧客よりに
  ・モノ作りから流れづくりに
   ・世の中を動かす

・最近の興味
 ・アジャイル開発
 ・プラットフォーム化

株式会社paperboy&co. 宮下さん id:mizzy

・得意分野
 ・Perl
  ・CPANPlagger、Remedia(コミッタ)
 ・puppet

・仕事
 ・サービスの開発から運用まで
 ・最近は現場から少し離れている

・最近の興味
 ・サーバのキャパシティ・プランニング
  ・書籍:The Art of Capacity Planning
 ・分散コンピューティング

・モットー
 「できないから、やらない」ではなく、「やらないから、できない」

討論会の内容

『■』が準備されていたがテーマとなります。
テーマについての討論内容を『■』以下にまとめておきます。
討論会の進行中に、パネルディスカッション・モデレーターである馮さんが質問された内容については、『◇』で記載しておきます。

インフラエンジニアのやりがいは?
 和田さん
 ・「root権限を持っている=もっとも偉い」と思っている

 長野さん
 ・サービスがうまくいったときにやりがいを感じる
  ・自分が思っていた通りになったとき

インフラエンジニアとは?
 宮下さん
 ・開発とサーバ管理(M/Wを含む)と関わっている人たち
 長野さん
 ・ネットワーク系、ミドルウェア系、データベース系に携わっている人たち
 越川さん
 ・何でも屋さん(特定の領域だけでない)
 石原さん
 ・設計などについてもフィードバックできる人たち

 『何か起こってもそれに対応できるように、常にいろいろと考えておくことが大切』


大規模サイトの運用(スケールアップ・スケールアウト)
 長野さん
 ・インフラ運用とアプリ運用を合わせて10人程度で回している
 ・echoなどのサービスを提供する前には、多めのサーバを事前に配置しておき、徐々に減らしていくようにしている
 ・毎年1月1日の0:00頃のアクセスがもっとも多い(writeかな?)
 ・チャレンジングなことをするために、瞬間的なサービス停止は仕方ない
  ・絶対にサービスダウンしてはいけないかというとそうではないと考えている

 和田さん
 ・チャレンジングなことをするよりもサービスダウンするなという方針
 ・運用は100人規模
 ・毎年、年末に向けてシステム増強を実施
 ・メディアで放送がある時には、サーバにログインしtopコマンドで状況を見ることもあった

 宮下さん
 ・ホスティングサービス(ロリポップ)は、如何に他のユーザに迷惑をかけないようにするかが大切

新しいサービスを提供する際にアクセスが増えると思うが、どういった対策をしているか?
 長野さん
 ・営業部とシステム運用グループが情報をやりとりして、PV数の予想をしている
 ・モバイルのトラフィックが多いが、それほどトラフィックが劇的に大きくなることはない
 和田さん
 ・営業部とシステム運用グループが情報をやりとりして、PV数の予想をしている
 宮下さん
 ・個人がどういう使い方をするかわからないので、予想できないという状態

スケールアップ・スケールアウトの判断基準は?
 長野さん
 ・ユーザのデータがどんどん溜まっていくものはスケールアップ

インフラエンジニアを実感した瞬間は?

一流と二流の違いは?
 和田さん
 ・当たり前のことが体に染み付いていること
  ・プロセスが上っているかpsで確認したり、cpコマンドでiオプションをつけたりなど
 ・どんな時でも平常心で作業できる

 宮下さん
 ・対象のサーバに直接ログインしなくてもよい環境を作るように心がけている人
  ・自動起動で全サービスが立ち上がるようにするなど

インフラの重要性をどのように伝えてきたか?
 越川さん
 ・監視システムを作ったり、作業を自動化したりして、インフラが重要だと思われないような体制を作っておく

 和田さん
 ・会社として評価するような仕組みは用意されていない
 ・業務時間外に勉強会を開催
  ・技術を直接触っていない人も誘っている(ディレクターなども)
 ・自分らが動かしているものに興味をもってもらうようにインフラエンジニアの方から語りかける

おすすめの運用管理ツールは?
 越川さん
 ・監視ツールであるHobbit
  ・監視ツールはデファクトスタンダードがない状況
  ・Hobbitは設定が簡単
  ・Nagiosは見た目もかっこいいが、設定が難しいところがある

今使っているツールは?
 和田さん
 ・台湾のシステムに限った話
  ・監視でZabbix
   ・セットアップが楽
  ・プロセス監視でMonitを利用

 長野さん
 ・Nagios
  ・プログラムを書いて、設定ファイルの自動生成するようにしている
 ・RRDtool

 宮下さん
 ・Puppet
  ・サーバにインストールするパッケージや設定ファイルの変更などを自動化
  ・変更管理も実施できる
 ・Archer
  ・CapistranoPerl実装
  ・一連の処理タスクを記述

野良監視スクリプトの管理はどのようにしているか?
 宮下さん
 ・なるべく野良スクリプトは排除
  ・監視などはスクリプトではなく、Nagiosで監視するようにしている
  ・スクリプトなどはSubversionで管理するようにしている

 越川さん
 ・野良スクリプトを積極的に外部公開し、野良でなくすることも…


気になるあのサービスは?
 宮下さん
 ・30 days album
  ・フロントはRailsだが、あとはPerlで実装
  ・ストレージはモバイルストレージ
  ・インフラエンジニアは如何にフロント担当の人と連携するかがキーとなる

 和田さん
 ・Shifter?
  ・シフト管理をシンプルにする

インフラ側からみてサービスとは?
 和田さん
 ・メールを減らしたいのでRSS配信しようかと試みている
 ・老若男女問わず誰でも利用できるものにしたい

インフラエンジニアの働き方とは?
 宮下さん
 ・「
  ・直接サーバにログインしなくて済むようにしておく
  ・楽しむことが大切で、楽しめる人がインフラエンジニアに向いている

 石原さん
 ・「ネットワークの酸素

 長野さん
 ・「地図に残る仕事
  ・やっている自分たちがプライドをもっている
  ・主人公はアプリ開発をしている人たち
   ・その裏でどれほど開発しやすい環境を作ることができるか

 越川さん
 ・「オールラウンドプレイヤー
  ・エースで4番ではなく、地道に調査や問題解決をして、いろんな知識を増やす
  ・この人がいないと困るというようなステータスでいれるとよい

 和田さん
 ・「サービスの最前線
  ・表にはでないし、辛い部分もあるが、一緒にサービスを作っている&運用しているのか

Q&A

パラダイムシフト(クラウドや仮想化技術)が起きているが、インフラエンジニアはどのような対応しているのか?また、インフラエンジニアの立ち位置は変わると思うか?

 YES:和田さんのみ
 和田さん
 ・個人的にはインフラエンジニアは減っていくと考えている
  ・運用を楽にするために仮想化などは

 NO:越川さん、長野さん、石原さん、宮下さん

 ・宮下さん
  ・要素技術は変わらない
  ・場所がクラウドのところにかわっていくだけ
  ・すぐにクラウドになるわけではない
   ・セキュリティ、プライバシーの扱いなどまだまだ課題は多い

ネットワーク層でのインフラ対応はどのようにされている?
 長野さん
 ・ネットワークの帯域の問題については、帯域の何%を使用したら拡張するという方針を事前に決めている

 和田さん
 ・数字を決めて増強するようにしている
 ・プロバイダとのやりとり(台湾とのやりとりでパケットロスが発生)では、経路変更などを実施したりしている

インフラエンジニアの社内評価は数値化しにくいが、評価体系はどのようになっている?

 宮下さん
 ・評価する立場
  ・今後、サービスの稼働率(クオリティ)を評価対象としようと考えているが現在は模索中

 石原さん
 ・システムの最適は常に変化する
  ・オーバースペックなら無駄を省く
  ・ミニマムスペックなら増強を考える 
  ・これらに対して提案など積極的な動きが評価につながると考えている