【ただいま募集中!】 リモート勤務を全社的に推進、働く場所も時間も自分で決められる先進企業の「最高度の自主性が付与されたSRE」の働き方とは?
使い道のない少額のポイントや商品券、外貨などのトークンを、数タップでキャッシュ化し、いつでもどこでも決済できるようにする決済サービス『ポレット』。諦めるしかなかった各種の休眠資産を、まるで現金のように、好きな時に、好きな場所で、自由に使えるように流動化する世界を創り出した。
これらを運営する株式会社オズビジョンがSRE(Site Reliability Engineering)職を募集するという。ご存知のようにSREとはGoogle社が提唱し近年各所で注目されているもので、一般的には「Webサイトやサービスの信頼性向上に向けて取り組むことにより価値向上を目指す方法論」を取り扱う仕事のことを指す。
なぜ今、SRE職をオズビジョングループが募集をするのか。何を期待し何を成し遂げたいと考えているのか。求人票には記されていない背景を探りたく、オズビジョン公式ライターである私が、現在同グループでSRE職を務める開発チームの卜部真一さん(https://www.oz-vision.co.jp/ozmedia/33/)に同グループのSREの特長について聞いた。
自分で考え判断し決定できる
(卜部)たとえばSREとしてあるテーマに取り組んでいるときに「フィットしそうな最新技術の導入を検討してみる」という機会が何度もあります。ハピタスはAWS(Amazon Web Services)を基盤にして運用していますが、AWS関連の新機能が毎月複数リリースされており、その都度SREとして有効性を考えてみたりします。サービス全体を俯瞰し有効と思われる新機能であればSREの使命としてその導入を目指すのは当然でしょう。ところがSREというDevOps双方に影響する領域からの提案は、一般的に全方面で承認を得るのは簡単ではないという現実があります。
特に影響が大きければ大きいテーマであるほど、その決定権は組織の上層にあることが多いでしょうが、その層の全員が技術に精通しているわけではない。疎いケースの方が多いかもしれません。それでいて予算も含めた「決める権限」はその層が持っている。説得のための資料をせっせと作っているうちに技術の導入が遅れて効果が半減する、といったことが往々にしてある。特に大きな組織で見られる現実かもしれません。
その点オズビジョングループのSREである私は自分で考え自分で判断し決定することができています。もちろんマネージャーへの報告や相談はしますが「決めるのはあなた」という基本姿勢でいてくれていますし、今後もそうであると確信しています。責任は伴いますがこの基本姿勢のおかげで本来のSREの存在意義を十二分に発揮することができています。
仕事の範囲が限定されない
(卜部)これはSREだけの話でもないのですが、一般的には、インフラの守備範囲はここからここまで、アプリの守備範囲はここからここまでと決まっており、そこを踏み越えるには膨大なエネルギーが必要な場合多いんですね。踏み越えることがそもそもあり得ない会社もあると思います。エンジニア自身が踏み越えたいタイプなのかそうでないのかは別として、少なくともSREという仕事は全体を把握する仕事でありすなわち踏み越えを前提とする仕事だと思います。オズビジョンのSREに関しては、踏み越えを妨げるような経験は、少なくとも私は一度もしたことはありません。仕事人としてここまでやるという範囲を決めるのも、範囲を超えてでもやると決めるのも私自身がやっています。
どこでどのように仕事をするかを自分で決める
(卜部)私たちオズビジョングループは5年ほど前からいわゆるリモート勤務を積極的に推奨してみました。今年2020年の新型コロナ禍においてはほぼ全従業員がリモート勤務となっており私もこの半年で出社をしたのは1回だけです(2020年9月末日時点)。
前述のようにSREという仕事においては「自分で決めて自分で実行する」「範囲を限定せずにアプローチする」といった点が重要であり、私はそれを満喫させてもらっていますが、リモート勤務を推進していることも後押しとなっているんです。
働く時間も場所も自分で決める。働くか休むのかさえも自分で決める。最大の成果を出すためには時間の使い方も空間の選択の仕方も自分で決める。それが成果を最大化する。なんとなればどうすれば自分の成果が最大になるかを知っているのはあなた自身だから。これが当グループのリモート勤務、完全自律型勤務の哲学です。
そうです。私がSREとして最大の成果を出す秘訣、「自分で決めて自分で実行する」「範囲を限定せずにアプローチする」に、「自分で最適な環境や条件を選択する」というものが加わってくるんです。これはSREという仕事をさらに研ぎ澄ますことに繋がる方法論だと思います。
2020年のコロナ禍におけるリモートワークの激増においては、通勤からの解放といったメリットと同時に、コミュニケーションの遮断などのデメリットも挙げられ、まだまだ整理されていないという段階だ。一方で、これは想像なのだが、もしかすると卜部さんが担うオズビジョングループのSREにとっては、今回のリモートワークの勃興は、むしろ追い風となり、さらに自由度を高めることになり、より最適化を推し進めることになることに繋がっていったのかもしれない。
「グループの基盤構築」という直近の醍醐味が控えている
(卜部)現在当グループにはハピタスとPolletという2つの事業があります。ポイントサイト事業のハピタス、トークンペイメント事業のPollet、それぞれ事業価値を提供させて頂いているわけですが、共通するグループ事業ドメインは「お買いものやお出かけをもっと楽しくするショッピングテイメント企業グループ」であるというものです。企業サイトにもあるように(https://www.oz-vision.co.jp/mission/)「ギルトフリー(罪悪感がない)なお買いものやお出かけ体験をご提供する事業を今後複数展開していく」という方針です。
このグループ事業ドメインのもと、今後はさらにさまざまな新規事業を打ち立てて、それぞれとのシナジーを生み出すことによって、グループ全体の価値を高めていきます。まさにこれからいよいよその領域に踏み込もうとしています。つまり「オズビジョングループのSREが次に挑むことは何か?」「私は近い将来何に取り組めるのか?」というご質問を頂いたならば「まさにグループ全体や各サービスを俯瞰し、技術面における基盤そのものを構築していく事に踏み込み、将来的にグループ事業ドメインを達成することに挑んでいきます」とお答えすることになります。自社のことではあるのですが私はとても挑みがいのあるテーマではないかと思っています。ぜひ優秀な方と共に全力で取り組んでみたいですね。
1つの優れたサービスをさらに磨き上げ強固にし価値を高めていくのは十分に挑みがいのある仕事だろう。たとえば冒頭お伝えしたように、ハピタスには300万人以上のユーザーがついており、年間1000億円のお買い物などが行われているのだ。影響は極めて大きい。
一方、そのような価値を感じて頂けるサービスが、複数発芽し、互いにシナジーを生み出し、イノベーションを生み出し、理想に向かって走り始めたとしたら。そんな未来を見据え、ある意味経営者に等しい視点で、グループの事業基盤を技術面で一気通貫させることができるならば。「今後10年間、その仕事に邁進したい」。こうお思いになる技術者は少なくないだろうと思った。
正しく感謝されるSREである
(卜部)SREとしての仕事はお客さま、私たちで言えばハピタスやPolletのユーザーさまだけでなく、営業やカスタマーサービスのスタッフの業務の効率化などにも資するものです。ただSREがもたらす「信頼性の向上」や「自動化の推進」といったことはそれ自体が際立って目立つことはあまりありません。中長期的な価値を理解し、営業やカスタマーサービスの仕事に照らして、正しく評価される機会は一般的には少ないのかもしれません。
一方オズビジョングループは「Best Team」というクレド(全社で共有している行動基準のこと)を掲げているように、自部署のみならず、部署を超えたリスペクトがきちんと存在していると感じます。営業やカスタマーサービスの方々と連携することもありますが、SREの仕事への理解や感謝を端々に感じることができ、とてもやりがいのある環境だと思いますね。SREとして、エンジニアとして、正しく感謝される組織であることは何よりも幸せなことだと思います。
■他部署のスタッフの声
・サイトの根幹であるサーバー周りのコスト削減や、人気広告のセール時期等に起こる高負荷状態の解消など、エンドユーザー様とクライアント様にとって欠かせない作業を担ってくださって、いつもありがとうございます!(営業スタッフ)
・色々なところでお世話になっていますが、直近では問い合わせ対応に必須となるメールシステムの急ぎの設定、迅速に対応いただき大変助かりました。いつもユーザー様への影響を第一に考えて対応をしていただけるので、ユーザー様の窓口である私たちも安心して業務にあたることができています。(カスタマーサポートスタッフ)
・ハピタスを安定して運営できているのもSREのみなさんのおかげです。大幅なコスト削減も成功して、事業部からの信頼も厚いです。そのほかe-sports部やボルダリング部など、部活動にも積極的に参加されていて、チームの垣根を越えて交流できていると感じます。(営業スタッフ)
オズビジョングループ SRE データシート
【開発環境】
■言語: PHP, JavaScript, TypeScript
■フレームワーク: CodeIgniter, Zend Framework, Symfony, React
■アプリ実行環境: EC2 (Amazon Linux)
■ミドルウェア: Apache, MySQL (Aurora), memcached (ElastiCache)
■インフラ構築
– プロビジョニング: CloudFormation
– 構成管理: Ansible
■運用監視: nagios, CloudWatch
■コミュニケーションツール: Slack
【業務の詳細(直近で実際に行っている業務)】
■Webアプリケーション開発/テストの生産性を高めるための環境整備
■ポイント管理システムの基盤再設計・リニューアル検討
■Amazon Aurora MySQL におけるパフォーマンス・チューニング
– スロークエリログから負荷の高い処理を抽出して改善
– DB設定の見直し(コネクション数/バッファサイズ/クエリキャッシュサイズなど)
■web アプリケーション改善
– xhprofなどのプロファイラを用いてアプリケーションのボトルネックを改善(PHP)
■開発,CI/CD 環境の整備
– 独自で構築していたソースコードのデプロイシステムを AWS マネージドサービスに置き換え(CodePipeline/CodeBuild/CodeDeploy)
■インフラ管理のソースコード化 (ansible, cloud-formation, terraform) – アプリケーションログ・インフラログの整備
■DB スキーマなどのマイグレーション方式検討