システム保守の流れとポイント――お問合せ・障害対応

Pocket

欠かすことのできないシステム保守

システムに障害が発生した場合に、障害の発見・原因特定・解決をするのが「システム保守」です。せっかく作ったシステムも、きちんと動かなければ無用の長物。システム開発に比べて、システム保守は一見地味に思われるかもしれませんが、とても大切な仕事です。

私は普段、業務システム保守の仕事をしています。私が扱っているシステムは、Webアプリとタブレットアプリ、Webサービスが互いに関係しあっているシステムで、様々なお問い合わせが来るので、それぞれの特徴に合わせて調査・対応しています。

この記事では、幅広いシステム保守業務の内、「お問合せ・障害対応」の業務の流れにフォーカスし、私が業務の中で感じたシステム保守業務をするうえで大切なことをご紹介します。

システム保守の流れ――お問合せ・障害対応

システム保守の業務では、以下のフローに従い、お問合せ対応・障害対応を行っています。

システム保守のお問合せ対応・障害対応の流れ

1. 問題発生・2. 受付

お客様や監視部門から問題発生の連絡を受けるところから始まります。

3. 調査

問題発生の連絡を受けると、まず原因・対応方法の調査を行います。

対応方法は以下のような観点で切り分けて考えます。

  • ユーザー操作で対応可能か
  • データの補正等で対応可能か
  • システムの不具合修正版のリリースが必要か

この時点では、お客様の業務を止めないよう暫定対応を優先するため、一番早く対応ができ、業務への影響の小さい方法を選びます。問題の原因がシステムの不具合であっても、ユーザー操作やデータの修正の方が素早く安全に対応できる場合はそちらを選びます。実際に対応する前には、二度手間を防ぐために問合せの内容に対処すれば本当に解決するか(別の問題が含まれていないかどうか)の確認を行います。

4. 暫定対応・5. 回答

「3.調査」で決めた方法で対応するか、ユーザーに問題の回避方法を回答します。

6. 記録

問題が解決すれば、次回同じような問題が発生した時に備えて、記録とドキュメントの整理を行います。

問題発生時に素早い対応を行うためには、事前に必要な知識を共有し、ドキュメントを整理しておくことで、誰でもすぐに対応できる状態にしておくのが大切です。日ごろから保守運用のためのドキュメントがどこにあり、誰がそのドキュメントをメンテナンスしていくのか、責任の所在を明確にしておくようにしましょう。

7. 恒久対応

暫定対応で目の前の問題が解決してもそこで終わりにせず、再発を防止するための対応を行います。

暫定対応では、ユーザーの操作で問題を回避でき、根本原因がシステムの不具合にあった場合には、システムの不具合修正版をリリースします。システムに不具合はなくユーザーの誤操作が原因の場合でも、頻発するようであれば、誤操作の発生しにくいUI(User Interface/ユーザーインタフェース)に変更するなどの対応を検討します。もちろん他の不具合の状況や深刻性、発生頻度次第では、一旦対応を見送るという判断もあります。また、不具合に対応する前に、問題のあった機能以外の類似機能で同様の問題が発生しないかどうか、横並び調査も行います。

システム保守では普段の準備が重要

システム保守、特に問合せ・障害対応の業務の流れを見てきました。

システム保守で一番大切なのは「いざという時のために普段から準備しておくこと」だと、私は感じています。目の前の問題に対応して満足するのではなく、次が発生しないようにどうするか、発生した場合に素早く対応できるようにするにはどうすれば良いかを常に考えるようにして取り組んでいると、たまに問題が起きる前に発見して対応できることがあります。そういう時にとてもやりがいを感じます。

tdiのシステム保守サービスにご興味ある方は、どうぞこちらのWebフォームよりお問い合わせください。

お問い合わせ先

執筆者プロフィール

Fukushima Yuki
Fukushima Yukitdi 西日本公共システム部
現在の業務ではWebアプリ・Webサービス・Androidアプリの開発に携わっています。AWSにも興味があるので個人的に遊んだりしています。
Pocket