「データサイエンティストは具体的にどんな仕事をしているのだろう?」データサイエンティストは人気のある職種ですが、働き方を明確にイメージできる人は少ないのではないでしょうか。「データを分析する仕事」ではありますが、それだけでは不十分です。今回は、データサイエンティストの仕事内容について分かりやすく解説します。
データサイエンティストとは「大量のデータ(ビッグデータ)を分析して、ビジネスに価値を生み出す」職業です。
ポイントは2つ。1つめはビッグデータを扱うことで、データ分析には統計学を使います。データ量が多く、エクセルやマーケティングツールでは取り扱いが難しいため、分析基盤の構築や分析処理の実装(プログラミング)が必要です。
2つめはビジネスに価値を生み出すことが求められる職業だということです。データを分析して終わりではなく、ビジネスの成長に繋がったかどうかが仕事の成果として評価されます。
データサイエンティストは、担当するプロジェクトによって扱うデータや分析の方法は異なりますが、仕事の進め方は似ています。ここではデータサイエンティストの仕事内容を、実際の進め方に沿ってご紹介します。
はじめに、データを活用してどのようなことを分析したいのか、プロジェクト担当者やクライアントにヒアリングします。プロフェッショナルなデータサイエンティストの立場に加えて、クライアント目線でのアドバイスが求められるため、業務知識やコミュニケーションスキルが必要です。
ヒアリングが完了したら、最適な分析環境と分析手法をチーム内で検討します。チームで複数回ミーティングを行い、決定事項をドキュメントにまとめて共有することが多いです。
データ分析の環境を構築します。ビッグデータを処理する場合、サーバー並列処理(分散処理)など大がかりな機器が必要となり費用も高額です。
一般的には、メーカーが貸し出している分析基盤(プラットフォーム)を契約して使うことが多く、自前で開発することはほとんどありません。よく使われるプラットフォームとしては、GoogleのGCP、AmazonのAWS、MicrosoftのAzureなどが有名です。
分析基盤が構築できたら、データベースからデータを抽出して加工する処理を実装します。データ抽出にはSQL、データ処理にはPythonなどさまざまなプログラミング言語が使われます。
昨今はAIによるデータ分析処理の自動化が進んでいて、API(Application Programming Interface)として公開されているケースも多数あります。APIとは、簡単に言うと「処理の塊」のことです。APIを使えば一からプログラムを書く必要はありません。これらをうまく活用することで、実装の時間を大幅に短縮できます。
データ分析によって得られた結果をプロジェクト担当者やクライアントに向けてフィードバックします。レポートやプレゼン資料などにまとめて報告することが多く、プロジェクト担当者やクライアントとさまざまな角度からディスカッションを行います。
データサイエンティストを募集している企業の採用条件には、「理系の大学卒または統計学とエンジニアリングについて一定以上の知識とスキルがあること」という言葉が並びます。
中には「未経験可」として、入社後に必要な知識やスキルを学ぶ研修を用意している企業もありますが稀です。データサイエンティストになるためには、知識と経験を証明するため、専門の機関で学んでから企業へ応募することが一般的な実現方法になります。
データサイエンティスト育成のコースが用意されている大学や専門学校に通学することで、必要な知識やスキルを学べます。2020年頃からデータサイエンス学部を新設する学校が目立ち、学ぶ環境が選べる時代です。
基本情報処理技術者試験、統計検定といった、データサイエンティストに役立つ資格取得に向けた科目を用意している学校もあります。学べる環境は千差万別です。気になる方は、まずは学校のホームページで具体的なカリキュラムを確認してみましょう。
少なくても2年間は通学が必要になりますので、時間と経済的なゆとりのある人の選択肢になります。
データサイエンティスト育成のプログラミングスクールもあります。期間は1ヵ月間の短期コースが用意されていることもあり、短期間でデータサイエンティストを目指したい人におすすめです。
短期間に統計学、エンジニアリングを学びますので、大学・専門学校と同じく、時間と経済的なゆとりのある人向きの選択肢になります。会社勤めでこれからデータサイエンティストへの転職を考えている人も、夜間や休日のコースを選べば十分に通学可能です。
スクールのメリットは、「統計学を学びたい」「プログラミングスキルを身につけたい」「ビジネスへの価値の生み出し方を知りたい」など、目的に応じたコースが受講できる点です。大学や専門学校とは違い、必要な分野を自由に選べますので、学習の無駄を省けます。
仕事を続けるうえで、モチベーションを保つために、責任感だけではなく達成感や成長の実感があることが欠かせません。ここでは、データサイエンティストのやりがいと身につくスキルをご紹介します。
データサイエンティストのやりがいは、大きく2つに分かれます。
1つめは「クライアントや会社の役に立てることを実感できる」ことです。クライアントのビジネスに関わるデータサイエンティストは、頻繁にプロジェクト担当者やクライアントとディスカッションします。
データサイエンティストが分析したデータは、経営の判断基準に用いられることも多く、責任重大です。しかし、ビジネスに価値を生み出せたならば、プロジェクト担当者やクライアントと喜びを分かち合い、大きな達成感を得られるでしょう。
2つめは、エンジニアリングの分野で最先端の知識や技術に関われることです。データサイエンティストは比較的新しい職業で、分析手法は日進月歩で進化しています。新しい知識や技術を頻繁に試すことで、できることがどんどん増えていくでしょう。エンジニアとして成長を実感できる機会が豊富です。
データサイエンティストには仕事を通して、さまざまなスキルが身につきます。ここでは特に専門性の高い3つのスキルをご紹介します。
統計スキルとは、統計学を使いビッグデータから規則性を導くことです。経験を重ねることで、最適な統計手法が選べるようになります。
ビッグデータを解析するために必要な統計スキルは、インターネットでデータ量が膨大になるにつれて重要度が増していきます。今後ニーズが高まることに加えて専門性が高いため、とても市場価値の高いスキルと言えるでしょう。
ここでのエンジニアリングスキルとは、主に、基盤構築、データベース構築、プログラミングの3つのスキルです。
また、実際にデータ分析を繰り返すことで、データ分析に必要な環境やスキルを逆算して考えられるようになります。エンジニアリングスキルが身につけば、ほかのプロジェクトへの応用が利くため、汎用性の高いスキルと言えるでしょう。
コンサルティングとは、課題を見つけて解決策を提示することですが、データサイエンティストの仕事内容にもあてはまります。
データサイエンティストの仕事である「データから知見を導き出して依頼者に提示する」ためには、プロジェクト担当者やクライアントの課題と求める解決策を明確に理解しなければならないからです。
プロジェクト担当者やクライアントの状況を深く理解しようとする過程を繰り返すことで、依頼者目線での課題設定と解決策の提示ができるようになるでしょう。
ここではデータサイエンティストの仕事内容を踏まえたうえで、向いている人の特徴を3つご紹介します。
データサイエンティストは、Webシステムやスマホアプリを開発するエンジニアなどに比べると、プログラミングに割く時間が少ない職業です。
あくまでデータ分析のプログラムが用意できればよく、1日中プログラミングすることは稀です。プログラミングが好きで一人で黙々と作業したい人にとっては、開発に関わる時間が少ないためストレスを感じるかも知れません。
その分、ひたすらデータに向き合い、仮説と検証を繰り返します。このプロセスを楽しめるならば、データサイエンティストに向いているでしょう。
たとえば、「これまでの店舗売上データを元に売上予測を立てて、最適な発注量を自動でコントロールする」ことを考えた場合、売上予測を立てるために統計学を使います。統計学を使うことで、売上と売上を決めている要因の相関が明確になって、自動でコントロールする機能が作れます。
データ分析において統計学の知識は必須です。多くの企業が求めるレベルは「統計検定2級以上」となっています。具体的な知識を知りたい方は、日本統計学会(https://www.jss.gr.jp/)のサイトにアクセスして調べてみるといいでしょう。
データサイエンティストは、ビジネスの課題を抱えている経営者をはじめ、多くのステークホルダーと関わりを持ちます。分析手法や得られたデータの知見について、仲間同士で議論を重ねることも。
コミュニケーションが好きで、立場の異なるたくさんの仲間と一緒に課題を解決することにやりがいを感じるならば、データサイエンティストに向いています。
日本ではDX(デジタルトランスフォーメーション)が国策で推進されています。
DXとは、わかりやすく言うと「デジタル化によるビジネスの革新」ですが、デジタル化の材料はデータです。データを活用してビジネスの革新を目指すことが、DXとも言い換えられます。
ここで、データサイエンティストの出番です。データサイエンティストはビッグデータからビジネスに価値を生み出す職業なので、DXに最適な人材と言えるでしょう。
事実、データサイエンティストの採用枠は多く、価値の高さから、IT系の職種の中でも高額な報酬が提示される傾向にあります。今後しばらくはこの傾向は続く見込みです。
データサイエンティストは、20代、30代を中心に人気の職種ですが、なるためのハードルが高いことも事実。これからデータサイエンティストを目指す方は、挫折しないためにも、まずは明確なキャリアプランを描くことからはじめるといいでしょう。