データサイエンティストのキャリアについて悩んでいる方も多いのではないでしょうか?
データサイエンティストはここ数年で登場した職業であり、ロールモデルも少ない中でキャリアに不安を抱える人が多いのも事実です。
さらに、ChatGPTの出現によりさらに不安に拍車をかけています。
筆者は分析会社に在籍しており、データサイエンティストの評価制度やキャリアについて日々考えています。
そのような立場・経験からデータサイエンティストの今後のキャリアおける考えを解説していきます。
今回はデータサイエンティストが今後どのように価値を出していくべきか?キャリアを考える際にどのようなことを意識すべきか?を解説していきます。
この記事で少しでもキャリアに悩むデータサイエンティストの方の参考になれれば幸いです。
結論は、「特定のドメインに特化しよう」です。
では、本題に移ります。
データサイエンティストとは?
データサイエンティストは「データを活用してビジネス課題を解決する職業」です。
統計的手法・機械学習モデル・データの扱いに長けており、各企業に蓄積されたデータを活用して、ビジネス課題を解決することが期待されています。
データサイエンティストの将来性は?
データサイエンティストの将来性は高いと予測されています。
下記は、株式会社グローバルインフォメーションの市場調査レポートです。
このレポートによると、データサイエンスプラットフォームの市場規模は2021年の953億米ドルから年平均で27.7%で成長していくと予測されています。
データサイエンティストの需要が高まっている理由は下記の3つがあります。
- ビッグデータ活用の重要性が増している
- AI活用できる人材が求められている
- データサイエンティスト自体が少なく需要が高い
詳しく説明していきます。
ビッグデータ活用の重要性が増している
近年の産業ではDX(Digital Transformation)を進めることが潮流です。経済産業省の定義によると、DXとはデジタル技術を活用して、新たなビジネス価値を提供することと定められています。
その中で重要となってきているのがデータサイエンティストの存在です。
データサイエンティストは各企業に蓄積されたビッグデータを加工して、新たな発見・ビジネス価値につなげることを期待されています。
今後もデジタル技術を活用して、ビジネス価値を創出していく流れは続くと予想されるためん、今後もデータサイエンティストは一定の需要があることが予測されます。
AI活用できる人材が求められている
AI活用できる人材が求められているのも、データサイエンティストの将来性が高い理由とされています。
AI活用は今後の日本の成長戦略の一つです。下記は内閣府が公開している「AI戦略」の抜粋資料です。
政府の見解としては、今後の産業成長にはAI活用が必要であり、AIをいかに活用して日本の産業を成長させていくかを考えています。
このようにAIが日本の成長戦略となっている中で、AIを活用をできるデータサイエンティストがより求められていることがわかります。
データサイエンティスト自体が少なく需要が高い
上記のように、データサイエンティストが多く求められている中で、データサイエンティスト自体が少ないという課題があります。
少々古い調査結果になりますが、2019年に経済産業省が公開した調査結果によるとAI人材(=データサイエンティスト)は2025年時点で約9万人、2030年には約14万人が不足すると予測されています。
現時点でもデータサイエンティストは充足されているとはいいがたく、需要と比較するとまだまだ不足しているのが現状です。
そのため、データサイエンティストは需要が高く、供給が少ない職業であり、今後の将来性が期待できる職業です。
データサイエンティストは将来なくなる?懸念の声
データサイエンティストが将来なくなるという意見も多々あります。データサイエンティストがなくなると言われている理由の一つにAIによる自動化があります。
データサイエンティストは各企業のビッグデータを加工して、分析結果を出すことが求められています。
数年前まではビッグデータを扱うこと自体ができる人が限られており、データを加工することが価値となっていました。
しかし、ここ最近では技術の進歩により、データの加工・分析結果の創出が自動化できるのではないかと言われています。
この意見に拍車をかけるようにChatGPT(Code Interpreter)が登場して、分析結果を簡単に出してくれる技術が登場してきています。
そのため、AIや技術進歩によりいままでのデータサイエンティストの仕事は、なくなっていくのではないかという意見が上がっている事実があります。
なくなるデータサイエンティストの特徴
筆者個人の意見としてはデータサイエンティストが完全になくなることはないです。
しかし、なくなるデータサイエンティストの仕事もあるというのが個人的な見解です。では、どのようなデータサイエンティストが将来なくなるのでしょうか?
なくなるデータサイエンティストの特徴は下記です。
- データ分析が目的化している
- データの加工を主にしている
- ビジネスに向き合って仕事をしていない
端的に言うと、データの加工など作業に徹しており、データサイエンティストとしてビジネス価値を出す姿勢が薄い人です。
データサイエンティストは「データを活用して、ビジネス課題を解決する職業」です。
そのため、その下流工程のデータ加工のみを行っているデータサイエンティストは徐々に淘汰され、AIや最新技術に置き換わっていくことが予測されます。
今後データサイエンティストとして、生き残っていくために重要なことは何なのか、次章以降で解説していきます。
データサイエンティストの仕事内容
データサイエンティストの仕事内容に関して、改めて整理していきます。データサイエンティストは、以下のような職務を担当します。
- データ収集と前処理: 大量のデータを収集し、クリーニングや整形などの前処理を行います。データベースからのデータ抽出やAPIの利用など、様々なデータソースからデータを収集します。
- データ分析と探索的データ解析: 収集したデータを統計的手法や可視化ツールを用いて分析し、傾向やパターンを探索します。問題の理解やデータの特徴を把握するために探索的なデータ解析を行います。
- 機械学習モデルの開発: 機械学習アルゴリズムや統計モデルを使用して、データから予測モデルや分類モデルを構築します。モデルの訓練、検証、パフォーマンスの評価を行い、最適なモデルを選択します。
- ビジネスへの応用: データサイエンティストは、ビジネス目標や課題に基づいてデータの洞察を提供します。予測分析や最適化モデルを用いて、意思決定プロセスをサポートします。ビジネス上の問題に対してデータ駆動のアプローチを提案し、意思決定を補完します。
- コミュニケーション: データサイエンティストは、非専門家にも結果や洞察を伝える必要があります。クライアントやチームメンバーに対して、複雑なデータやモデルの概念を分かりやすく説明し、ビジネスへのインパクトを示します。
データサイエンティストに必要なスキルは多々あり、ビジネススキルからプログラミングまで広いスキルが求められます。
データサイエンティストに必要なスキル
上記のような仕事をこなすために、データサイエンティストには、以下のようなスキルが求められます。
- プログラミング: データの処理や分析にはプログラミングのスキルが必要です。PythonやRなどのプログラミング言語を使い、データの前処理、分析、モデルの構築などを行います。
- 統計と数学: 統計的手法や確率論、線形代数などの数学的な基礎知識が必要です。データの解釈やモデルの設計において、統計や数学の概念を理解し応用する必要があります。
- 機械学習とデータマイニング: 機械学習アルゴリズムやデータマイニングの手法に精通している必要があります。教師あり学習や教師なし学習など、さまざまなアルゴリズムを理解し、適切なモデルを選択・トレーニングする能力が求められます。
- データベースとデータ処理: データベースの知識やSQLのスキルが必要です。大規模なデータセットを効果的に処理し、クエリを作成してデータを抽出する能力が求められます。
- ビジネス理解: データをビジネスに活用するためには、ビジネスの目標や課題を理解する能力が重要です。ビジネスのニーズを把握し、データ分析を通じてビジネス価値を提供することが求められます。
以上が、データサイエンティストの一般的な職務内容と必要なスキルの概要です。
データサイエンティストは、データに基づいた問題解決や意思決定において重要な役割を果たします。
データサイエンティストの資格
データサイエンティストのスキルを証明するために、いくつかの資格が存在します。下記にいくつか例を挙げます。
- データサイエンティスト検定(DS検定):
データサイエンスの知識とスキルを評価する資格試験。データの前処理、統計解析、機械学習、ビジネス応用などの領域における基礎的な知識と実践的なスキルを問われます。 - 統計検定:
統計学の基本的な知識と応用能力を評価する資格試験。統計的手法や確率論、データの分析方法などについての理解を問われます。 - G検定:
ビジネスにおける情報活用力を測るための資格試験。データ分析や情報活用に関する基本的な知識、統計解析、ビジネス課題への応用能力などが問われます。 - Python 3 エンジニア認定データ分析試験:
Pythonプログラミング言語を使用したデータ分析のスキルを評価する試験。Pythonを使ったデータ処理や分析、可視化の能力を問われます。 - 情報処理技術者試験:
IT分野における基本的な知識と技術を評価する国家資格試験。コンピュータの基礎知識、プログラミング、データベース、ネットワークなどの幅広い領域について問われます。 - AWS認定ソリューションアーキテクト:
Amazon Web Services(AWS)のクラウドサービスを活用したシステム設計とアーキテクチャの能力を評価する資格試験。AWSのサービスやアーキテクチャの理解、セキュリティ、コスト最適化などが問われます。 - データベーススペシャリスト:
データベースの設計、管理、運用などに関するスキルと知識を評価する資格試験。データベースの基礎知識、SQLの理解、データモデリング、パフォーマンスチューニングなどが問われます。
データサイエンティストに関する資格は上記のようなものがあります。しかし、データサイエンティストは資格より、経験値が重視されます。
それはビジネス課題を解決するためには資格のようなスキルも重要ですが、実際にあらゆるビジネス課題を解決するための経験が重視されるからです。
資格を複数持っているからといって、データサイエンティストとして優れているかはイコールではないことに留意しましょう。
今後のデータサイエンティストに必要となるスキル
今後のデータサイエンティストに必要となってくるスキルについて解説します。
データサイエンティストとして重要になってくるのは「データを活用」するスキルです。そしてそのためには「データ活用を考える」ために「ドメイン知識」が重要になってきます。
今後のデータサイエンティストは「データ活用」スキルが必要
今後のデータサイエンティストには「データ活用」するスキルが必要です。
単にデータを出して、データを分析することはさほど難しくない時代になってきている中で、データを分析するだけでは価値を出しづらくなっているのが、いまのデータサイエンティストの状況です。
そのため、「データ活用」を考える上流部分に踏み込んだ価値設計が重要になってきます。
上記のように、データ加工部分の価値は薄くなってきており、より上流のレイヤーで価値を出すことが求められています。
データをどのように活用して、ビジネス課題を解決するのか?という点において、よりデータサイエンティストが踏み込んで価値設計していくことが求められます。
データや活用方法に詳しいのはデータサイエンティストです。一般的なビジネスマンではデータの活用について詳細に考えることは難しく、データサイエンティストが価値を出せる領域です。
そのため、今後のデータサイエンティストにはより上流の「データ活用」スキルが求められていくでしょう。
「データ活用」スキルには「ドメイン知識」が必須
「データ活用」を考えるにあたって必要となるのが「ドメイン知識」です。
データサイエンティストはいままでデータ分析スキルが強く求められてきましたが、今後は特定の「ドメイン知識」が求められてきます。
なぜなら、「データを活用」するためには、対象となるビジネスの課題を深く理解する必要があるからです。課題を深く理解するために、対象となるビジネスの知識が必要になってきます。
すでに用語として生まれているのが、「製造業データサイエンティスト」や「製薬データサイエンティスト」、古くからある「クオンツ」などは金融業に特化したデータサイエンティストと捉えることもできます。
このように、特定領域に特化することで、ビジネスの課題を深く理解して、優れたデータ活用を考えることができます。
そのため、今後は特定領域に特化して、深く「ドメイン知識」を有したデータサイエンティストが重要になってきます。
ドメイン領域の決め方
ドメイン領域はどのように決めていくのがいいのでしょうか?筆者の観点からは下記の2点が重要と考えています。
- 今後の業界成長性
- 参入障壁
今後のデータサイエンティストはどのような領域に専門性を持つべきかを考えていくことが重要です。
詳しく解説していきます。
今後の業界の成長性
一つ目は業界自体の成長性があるかどうかです。
データサイエンティストとして、業界を特化させることを考えた時にその業界全体の成長性は大きなポイントになります。
なぜなら、業界が衰退しているとその業界の衰退に引きずられるように自身のキャリアも衰退していく恐れがあるからです。
逆に成長産業に身を置いていると、より人材への需要は高まり、引く手あまたの状態になることができます。
データサイエンティストとして、ドメインを特化させるためには業界の成長性を鑑みることが重要になります。
参入障壁
二つ目がその領域に特化する時に参入障壁が高いか否かという点です。なぜなら、今後台頭してくる強者と競争する必要性がなくなるからです。
参入障壁が低い領域の具体例の一つがマーケティング領域です。
マーケティング領域はプロフェッショナルな知識が必要ではあるものの、比較的浅い知識でも仕事ができてしまうという側面があります。これは、人を相手にしており、感覚的に意見がしやすい領域だからです。
(マーケティング領域はもっとプロフェッショナルであるべきだが、そうでなくとも仕事ができてしまうという実情があると主張です。本来はもっと専門性があるべきです。)
このような領域だと取っつきやすく、優秀なデータサイエンティストも参入しやすい領域となってしまいます。
一方で、参入障壁が高い業界の一つとして医療業界が挙げられます。
医療業界ではそもそも医療の背景や医学の知識も一部必要になり、すぐには着手することが難しい領域であると想像できます。
このような領域で自身を特化させると他の強者と食い合うリスクも減るため、価値を出しやすくなります。
そのため、データサイエンティストとして、業界を特化させるためには参入障壁という点も考慮してキャリアを考えることが重要です。
今後のデータサイエンティストは立ち回りが重要
上記で解説したように、今後のデータサイエンティストのキャリアは立ち回りが重要になってきます。
自身がどのような領域に特化して、データサイエンティストとして価値を出すか?競合となる強者が少ない領域はどこか?など戦略的に自身のキャリアを考えていくことが重要になります。
個人的に目を付けている業界は「医療・ヘルスケア」、そして「WEB3.0」です。
「医療・ヘルスケア」業界は今後の日本の高齢化に向けて、成長していく産業でありながら、専門知識が必要となる領域だと考えています。
「WEB3.0」業界はこれから伸びるであろう市場でありますが、ブロックチェーン・クリプト・NFT・メタバースなど詳しい知識が必要であり、参入障壁が高い領域だと思っています。
筆者はこの「WEB3.0」領域にベットして、キャリアの構築を考えています。共に学んでいきたいデータサイエンティストの方がいたら、ぜひ一報いただけると幸いです。
共に、よきキャリアを築いていければうれしいです。
今回は以上になります。