目次
こちらもおすすめ
【2022年1月最新:全部受講】Udemyのおすすめ31選をカテゴリ別に紹介【データサイエンス/機械学習,Python/R/SQLプログラミング】 | Quant College
【厳選】統計学の勉強におすすめの本9選【初心者から上級者まで】 | Quant College
測度論的確率論の独学におすすめの本8選【わかりやすい教科書/参考書】 | Quant College
【初心者から上級者まで】Pythonプログラミング独学におすすめの本6選 (難易度順)【感想あり】 | Quant College
システムトレード×Pythonのおすすめ本5選(洋書) | Quant College
QuantLib-Pythonチュートリアル(導入編)をリリースしました。 | Quant College
関連記事
データサイエンティストが激務になる条件3選【きつい?大変?忙しい?】 | Quant College
データサイエンティストとデータアナリストの違い5選 | Quant College
データサイエンティストとデータエンジニアの違い5選 | Quant College
はじめに
最近はクオンツからデータサイエンティストに転身する人も多く、転職してよかったという人もいれば、転職して後悔したという人もいる。管理人の身の回りでも、クオンツからデータサイエンティストになってはみたものの、つらい思いをしている人は少なからずいる。
今回は彼らの話を総合して、データサイエンティストはやめとけと言われる理由・つらい所を10個紹介する。なお、以下で書いていくつらい所の多くが、実はクオンツにも当てはまる。
【悲報】クオンツのつまらない所5選【つらい?しんどい?】 | Quant College
しかし大きく違う点として、クオンツは社内向けの仕事が多い一方、データサイエンティストは、社内向けがメインというポジションもあるが、社外の顧客向けがメインというポジションも多い。これはソフトウェアエンジニアでいうと、前者が自社開発、後者が受託開発に対応するだろう。たいてい、受託開発より自社開発のほうが仕事の裁量が大きく、比較的柔軟に仕事ができる傾向にある。
データサイエンティストはやめとけと言われる理由・つらいこと10選
1.何もわかっていない依頼主の期待値が高すぎる
社内の人か顧客かを問わず、よくあるのは、「どんな課題でも機械学習やAIを使えば解決できる」と思っているケースである。依頼主の期待水準がべらぼうに高く、できもしないことをやってくれと言われ、上席者がそれを引き受けてしまうと困ったことになる。依頼主が思うような結果が出ないと苦言を呈される。顧客が事前に想定していた「きれいな結果」ではなく、「どっちつかずの地味な結果」が返ってきて、落胆されてしまうこともある。これは中々つらいといえるだろう。
2.前処理のデータハンドリングが泥臭くて大変
生データをそのまま分析に使えることはほぼなく、地道な前処理の作業が発生する。必要なデータ変換作業は定型化されておらず、案件や状況ごとにケースバイケースなので、自動化が困難な場合も多い。
サイエンスやエンジニアリングとはほど遠い作業なので、機械学習の理論など数学を深く学んだクオンツ出身の人だと、興味を持って取り組めるとは思えない。
3.分析結果のプレゼンなど、「見せ方」を工夫しないといけない
分析それ自体よりも、分析結果のプレゼンが重要だったりする。しかし専門的な内容を素人に理解してもらうのは容易なことではなく、工夫が必要だ。考え方がエンジニア寄りの人はそもそもプレゼンがあまり好きではなかったり、つまらないと思う人も多い。
機械学習について素人(社内の偉い人、顧客)にわかってもらえるよう説明するのは難しいタスクではあるが、サイエンスやエンジニアリングとはほど遠い作業ということもあり、やる気がそがれてしまう人もいるようだ。
4.分析に必要なデータを集めるのがつらい
分析するにあたって必要なデータが手元にない、という状態から始まるプロジェクトも多い。データを取得してシステマティックな形で蓄積していくまでに、たいてい課題が山積みとなる。
部署間の利害などによって、別部署からデータを取得するだけでも説明・交渉・承認が必要なことも多く、それを自分たちでやらないといけない場合、ヒューマンスキルが求められる。
5.正解や前例がなく、地道な試行錯誤が大変
どれだけ苦労して成果物を作っても、依頼主が満足しない限りそれは成果として認識されず、やり直しになってしまう。答えがない仕事であり、試行錯誤が不可欠となるため、粘り強く仕事に取り組める人でないと、心身に与えるダメージが大きい。
取得できたデータの量や質が十分でない場合、期待されていたような分析結果が得られないことも多い。仮説を立てる→実証する→別の仮説を立てる→再び実証する・・・の繰り返しであり、特に顧客に提出する納期が迫っていると、長時間残業に陥ることもある。
6.ドメイン知識の習得が大変
様々な業界の顧客を相手にする場合、プロジェクトのたびに異なる業界のドメイン知識にキャッチアップしないといけない。顧客の業務について深く理解したうえで分析・助言することが求められる。
この点についてはコンサルタントにかなり近い。サイエンスやエンジニアリングだけでなく、依頼主のビジネスの理解も必須なので、理系っぽい内容しか興味ない・ビジネスに興味なし、という人には苦しい仕事である。
7.社内の偉い人や顧客の方針転換に振り回される
社内政治によって会社の方針がコロコロ変わるのはよくあることである。方針転換があると分析のやり直しが発生するため、末端で作業をしている人は徒労感を覚えるだろう。
8.数学の知識が必要でド文系には苦痛でしかない
日常業務では、数式をゴリゴリ書いたりすることはほとんどないが、機械学習ライブラリを適切に使いこなすには、線形代数や偏微分など理系学部一年レベルの数学知識が必須となる。これらの勉強は、数学嫌いの文系出身者には苦痛でしかない。
特にライブラリの中でエラーが発生している場合など、エラーメッセージをもとに何が起きているかを予想して自分のコードを直すのは、数学の知識がある程度ないと厳しい。
それぞれの機械学習モデルが中でどのような計算をしているのか、数式レベルである程度は理解できていないと、データサイエンティスト同士の会話がサッパリわからず困ってしまうはずだ。
また、機械学習(特に深層学習)は日進月歩の分野で、常に新しいアルゴリズムが提案され、現実に適用されるモデルの流行り廃りの入れ替わりも激しい。そういうわけで、データサイエンティストは専門分野の勉強をし続けないといけない。これは勉強嫌いの人にとっては悪夢というほかないだろう。
9.勉強すべき内容が多いので未経験者にはつらい
業務内容を理解し、自分で考えて仕事を進めていくには、かなりの勉強量が必要となる。Python、SQL、数学、統計学、機械学習はもちろん、クラウド、データベース、Web開発基礎のほか、クライアントが属する業界のドメイン知識などが求められる。
覚えるべき知識の範囲が広いので、未経験から転職するにはかなりの独学量が必要だ。「流行りの職業だし、お手軽に高年収になれるかも」と思って転職しようとすると痛い目にあう。
さらに、最近ではデータサイエンティストは人気職業になっており、競争率が上がっているのも確かだ。実際、東大理系院生などハイレベルな人材が目指すようになっており、インターン生や新入社員のレベルが年々上がっている。企業やポストにもよるが、データサイエンティスト採用は以前に比べてかなり狭き門になりつつあると言っていいだろう。
10.一人で黙々と作業するような仕事ではなく、コミュ力が必須
黙々と作業する仕事がやりたい、と思ってデータサイエンティストになろうとする理系出身者が多い。しかし実際のところは高いコミュニケーション能力が求められる。データサイエンティストも、クライアントと接する接客業であることに変わりはない。クライアントとのやり取りのほか、社内の他部署の人と交渉することも多く、チームワークが必須となる。一人で黙々と計算する仕事がしたい、という志望理由の人だと、仮に転職できても長くは続かないだろう。
技術的には可能だが実際に行うのは困難な依頼をされた場合、折衷案を提示して納得してもらう必要がある。他にも、部署Aの人はこうしてほしいと言っているが、部署Bの人はそれはやめてほしいと言っている、というように、利害関係の異なる人達の間で板挟みになることも多い。このような人間関係に起因する苦痛が生じるのはデータサイエンティストも例外ではなく、ある程度のストレス耐性が求められる。
まとめ
以上をまとめると、データサイエンティストのつらいこと10選は以下の通り。
- 何もわかっていない依頼主の期待値が高すぎる
- 前処理のデータハンドリングが泥臭くて大変
- 分析結果のプレゼンなど、「見せ方」を工夫しないといけない
- 分析に必要なデータを集めるのがつらい
- 正解や前例がなく、地道な試行錯誤が大変
- ドメイン知識の習得が大変
- 社内の偉い人や顧客の方針転換に振り回される
- 数学の知識が必要でド文系には苦痛でしかない
- 勉強すべき内容が多いので未経験者にはつらい
- 一人で黙々と作業するような仕事ではなく、コミュ力が必須
これらは勘違いしている人が多いポイントなので、できれば実際に働いている人の生々しい体験談を聞いてから、自分に合う仕事なのかどうか見極めてほしい。
あわせて読みたい
データサイエンティストが激務になる条件3選【きつい?大変?忙しい?】 | Quant College
データサイエンティストとデータアナリストの違い5選 | Quant College
データサイエンティストとデータエンジニアの違い5選 | Quant College
データサイエンスの資格7選【データサイエンティスト】 | Quant College
【挫折率90%】初心者がプログラミング独学で挫折する理由/原因/特徴9選【挫折ポイントはどこ?】 | Quant College
GRU (Gated Recurrent Unit)とは【わかりやすく】 | Quant College
LSTM (Long Short-Term Memory) とは【わかりやすく】 | Quant College
主成分分析と因子分析の違いと使い分け【わかりやすく】 | Quant College
第一種過誤/第二種過誤とは?違いと覚え方をわかりやすく | Quant College
再現率/適合率とは?違い/覚え方【わかりやすく】 | Quant College
数学とプログラミングのどちらの能力を伸ばしておくべきか? | Quant College
アクチュアリーのつらい所7選【やめとけ?激務?なくなる?コスパ悪い?メリットは?向いてる人は?】 | Quant College
【ファイナンス機械学習 解説】著者の解説スライドを日本語でまとめてみる(1/10) | Quant College
金融工学の研究/実務で使うプログラミング言語10選 | Quant College
クオンツ業務で必要なプログラミング言語は? | Quant College
クオンツとデータサイエンティストや機械学習エンジニアの違い | Quant College
こちらもおすすめ
【2022年1月最新:全部受講】Udemyのおすすめ31選をカテゴリ別に紹介【データサイエンス/機械学習,Python/R/SQLプログラミング】 | Quant College
【厳選】統計学の勉強におすすめの本9選【初心者から上級者まで】 | Quant College
測度論的確率論の独学におすすめの本8選【わかりやすい教科書/参考書】 | Quant College
【初心者から上級者まで】Pythonプログラミング独学におすすめの本6選 (難易度順)【感想あり】 | Quant College
システムトレード×Pythonのおすすめ本5選(洋書) | Quant College
Pythonで金融工学を学べる本おすすめ5選【ファイナンス】 | Quant College
QuantLib-Pythonチュートリアル(導入編)をリリースしました。 | Quant College
QuantLib-Pythonチュートリアル(スワップイールドカーブ編その1)をリリースしました。 | Quant College
【感想あり】おすすめのUdemy動画講座:機械学習・データサイエンスに必要な数学とPythonの入門編【随時更新】 | Quant College