【書評】ビッグデータ時代のリテラシー『データサイエンス入門(データサイエンス大系)』

技術

これからの時代はデータサイエンスが重要だとよく耳にします。でも正直、「データサイエンス」とは何なのか、あまり具体的なイメージがつかめていませんでした。本書はデータサイエンスというとても幅広い分野の知識大系を学べるシリーズの第一弾です。入門と題して、素人でもこの分野の概要を大まかに掴めるよう広く浅く、わかりやすい一冊になっていてとてもおすすめです。本書におけるデータサイエンスとは、多くのサンプル数を持つデータを統計的に処理して、意味のある解釈を導き出し、意思決定や商品開発などに活かすこと、ということだと思います。それをAからZまで、平均値や標準偏差といった統計学の基礎から、ディープラーニングといった最新の理論までをざっと解説してくれます。さらには最新の応用分野が数多く紹介されています。まずはこれを読んで、特に興味をもった分野を選んでシリーズの中から選んでさらに読み進めていくと良いでしょう。

基本情報

作者:竹村彰通(情報科学者)、他

発行日:2019/3/29

ページ数:201

ジャンル:NDC 007, 総記>情報科学

読みやすさ

難易度:教科書的で淡白な文章ですが、とても分かりやすいです。数式は細かい説明は省いて、割り切って結論だけ書かれています。

事前知識:統計学、PC、その他の知識ゼロからでも学べます

おすすめ予習本:

目次とポイント

第1章 現代社会におけるデータサイエンス:データ資源の増大でデータサイエンスの重要性が高まっている

第2章 データ分析の基礎:統計学が基礎となっている

第3章 データサイエンスの手法:よく使われるデータの分析手法の紹介

第4章 コンピュータを用いた分析:EXCEL, R, Pythonの初歩

第5章 データサイエンスの応用事例:応用分野の広さ(マーケティングから医学まで)

第6章 より進んだ学習のために:文献ガイド

感想

最近は『FUCTFULLNESS』がベストセラーになったりと、物事を事実ベースで科学的に解釈、判断していく意識が高まっているように見えます。そのための基礎となる分野だという意味で、データサイエンスの重要性の高まりは時代の流れでしょう。世の中、シンプルな数式で表される法則に沿って明確に解釈できる現象なんてほとんどありません。人間の行動然り、自然現象然り、多くのファクターが複雑に絡み合っていて、単純な解釈を許しません。これまでは、そういった複雑なことに対して、人間の直感や経験にしたがって判断してきました。しかし、認知心理学の研究が示すように人間の直感には強いバイアスがかかっており判断の精度がとても低いです。それを避ける最高のツールが統計学を基礎としたデータサイエンスです。スマホやIoTによるビッグデータの蓄積と、コンピュータの処理能力の進化によってそのツールの強みが急上昇しているのが今なのではないでしょうか。データサイエンスは、それを専門にする人だけではなく、あらゆる業界の人々にとって必須のリテラシーになりつつあるのかもしれません。

コメント

タイトルとURLをコピーしました