「Python2年生 データ分析のしくみ」でデータ分析をしてみる【プログラミング・初心者】

programming.jpg

こんにちは

Pythonでスクレイピングなどで集めたデータをどのように分析したら良いか困っていませんか。

そんな方に向けたPython〇年生シリーズ第3弾「Python2年生 データ分析のしくみ」です。

本書はデータ分析を初心者にもわかりやすく解説する本です。

データ分析の一連の流れを一冊で解説してくれます。

この本を読んでわかること
  • データ分析とは
  • データ分析の手順:PPDACサイクル
  • データ分析の流れ
  • ライブラリの使い方
  • データの見方

本書ではpandas,matplotlib,sabornという3つのライブラリを使ってデータ分析を使います。

データ分析に必要なライブラリの使い方。分析の一連の流れがわかるります。

そのため「データ分析ってなに?」という初学者にオススメの1冊となっています。

「Python 2年生 データ分析のしくみ」を読んだ感想

Awareness.jpg

感想は以下の通りです。

  • ライブラリの使い方をわかりやすく解説
  • データ分析の流れがわかる

ライブラリの使い方をわかりやすく解説

本書はデータ分析を行うために、以下の3つのライブラリを使用します。

  • pandas
  • matplotlib
  • seaborn

これらのライブラリで基本的な使い方を解説してくれる。

そのため、初心者にはわかりやすいものとなっています。

pandas

pandasはデータの読込や並び替え、欠損値の補完などを行うことができるライブラリです。

データ分析の前処理を行う段階で使用されます。

本書でもpandasの前処理について説明されており、pandasの使い方を十分に理解することが可能でしょう。

matplotlib

matplotlibはグラフを描画するライブラリです。

2Dだけでなく3Dを含めた多くの種類のグラフを描画することが可能です。

そのため、本書ではmatplotlibを用いることで見た目の良いグラフを描画しています。

seaborn

seabornはデータの可視化をするライブラリです。

seabornの内部ではmatplotlibが動いています。

綺麗なグラフを描画でき、matplotlibと比べて少ないコードで図を描画できるメリットがあります。

本書ではseabornの機能を用いて、わかりやすいグラフを描画する方法が書かれています。

データ分析の流れがわかる

私のようなデータ分析初心者はどんな手順で、データを分析してよいかわかりません。

そのため、本書ではデータ分析を行うための手順を1番初めに書かれています。

本書でデータ分析は5つの手順。PPDACで問題を進めていきます。

  1. Problem[問題の把握]:なぜ分析をするのか?
    ・問題を明確にする
    ・仮説を立てる
  2. Plan[調査の計画]:どうやって調査するのか?
    ・データを想定する
    ・収集計画を立てる
  3. Data[データの収集]:データを収集する。
    ・データを用意する
    ・このデータで大丈夫か調べる
  4. Analysis[データの分析]:データを分析する。
    ・データを要約して現状を把握する
    ・データの傾向や、法則をみる
  5. Conclusion[結論]:結論を考える。

上記の手順に沿ってデータ分析を行っていきます。

1度のデータ分析を行っても、問題解決しない場合は初めに戻り、❶Problem[問題の把握]に戻る。

これをPPDACサイクルといいます。

PPDACサイクルを行うことで、問題を解決していくのがデータ分析です。

「Python 2年生 データ分析のしくみ」がオススメな人

goodpoint.jpg

  • データ分析初心者
  • データ分析に必要な知識やライブラリの使い方を学びたい人

データ分析初心者

本書はデータ分析初心者にオススメできる1冊となっています。

その理由は以下になります。

  • 基礎知識やデータ分析の流れがわかる
  • データ分析に必要な文法を絞って、わかりやすく解説

基礎知識やデータ分析の流れがわかる

初学者はデータ分析の基礎知識やデータ分析の流れがわからない。

本書はそんな初学者にもわかりやすく、データ分析の流れがわかるように書かれている。

データ分析に必要な文法を絞って、わかりやすく解説

本書はデータ分析に必要なライブラリの文法を絞って、わかりやすく解説している。

そのため、データ分析とはなにか?に集中して勉強することができます。

本書の情報

以下に本書の情報をまとめていきます。

著者:森 巧尚(もり よしなお)

アプリ開発、技術書や電子工作マガジンなどでの執筆活動。関西学院大学非常勤講師、関西学院高等部非常勤講師、成安造形大学非常勤講師。プログラミングスクールコプリ講師など、プログラミングに関する幅広い活動を行っている。

本書:著者紹介より

目次

本書の目次は以下になります。

  1. 第1章:データ分析って何?
  2. 第2章:集めたデータは前処理が必要
  3. 第3章:データの集まりをひとことでいうと?:代表値
  4. 第4章:図で特徴をイメージしよう:グラフ
  5. 第5章:これって普通なこと?珍しいこと?:正規分布
  6. 第6章:関係から予測しよう:回帰分析

まとめ

本書はデータ分析初心者を焦点を当てた参考書になっています。

以下のような人にオススメです。

  • データ分析初心者
  • データ分析に必要な知識やライブラリの使い方を学びたい人

全ページカラー印刷のため、重要なポイントもわかりやすいです。

対話形式で進んでいくので、私たちが疑問に思っていることを言語化してくれます。

その部分を子供っぽいなと思う人もいると思いますが、内容はしっかりとしています。

データ分析って何?といった、何もわからない人にオススメできる1冊となっています。

コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA