「Python 実践データ分析100本ノック」の感想文と注意点
「 Python 実践データ分析100本ノック 」を読みました。 普段はエクセルしか使わないんですが、Pythonでもデータ分析できるようになりたいな~と思っていたところちょうどいよいテーマの本が出ていたので購入。1本ずつ写経を続け、100本達成したので、感想文と注意点(正誤表?)を備忘録代わりにまとめます。 ・自習用にデータファイルと.ipynb形式のノートブックとその解答がついているため、本文に記載されているプログラムを写経しながら分析の流れを自分の手で実行できます。 ・データの前処理のやり方が最初の章になっています。データ分析は データの前処理が一番大変 (?)と言っても過言ではないので、ここにページを割いているのはいいなぁとおもいました。もちろん、これだけで前処理を極められるものでは当然ないですが、こういう処理が必要ですよ、と認識できるのは良いと思いました。 ・データのプロットだけではなく、画像処理や自然言語処理まで触れるので楽しいです。もちろん表層だけなので細かいところは専門書で更に突き詰める必要があります。 ・後半のネットワーク分析や動画処理のところは、自前PCだと少し重かったりするので、Google colab notebookなどのクラウド上で処理したほうが速いとおもいます。パッケージさえ使えれば、Notebookの使い勝手は変わりませんから。 ・今回自前PCのAnaconda 環境で処理を実行しましたが、ところ所、プリインストールされていないパッケージが利用されていますので、適宜必要なパッケージをインストールする必要があります。これが案外大変なので要注意です。その点、上記のColab等のほうがやはり、やりやすいかもしれません。 ・今回データ分析の雰囲気がつかめたので、今度は自然言語処理とかでもう少し深く勉強していきたいなと思っています。おもしろいので。 まあ、仕事では一切使わないスキルですが、、、 以下、気になった注意点(自環境での正誤表)です。 オリジナルの正誤表はこちらの サポートページ で確認できます。 なお、じぶんの使用した私用PC(ドッw)のスペックと環境は こちらの記事 のとおりです。 一文字打つたびにフリーズする労働で使用しているPCの100倍有能です>< 全般 ・こちらの本