データ分析、機械学習といえば"Python"ということで「東京大学のデータサイエンティスト育成講座(Pythonで手を動かして学ぶデータ分析)」という本を6月8日(土)に購入し自主訓練をから始めています。
AnacondaというPython+統計分析・機械学習ライブラリがそろっているパッケージをインストールし、その編集ツール ”Jupyter Notebook"(Webブラウザで開く)を使ってPythonのコードを学びながら書き始めています。
下の図は本の演習問題 (10までの素数を表示する)で、私なりに書いたPythonコードと実行結果です。
図:私なりに書いた10までの素数を表示する
Pythonコード+結果(下の2行)
Jupyter Notebookはデフォルトだと全体的に白っぽくておじさまの目には易しくないので、VIエディタを彷彿させるテーマをインストールして使っています。
そんなことはどうでもよいのですが、フォートラン・C言語等のレガシーなプログラミング言語世代の私としては、Pythonはカッコや記号が少なく、より自然言語に近い形で書けるのでステキと思います。
for文によるループ処理なんて、
for i in range(1, n):
処理1
処理2
という感じで書いただけで、1~n-1の範囲でiをインクリメントしながら回ります。"for"の右の"in"や"range()"も、自然言語っぽくてステキです。リスト等のデータの扱い方も、詳細は割愛しますが、シンプルだなあと思います。
感想:ワークメモリが減少しつつあるおじさま・おばさまにこそPythonはやさしい。
当面は、統計分析や機械学習の基礎を学ぶといったところですが、もう少し先には自分の英語学習の問題集の分析や、自分の英語レベルくらいはある機械学習エージェントの作成などにトライできればなあと思っています。