独学でPythonを学ぶページです
何かしらの言語で、プログラムを書いた経験があれば、このページを書籍のように参照し、独学でPythonの習得が可能です。言語はVBAで十分です。
実践で直面する問題にも焦点を当て、質の高い情報を提供しています。
どこを目指すのか?
まずは、第1部で、複数のシートにデータが入力されたExcelを読み込み、機械学習に必要なデータの形に仕上げ、出力できるようになることを目指します。
機械学習の前半部分で、データサイエンティストの仕事の8割を占める部分です。
基本的にファイルの出力はcsv形式で行い、Excel形式では出力しません。
ここまで出来れば、面接で「Pythonが使える」と言って差し支えありません。
あとは、良くも悪くも、Pythonに渡せば、何かしらの結果は得られます。
筆者は長く証券市場に携わっていた為、伝える内容は主に金融データです。
目次
第1部 データの処理
第1章 csv、Excelの読み込み、出力
1.1. csvファイルを読み込む
1.2. csv形式で出力する
1.3. Excelファイルを読み込む
第2章 List, Series, DataFrame
2.1. List, Series, DataFrameの違い
2.2. Listを操作する
2.3. Seriesを操作する
第3章 DataFrameを操作する(1)
3.1. DFのカラム名、index名を操る
3.2. DFの型を調べる、変更する
3.3. DFの行数、列数や詳細な情報を調べる
3.4. どんなデータが何個あるか調べる
第4章 DataFrameを操作する(2)
4.1. 列の追加・挿入、削除
4.2. 行の追加・挿入、削除
4.3. 条件を指定してデータを抽出(フィルター)
4.4. ソート(並べ替え)
4.5. 列の順番の入れ替え
4.6. 各列に特定の文字が何個あるか調べる
4.7. DFでの簡単な計算
4.8. グループ化して計算(.groupby())
4.9. 横方向への結合、連結(merge, concat, join)
4.10. 縦方向への結合、連結(concat, append)
第5章 List, Series, DataFrame, array 相互の変換
5.1. array(配列)について
5.2. Listへの変換(se=>li, df=>li, ary=>li)
5.3. DataFrameへの変換(li=>df, se=>df)
5.4. arrayとDataFrame間の変換(ary=>df, df=>ary)
第6章 データの加工
6.1. 文字列の数字を数値へ(特定の文字を除去)
6.2. 文字を検索して要素を置換
第7章 欠損値の処理
7.1. 欠損値を調べる
7.2. 欠損値を埋める
7.3. 欠損値を削除
第8章 データ分析の為のデータ加工
8.1. ダミー変数で置き換える
8.2. ビン分割
第9章 グラフの描き方
9.1. 1つのグラフを描画する
9.2. 1つの枠に複数のグラフを描画する
Python Web講座ファイル (YouTube使用ファイル)
※現在動画は公開していません。
YouTubeの動画で使用したファイルはこちらです
ここには、どなたでも視聴可能なYouTubeで使用したデータとコードを掲載しています。
オンライン講座(有料)で使用するファイルではありませんし、内容も異なります。
ファイル名はサーバー保存時の名前の重複を回避する為、動画内でのファイル名と異なる場合があります。適宜修正してください。
ソースコード(.jpynb または .py)について
- Pythonのコードは外部サイト(GitHub)に掲載しています。
- ソースコードはリンク先(GitHub)の右上の「Downlowad ZIP」からダウンロードしてください。
(1)予備講座
- 機械学習1(気象データ編) Part1 データの加工「実際にどうやっているのか?」
data.csv , data_win , ML1_part1.ipynb (GitHub)
- 機械学習1(気象データ編) Part2 機械学習の実行「実際にどうやっているのか?」
data_win2.csv , ML1_part2.ipynb (GitHub) , ML1_part2.py (GitHub)