内容

データ分析で最も重要なDataFrame(データフレーム: df)を自在に操るために必要な技術について説明します。
ここでは、dfの行・列の追加・削除、置換、フィルタ(抽出)といった、Excelでよく使う技術にフォーカスします。

データの数が少なければ、Excelでデータソースを加工した方が早いことが多いです。
一方で、データの制約上それが出来ない、或いは、加工する条件が複雑でPythonで処理をした方が早い場合もあります。
何れにしてもdfを自分が欲しい形に加工、成型する技術はデータ分析の必須の技術です。

目次

4.1. 列の追加・挿入、削除
4.2. 行の追加・挿入、削除
4.3. 条件を指定してデータを抽出(フィルター)
4.4. ソート(並べ替え)
4.5. 列の順番の入れ替え
4.6. 各列に特定の文字が何個あるか調べる
4.7. DFでの簡単な計算
4.8. グループ化して計算(.groupby())
4.9. 横方向への結合、連結(merge, concat, join)
4.10. 縦方向への結合、連結(concat, append)