2_Python操作メモ

スポンサーリンク
1_統計系

Python: あるカテゴリ項目を基準に、df内の数値項目に対して有意差検定をばーっとやる

やりたいこと統計センターのオープンデータである「家計消費(SSDSE-C)」を用いて、品目ごとに東日本と西日本の消費量に有意差があるかを調べる。特定の項目を取り出して個別にやるのではなく、数値項目すべてに対して有意差検定を行なっていく。実装...
2_Python操作メモ

Python操作メモ:DataFrameの各数値項目を、特定の数値項目でまとめて割る

やりたいこと統計センターのオープンデータである「家計消費(SSDSE-C)」は、都道府県別で世帯あたり各食材品目の消費量をまとめているデータである。このままのデータでも十分に有用であるが、都道府県によって平均世帯人員が異なるため、「1人あた...
2_Python操作メモ

Pythonエラー:csvファイルをread_csvしようとした時に「UnicodeDecodeError: ‘utf-8’ codec can’t decode byte xxxx in position xx: invalid start byte」のエラーが出たときの対応

jupyter Notebook等の環境においてpd.read_csvでcsvファイルを読み込もうとした時に、以下のようにutf-8が読めないエラーで怒られることがある。UnicodeDecodeError: 'utf-8' codec c...
2_Python操作メモ

【Python】dfの「都道府県」の項目から、「東日本」「東北」等のカテゴリ変数を付与する

やりたいことオープンデータにはよく「都道府県」の項目が存在する。(例)   →家計消費データこの「都道府県」項目から、各レコードに「東日本/西日本」や「東北」等のカテゴリ変数を付与したいときの実装を考える。実装ライブラリのインポート、データ...
2_Python操作メモ

【Python】matplotlib.pyplotの日本語表示がJupyter Notebook上で文字化けするときの対処

◆結論japanize_matplotlibをインポートしておく。描画の際に引数で指定する必要も特になし。◆解説import pandas as pdimport matplotlib.pyplot as pltサンプルデータを作り、plt...
スポンサーリンク