1_統計系 Python: あるカテゴリ項目を基準に、df内の数値項目に対して有意差検定をばーっとやる やりたいこと統計センターのオープンデータである「家計消費(SSDSE-C)」を用いて、品目ごとに東日本と西日本の消費量に有意差があるかを調べる。特定の項目を取り出して個別にやるのではなく、数値項目すべてに対して有意差検定を行なっていく。実装... 2025.02.09 1_統計系2_Python操作メモ
2_Python操作メモ Python操作メモ:DataFrameの各数値項目を、特定の数値項目でまとめて割る やりたいこと統計センターのオープンデータである「家計消費(SSDSE-C)」は、都道府県別で世帯あたり各食材品目の消費量をまとめているデータである。このままのデータでも十分に有用であるが、都道府県によって平均世帯人員が異なるため、「1人あた... 2025.02.08 2_Python操作メモ
2_Python操作メモ Pythonエラー:csvファイルをread_csvしようとした時に「UnicodeDecodeError: ‘utf-8’ codec can’t decode byte xxxx in position xx: invalid start byte」のエラーが出たときの対応 jupyter Notebook等の環境においてpd.read_csvでcsvファイルを読み込もうとした時に、以下のようにutf-8が読めないエラーで怒られることがある。UnicodeDecodeError: 'utf-8' codec c... 2025.02.08 2_Python操作メモ
1_統計系 東日本と西日本で納豆の消費量に有意差はあるか? 調べたいことSSDSE(教育用標準データセット)の家計消費データセットから、納豆の消費量が東日本と西日本で明らかに差があるかを調べる。一般的なイメージだと、東日本の方が西日本より有意に消費量が多そう。方針・家計消費データセット(SSDSE-... 2025.02.02 1_統計系
2_Python操作メモ 【Python】dfの「都道府県」の項目から、「東日本」「東北」等のカテゴリ変数を付与する やりたいことオープンデータにはよく「都道府県」の項目が存在する。(例) →家計消費データこの「都道府県」項目から、各レコードに「東日本/西日本」や「東北」等のカテゴリ変数を付与したいときの実装を考える。実装ライブラリのインポート、データ... 2025.02.01 2_Python操作メモ
2_Python操作メモ 【Python】matplotlib.pyplotの日本語表示がJupyter Notebook上で文字化けするときの対処 ◆結論japanize_matplotlibをインポートしておく。描画の際に引数で指定する必要も特になし。◆解説import pandas as pdimport matplotlib.pyplot as pltサンプルデータを作り、plt... 2025.01.25 2_Python操作メモ