2025-02

スポンサーリンク
4_読書等

読書メモ「イシューからはじめよ」

イシューからはじめよ―知的生産の「シンプルな本質」-安宅和人/dp/4862760856第1章 イシュードリブン・自分なりの仮説を立て、それを議論の出発点にする。ありがちなのは議論のスタートに「調べる」ことが設定されているもの。それは自分の...
1_統計系

Python: あるカテゴリ項目を基準に、df内の数値項目に対して有意差検定をばーっとやる

やりたいこと統計センターのオープンデータである「家計消費(SSDSE-C)」を用いて、品目ごとに東日本と西日本の消費量に有意差があるかを調べる。特定の項目を取り出して個別にやるのではなく、数値項目すべてに対して有意差検定を行なっていく。実装...
2_Python操作メモ

Python操作メモ:DataFrameの各数値項目を、特定の数値項目でまとめて割る

やりたいこと統計センターのオープンデータである「家計消費(SSDSE-C)」は、都道府県別で世帯あたり各食材品目の消費量をまとめているデータである。このままのデータでも十分に有用であるが、都道府県によって平均世帯人員が異なるため、「1人あた...
2_Python操作メモ

Pythonエラー:csvファイルをread_csvしようとした時に「UnicodeDecodeError: ‘utf-8’ codec can’t decode byte xxxx in position xx: invalid start byte」のエラーが出たときの対応

jupyter Notebook等の環境においてpd.read_csvでcsvファイルを読み込もうとした時に、以下のようにutf-8が読めないエラーで怒られることがある。UnicodeDecodeError: 'utf-8' codec c...
1_統計系

東日本と西日本で納豆の消費量に有意差はあるか?

調べたいことSSDSE(教育用標準データセット)の家計消費データセットから、納豆の消費量が東日本と西日本で明らかに差があるかを調べる。一般的なイメージだと、東日本の方が西日本より有意に消費量が多そう。方針・家計消費データセット(SSDSE-...
2_Python操作メモ

【Python】dfの「都道府県」の項目から、「東日本」「東北」等のカテゴリ変数を付与する

やりたいことオープンデータにはよく「都道府県」の項目が存在する。(例)   →家計消費データこの「都道府県」項目から、各レコードに「東日本/西日本」や「東北」等のカテゴリ変数を付与したいときの実装を考える。実装ライブラリのインポート、データ...
スポンサーリンク