matplotlibでヒストグラム描画遅すぎるしグラフも変と思ったらラベル行のせいだった
仕事でヒストグラムを作成したい機会がやってきたので、これはPythonや!と意気揚々とデータを読み込んでみたところ、エラーが起きたりなんだかんだとしていてわかったことをメモしておこう。
matplotlibでヒストグラムを作ろうとしたけど、描画がくっそ遅い
ていうか終わらない。
10列×2000行 ⇒ NaNとかいうエラー(空白セルがダメぽ?)
2列×2000行 ⇒ 空白を全部消したけど終わらない
2列×10行 ⇒ 表示した
2列×10行くらいのデータならサクッとヒストグラムにしてくれる。
私がやりたかったのは最低でも1000以上あるデータの図示。
全然終わらないの。そんならExcelでやるわ、みたいな。
で、気付いたんですけど、なんかヒストグラムの表示自体もおかしい。
あれ?もしかして・・・というわけでラベル行を削除。すると、2列×2000行でもサクッと表示してくれました。数値だけ読み込んでくれたらいいのに・・・
と思いましたがまあいいか。
matplotlibを使うときはラベル行は消せ
これが今回の教訓。ちなみにやりたいの単純なカウントではなく複数条件を絡ませたヒストグラムの表示。
よーし、やるぞー!