プログラミング

エクセルから作ったCSVファイルが読み込めなかった話

pandas(パンダス)って、ライブラリを学習する前の段階で躓いて、解決に1時間くらいかかったよ
書籍の通りにやってないんじゃない?
その通りにやってもうまくいかなかっただ!信じてくれ!!

pandas(パンダス)という外部ライブラリを使用して、CSVファイルの表データを読み込む作業をしていたのですが、チョー序盤で手こずりました。

そもそもCSVファイルをどう作成するのか検索しながらで、ExcelからCSVファイルにして保存したんですが、読み込もうとしても長文のエラーが出てしまうんです。

調べて分かったことは、Excelで保存されたCSVファイルは、通常はUTF-8エンコーディングではなく、代わりにロケールやシステム設定に基づいたエンコーディングを使用しているとのこと。

そのため、UTF-8エンコーディングで読み取ることができないために、エラーになっていたということらしい。

そのため、書籍では、

import pandas as pd
df = pd.read_csv(“test.csv”)
print(df)

となっていたんです。

解決方法は、read_csv関数のencodingパラメータを使用して、適切なエンコーディングを指定する。

今回は、ファイルがShift-JISでエンコードされていらしく(色々と入力して辿り着いた)、下記のように太文字のコードを追加したら、ちゃんと出力してくれました。

import pandas as pd
df = pd.read_csv(“test.csv”,encoding=’shift_jis’)
print(df)

ここから、やっとスタートですわ。

もし、同じような方がいたら、参考になればと思いました。