gymnoの自由談

音楽系、プログラミング系の内容 方針はいずれ

日本語ファイルを読む

pythonshift_jiscsvファイルを読みたいとする

#-*- coding:utf-8 -*-
import codecs
fin=codecs.open('input.csv','r','shift_jis')
for line in fin.readlines():
    list =[]
    for word in line.split(','):
        list.append(word)
    for i in range(len(list)):
        print list[i].encode('utf-8'),

encodeしてからリストに格納したらうまく行かなかった
リストに格納するときは読んだままを入れるのか

とはいえ この書き方だと読むファイルがshift_jis限定だな しかしそれは仕方ないかもしれない
参考
Python でUTF-8, shift_jis, euc_jpなど日本語を使う方法
[Python-ml-jp 3446] Re: プログラムファイルと文字コードが異なる場合の、文字の追加

追記
http://local.joelonsoftware.com/mediawiki/index.php/間違ったコードは間違って見えるようにする
にあるusプレフィックスはこういうときに使うのかも  かしこいハンガリアン表記