文字コード
日本語表記はUTF8を利用
pythonは、UTF8に対応しているため、UTF8エンコーディングを使用すると日本語が利用可能です。
スクリプトの先頭で文字コード設定
pythonで日本語を使用する場合は、ソースコードの先頭に、文字コードを指定します。 これを省略すると、正しく表示されない、エラーになる、等の可能性があります。
# coding: utf-8 # coding=utf-8 # -*-coding: utf-8 -*- # vim:set fileencoding=utf-8:
上記のうち、いずれかのコードを書くようにしてください。 3 行めはemacsライクな記法、4 行めはvimライクな記法です。 vim記法を用いると、vimエディタで編集する時にマジックコメントが利用できます(vim-users.jp Hack #136: Pythonインタフェースを使う(2)を参照)。
文字列の長さを取得する
日本語文字列の長さを取得する場合は、普通にlen関数を使うとおかしくなります(ASCII扱いで長さを調べるため)。この場合は、以下のように、uを追加して評価すると、日本語として文字数をカウントします。
len(u'日本語文字列')
UTF-8以外の文字コード
携帯サイト等でShift_JISを使いたい、等の特別な理由の無い限り、UTF-8を使用してプログラミングすることを推奨します。 UTF8以外を使用して日本語表示する場合は、JapaneseCodecsパッケージのインストール・設定が必要です。