文字列Unicode

C言語

リテラルの前にLをつけるとワイド文字になる。

wchar_t* p = L"AAA";

python

uを付けるとUnicodeになる。 Unicodeのencode()を使うと文字列を特定の文字コードひエンコードできる。

>>> u"あいう".encode('utf-8')
'\xc2\x82\xc2\xa0\xc2\x82\xc2\xa2\xc2\x82\xc2\xa4'

これをUnicodeに戻すには以下。

unicode('\xc2\x82\xc2\xa0\xc2\x82\xc2\xa2\xc2\x82\xc2\xa4', 'utf-8')
u'\x82\xa0\x82\xa2\x82\xa4'

Front page   Diff Backup Reload   List of pages Search Recent changes   Help   RSS of recent changes
Last-modified: Wed, 27 Apr 2011 16:10:48 JST (2218d)