2007-05-29から1日間の記事一覧

マルチバイトの文字列長を取得

sizeメソッドやlengthメソッドは文字列長ではなくバイト長を取得するらしい。 p "ぬるぽ".size # => 9 UTF-8では、マルチバイト文字の2バイト目以降の上位2ビットは必ず10になるので、こんな感じで文字列長が取れるだろうか。 def utf8length(str) str.unpac…