String.prototype.normalizeが実装された

実装されたメソッド

String.prototype.normalize(form = "NFC")
form（初期値："NFC"）の形式で正規化した文字列を返す

詳細

複雑な文字は、一文字に見えても、文字コード上は複数の構成文字から成り立っている場合がある。
例えば、『が』(濁点付き平仮名か)と、『か』(平仮名か) ＋『゛[U+3099]』(合成用濁点)は、同じ意味を持ち同じように見えるが、文字コードが異なるためそのままではプログラム上では異なる文字列として扱われてしまう。

ga_NFC = 'が'        // 'が'
ga_NFD = 'か\u3099'  // 'が'

escape(ga_NFC)  // '%u304C'
escape(ga_NFD)  // '%u304B%u3099'

ga_NFC.length  // 1
ga_NFD.length  // 2

ga_NFC == ga_NFD  // false

前者のような形式を（Normalization Form）NFC（Composition：合成）、後者をNFD（Decomposition：分解）と言う。
また、この２つに加えて、文字を基本的な形でのみ持つNFKCとNFKDがあり、これらに変換すると英数字等は半角に、カタカナは全角に、縦書用文字は横書用文字に、『①』は『1』に、『Ⅶ』は『VII』に、『㌀』はそれぞれ『ア[パ]ート』(length:4)と『ア[ハ+゜ ]ート』(length:5)になる。
String.prototype.normalizeメソッドは、これら４種類の正規化形式を引数に取り、文字列をその形式で正規化してくれるものである。

ga_norm = ga_NFD.normalize()  // NFCにする時は引数は省略可能

escape(ga_NFD)   // '%u304B%u3099'
escape(ga_norm)  // '%u304C'

ga_NFD.length   // 2
ga_norm.length  // 1

ga_NFD == ga_norm  // false
ga_NFC == ga_norm  // true

応用例

全角数字列を数値に変換する

suuji = '１２３４５'

num = +suuji.normalize('NFKC')  // 12345

時計用ローマ数字の画像を少ない画像を組み合わせて表現する

function toRNumIMG(hour) {
    var roman = 'ⅫⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪ'[hour%12]
    var alphas = roman.normalize('NFKC')  // ローマ数字を'I','V','X'に分解する
    for (var html = '', i = 0; i < alphas.length; ++i) {
        html += '<img src="img/'+ alphas[i] +'.jpg">'
    }
    return html
}

toRNumIMG(6)  // '<img src="img/V.jpg"><img src="img/I.jpg">'