Unicode 値が U+2F00 より小さい文字はローマ字と見なされます。 Unicode 値が U+2F00 またはそれより大きい文字は非ローマ字以外と見なされます。
ローマ文字の範囲に含まれる文字は、 Latin、Latin-1 Supplement、Latin Extended-A & B、IPA Extensions、Spacing Modifier Letters、Combining Diacritical Marks、Greek、Cyrillic、Armenian、Hebrew、Arabic、Devanagari、Bengali、Gurmukhi、Gujarati、Oriya、Tamil、Telugu、Kannada、Malayalam、Thai、Lao、Tibetan、Georgian、Hangul Jamo の文字ブロック、およびその他の Latin と Greek の拡張ブロックに属する文字です。
ローマ字以外の範囲内にある文字は、CJK 記号/句読点、Hiragana、Katakana、Bopomofo、Hangul Compatibility Jamo、Kanbun、CJK Unified Ideographs などがあります。