模块 java.base
 java.lang

类 Character

java.lang.Object
java.lang.Character
所有已实现的接口:
Serializable , Comparable<Character> , Constable

public final class Character extends Object implements Serializable , Comparable <Character >, Constable
Character 类将原始类型 char 的值包装在一个对象中。 Character 类的对象包含一个类型为 char 的字段。

此外,此类还提供了大量的静态方法,用于确定字符的类别(小写字母、数字等)以及将字符从大写转换为小写,反之亦然。

Unicode 一致性

Character 的字段和方法是根据 Unicode 标准的字符信息定义的,特别是UnicodeData文件是 Unicode 字符数据库的一部分。此文件指定属性,包括每个分配的 Unicode 代码点或字符范围的名称和类别。该文件可从位于 http://www.unicode.org 的 Unicode Consortium 获得。

字符信息基于 Unicode 标准 15.0 版。

随着时间的推移,Java 平台支持不同版本的 Unicode 标准。以下 Java 版本升级到较新版本的 Unicode 标准,每个版本都表示新版本:

显示 Java 版本和支持的 Unicode 版本
Java 版本 Unicode版本
Java SE 20 Unicode 15.0
Java SE 19 Unicode 14.0
Java SE 15 Unicode 13.0
Java SE 13 Unicode 12.1
Java SE 12 Unicode 11.0
Java SE 11 Unicode 10.0
Java SE 9 Unicode 8.0
Java SE 8 Unicode 6.2
Java SE 7 Unicode 6.0
Java SE 5.0 Unicode 4.0
Java SE 1.4 Unicode 3.0
JDK 1.1 Unicode 2.0
JDK 1.0.2 Unicode 1.1.5
这些基本 Unicode 版本的变体,例如可识别的附录,在其他地方有记录。

Unicode 字符表示

char 数据类型(以及 Character 对象封装的值)基于原始 Unicode 规范,该规范将字符定义为固定宽度的 16 位实体。 Unicode 标准已更改为允许其表示需要超过 16 位的字符。合法 code point 的范围现在是 U+0000 到 U+10FFFF,称为 Unicode scalar value。 (参考U+的定义nUnicode 标准中的符号。)

从 U+0000 到 U+FFFF 的字符集 有时称为 Basic Multilingual Plane (BMP) 。代码点大于U+FFFF的Characters被称为supplementary characters。 Java 平台在 char 数组以及 StringStringBuffer 类中使用 UTF-16 表示。在此表示中,增补字符表示为一对 char 值,第一个来自 high-surrogates 范围 (\uD800-\uDBFF),第二个来自 low-surrogates 范围 (\uDC00-\uDFFF)。

因此,char 值表示基本多语言平面 (BMP) 代码点,包括代理代码点或 UTF-16 编码的代码单元。 int 值表示所有 Unicode 代码点,包括补充代码点。 int 的低(最低有效)21 位用于表示 Unicode 代码点,高(最高有效)11 位必须为零。除非另有说明,否则关于增补字符和代理项 char 值的行为如下:

  • 仅接受 char 值的方法不能支持增补字符。他们将代理项范围中的 char 值视为未定义字符。例如,Character.isLetter('\uD840') 返回 false,即使此特定值后跟字符串中的任何低代理值将表示一个字母。
  • 接受 int 值的方法支持所有 Unicode 字符,包括增补字符。例如,Character.isLetter(0x2F81A) 返回 true,因为代码点值表示一个字母(CJK 表意文字)。

在 Java SE API 文档中,Unicode code point 用于 U+0000 和 U+10FFFF 之间范围内的字符值,Unicode code unit 用于 16 位 char 值,它们是 UTF-16 编码的代码单元。有关 Unicode 术语的更多信息,请参阅 Unicode 词汇表

这是一个value-based类;程序员应该将 equal 的实例视为可互换的,并且不应使用实例进行同步,否则可能会发生不可预测的行为。例如,在未来的版本中,同步可能会失败。

自从:
1.0
参见:
  • 内部类总结

    内部类
    修饰符和类型
    描述
    static class 
    此类的实例表示 Unicode 字符集的特定子集。
    static final class 
    表示 Unicode 规范中字符块的字符子集系列。
    static enum 
    代表 Unicode 标准附件 #24:脚本名称 中定义的字符脚本的字符子集系列。
  • 字段摘要

    字段
    修饰符和类型
    Field
    描述
    static final int
    用于表示无符号二进制形式的 char 值的字节数。
    static final byte
    Unicode 规范中的通用类别“Mc”。
    static final byte
    Unicode 规范中的通用类别“Pc”。
    static final byte
    Unicode 规范中的通用类别“Cc”。
    static final byte
    Unicode 规范中的通用类别“Sc”。
    static final byte
    Unicode 规范中的通用类别“Pd”。
    static final byte
    Unicode 规范中的通用类别“Nd”。
    static final byte
    Unicode 规范中的弱双向字符类型“AN”。
    static final byte
    Unicode 规范中的弱双向字符类型“BN”。
    static final byte
    Unicode 规范中的弱双向字符类型“CS”。
    static final byte
    Unicode 规范中的弱双向字符类型“EN”。
    static final byte
    Unicode 规范中的弱双向字符类型“ES”。
    static final byte
    Unicode 规范中的弱双向字符类型“ET”。
    static final byte
    Unicode 规范中的弱双向字符类型“FSI”。
    static final byte
    Unicode 规范中的强双向字符类型“L”。
    static final byte
    Unicode 规范中的强双向字符类型“LRE”。
    static final byte
    Unicode 规范中的弱双向字符类型“LRI”。
    static final byte
    Unicode 规范中的强双向字符类型“LRO”。
    static final byte
    Unicode 规范中的弱双向字符类型“NSM”。
    static final byte
    Unicode 规范中的中性双向字符类型“ON”。
    static final byte
    Unicode 规范中的中性双向字符类型“B”。
    static final byte
    Unicode 规范中的弱双向字符类型“PDF”。
    static final byte
    Unicode 规范中的弱双向字符类型“PDI”。
    static final byte
    Unicode 规范中的强双向字符类型“R”。
    static final byte
    Unicode 规范中的强双向字符类型“AL”。
    static final byte
    Unicode 规范中的强双向字符类型“RLE”。
    static final byte
    Unicode 规范中的弱双向字符类型“RLI”。
    static final byte
    Unicode 规范中的强双向字符类型“RLO”。
    static final byte
    Unicode 规范中的中性双向字符类型“S”。
    static final byte
    未定义的双向字符类型。
    static final byte
    Unicode 规范中的中性双向字符类型“WS”。
    static final byte
    Unicode 规范中的通用类别“Me”。
    static final byte
    Unicode 规范中的通用类别“Pe”。
    static final byte
    Unicode 规范中的通用类别“Pf”。
    static final byte
    Unicode 规范中的通用类别“Cf”。
    static final byte
    Unicode 规范中的通用类别“Pi”。
    static final byte
    Unicode 规范中的通用类别“Nl”。
    static final byte
    Unicode 规范中的通用类别“Zl”。
    static final byte
    Unicode 规范中的通用类别“Ll”。
    static final byte
    Unicode 规范中的通用类别“Sm”。
    static final int
    a 的最大值 Unicode代码点 ,常量 U+10FFFF
    static final char
    UTF-16编码中aUnicode 高代理码单元的最大值,常量'\uDBFF'
    static final char
    UTF-16编码中aUnicode 低代理代码单元的最大值,常量'\uDFFF'
    static final int
    可用于与字符串相互转换的最大基数。
    static final char
    UTF-16 编码中 Unicode 代理代码单元的最大值,常量 '\uDFFF'
    static final char
    该字段的常量值是 char , '\uFFFF' 类型的最大值。
    static final int
    a 的最小值 Unicode代码点 ,常量 U+0000
    static final char
    UTF-16编码中aUnicode 高代理码单元的最小值,常量'\uD800'
    static final char
    UTF-16编码中aUnicode 低代理代码单元的最小值,常量'\uDC00'
    static final int
    可用于与字符串相互转换的最小基数。
    static final int
    a 的最小值 Unicode 补充代码点 ,常量 U+10000
    static final char
    UTF-16 编码中 Unicode 代理代码单元的最小值,常量 '\uD800'
    static final char
    该字段的常量值是 char , '\u0000' 类型的最小值。
    static final byte
    Unicode 规范中的通用类别“Lm”。
    static final byte
    Unicode 规范中的通用类别“Sk”。
    static final byte
    Unicode 规范中的通用类别“Mn”。
    static final byte
    Unicode 规范中的通用类别“Lo”。
    static final byte
    Unicode 规范中的一般类别“否”。
    static final byte
    Unicode 规范中的通用类别“Po”。
    static final byte
    Unicode 规范中的通用类别“So”。
    static final byte
    Unicode 规范中的通用类别“Zp”。
    static final byte
    Unicode 规范中的通用类别“Co”。
    static final int
    用于表示无符号二进制形式的 char 值的位数,常量 16
    static final byte
    Unicode 规范中的通用类别“Zs”。
    static final byte
    Unicode 规范中的通用类别“Ps”。
    static final byte
    Unicode 规范中的通用类别“Cs”。
    static final byte
    Unicode 规范中的通用类别“Lt”。
    static final Class<Character>
    代表原始类型 charClass 实例。
    static final byte
    Unicode 规范中的通用类别“Cn”。
    static final byte
    Unicode 规范中的通用类别“Lu”。
  • 构造方法总结

    构造方法
    构造方法
    描述
    Character(char value)
    已弃用,将被删除:此 API 元素可能会在未来版本中删除。
    使用此构造方法很少是合适的。
  • 方法总结

    修饰符和类型
    方法
    描述
    static int
    charCount(int codePoint)
    确定表示指定字符(Unicode 代码点)所需的 char 值的数量。
    char
    返回此 Character 对象的值。
    static int
    codePointAt(char[] a, int index)
    返回 char 数组给定索引处的代码点。
    static int
    codePointAt(char[] a, int index, int limit)
    返回 char 数组给定索引处的代码点,其中只能使用 index 小于 limit 的数组元素。
    static int
    codePointAt(CharSequence seq, int index)
    返回 CharSequence 的给定索引处的代码点。
    static int
    codePointBefore(char[] a, int index)
    返回 char 数组给定索引之前的代码点。
    static int
    codePointBefore(char[] a, int index, int start)
    返回 char 数组给定索引之前的代码点,其中只能使用 index 大于或等于 start 的数组元素。
    static int
    codePointBefore(CharSequence seq, int index)
    返回 CharSequence 的给定索引之前的代码点。
    static int
    codePointCount(char[] a, int offset, int count)
    返回 char 数组参数的子数组中的 Unicode 代码点数。
    static int
    codePointCount(CharSequence seq, int beginIndex, int endIndex)
    返回指定 char 序列的文本范围内的 Unicode 代码点数。
    static int
    返回给定字符名称指定的 Unicode 字符的代码点值。
    static int
    compare(char x, char y)
    以数字方式比较两个 char 值。
    int
    compareTo(Character anotherCharacter)
    比较两个 Character 对象的数值。
    返回包含此实例标称描述符的 Optional
    static int
    digit(char ch, int radix)
    返回指定基数中字符 ch 的数值。
    static int
    digit(int codePoint, int radix)
    返回指定基数中指定字符(Unicode 代码点)的数值。
    boolean
    equals(Object obj)
    将此对象与指定对象进行比较。
    static char
    forDigit(int digit, int radix)
    确定指定基数中特定数字的字符表示形式。
    static byte
    返回给定字符的 Unicode 方向性属性。
    static byte
    getDirectionality(int codePoint)
    返回给定字符(Unicode 代码点)的 Unicode 方向性属性。
    static String
    getName(int codePoint)
    返回指定字符的名称 codePoint ,如果代码点为 unassigned 则返回 null。
    static int
    getNumericValue(char ch)
    返回指定 Unicode 字符表示的 int 值。
    static int
    getNumericValue(int codePoint)
    返回指定字符(Unicode 代码点)代表的 int 值。
    static int
    getType(char ch)
    返回一个值,指示字符的一般类别。
    static int
    getType(int codePoint)
    返回一个值,指示字符的一般类别。
    int
    返回此 Character 的哈希码;等于调用 charValue() 的结果。
    static int
    hashCode(char value)
    返回 char 值的哈希码;与 Character.hashCode() 兼容。
    static char
    highSurrogate(int codePoint)
    返回 代理对 的前导代理项 (a 高代理码单元 ),表示 UTF-16 编码中指定的补充字符(Unicode 代码点)。
    static boolean
    isAlphabetic(int codePoint)
    确定指定字符(Unicode 代码点)是否为字母。
    static boolean
    isBmpCodePoint(int codePoint)
    确定指定字符(Unicode 代码点)是否在 基本多语言平面 (BMP) 中。
    static boolean
    isDefined(char ch)
    确定字符是否以 Unicode 定义。
    static boolean
    isDefined(int codePoint)
    确定字符(Unicode 代码点)是否以 Unicode 定义。
    static boolean
    isDigit(char ch)
    确定指定字符是否为数字。
    static boolean
    isDigit(int codePoint)
    确定指定字符(Unicode 代码点)是否为数字。
    static boolean
    isHighSurrogate(char ch)
    确定给定的 char 值是否为 Unicode 高代理码单元(也称为前导代理代码单元).
    static boolean
    确定指定字符是否应被视为 Java 标识符或 Unicode 标识符中的可忽略字符。
    static boolean
    isIdentifierIgnorable(int codePoint)
    确定指定字符(Unicode 代码点)是否应被视为 Java 标识符或 Unicode 标识符中的可忽略字符。
    static boolean
    isIdeographic(int codePoint)
    确定指定字符(Unicode 代码点)是否为 CJKV(中文、日文、韩文和越南文)表意文字,如 Unicode 标准所定义。
    static boolean
    isISOControl(char ch)
    确定指定字符是否为 ISO 控制字符。
    static boolean
    isISOControl(int codePoint)
    确定引用的字符(Unicode 代码点)是否为 ISO 控制字符。
    static boolean
    确定指定的字符是否可以作为 Java 标识符的一部分而不是第一个字符。
    static boolean
    isJavaIdentifierPart(int codePoint)
    确定字符(Unicode 代码点)是否可以作为 Java 标识符的一部分而不是第一个字符。
    static boolean
    确定指定字符是否允许作为 Java 标识符中的第一个字符。
    static boolean
    isJavaIdentifierStart(int codePoint)
    确定字符(Unicode 代码点)是否允许作为 Java 标识符中的第一个字符。
    static boolean
    isJavaLetter(char ch)
    已弃用。
    替换为 isJavaIdentifierStart(char)。
    static boolean
    已弃用。
    替换为 isJavaIdentifierPart(char)。
    static boolean
    isLetter(char ch)
    确定指定字符是否为字母。
    static boolean
    isLetter(int codePoint)
    确定指定字符(Unicode 代码点)是否为字母。
    static boolean
    isLetterOrDigit(char ch)
    确定指定字符是字母还是数字。
    static boolean
    isLetterOrDigit(int codePoint)
    确定指定字符(Unicode 代码点)是字母还是数字。
    static boolean
    isLowerCase(char ch)
    确定指定字符是否为小写字符。
    static boolean
    isLowerCase(int codePoint)
    确定指定字符(Unicode 代码点)是否为小写字符。
    static boolean
    isLowSurrogate(char ch)
    确定给定的 char 值是否为 Unicode 低代理代码单元(也称为尾随代理代码单元).
    static boolean
    isMirrored(char ch)
    确定字符是否根据 Unicode 规范进行镜像。
    static boolean
    isMirrored(int codePoint)
    确定指定字符(Unicode 代码点)是否根据 Unicode 规范进行镜像。
    static boolean
    isSpace(char ch)
    已弃用。
    替换为 isWhitespace(char)。
    static boolean
    isSpaceChar(char ch)
    确定指定字符是否为 Unicode 空格字符。
    static boolean
    isSpaceChar(int codePoint)
    确定指定字符(Unicode 代码点)是否为 Unicode 空格字符。
    static boolean
    isSupplementaryCodePoint(int codePoint)
    确定指定字符(Unicode 代码点)是否在 补充字符 范围内。
    static boolean
    isSurrogate(char ch)
    确定给定的 char 值是否为 Unicode代理代码单元.
    static boolean
    isSurrogatePair(char high, char low)
    确定指定的一对 char 值是否是有效的 Unicode 代理对
    static boolean
    isTitleCase(char ch)
    确定指定字符是否为标题字符。
    static boolean
    isTitleCase(int codePoint)
    确定指定字符(Unicode 代码点)是否为首字母大写字符。
    static boolean
    确定指定字符是否可以作为第一个字符以外的 Unicode 标识符的一部分。
    static boolean
    isUnicodeIdentifierPart(int codePoint)
    确定指定字符(Unicode 代码点)是否可以作为第一个字符以外的 Unicode 标识符的一部分。
    static boolean
    确定指定字符是否允许作为 Unicode 标识符中的第一个字符。
    static boolean
    isUnicodeIdentifierStart(int codePoint)
    确定指定字符(Unicode 代码点)是否允许作为 Unicode 标识符中的第一个字符。
    static boolean
    isUpperCase(char ch)
    确定指定字符是否为大写字符。
    static boolean
    isUpperCase(int codePoint)
    确定指定字符(Unicode 代码点)是否为大写字符。
    static boolean
    isValidCodePoint(int codePoint)
    确定指定的代码点是否有效 Unicode 代码点值
    static boolean
    isWhitespace(char ch)
    根据 Java 确定指定字符是否为空格。
    static boolean
    isWhitespace(int codePoint)
    根据 Java 确定指定字符(Unicode 代码点)是否为空白。
    static char
    lowSurrogate(int codePoint)
    返回表示 UTF-16 编码中指定补充字符(Unicode 代码点)的 代理对 的尾随代理项 (a 低代理码单元 )。
    static int
    offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)
    返回给定 char 子数组中的索引,该子数组从给定 index 偏移 codePointOffset 代码点。
    static int
    offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
    返回给定 char 序列中的索引,该序列从给定的 index 偏移了 codePointOffset 代码点。
    static char
    reverseBytes(char ch)
    返回通过反转指定的char值中的字节顺序获得的值。
    static char[]
    toChars(int codePoint)
    将指定字符(Unicode 代码点)转换为其存储在 char 数组中的 UTF-16 表示形式。
    static int
    toChars(int codePoint, char[] dst, int dstIndex)
    将指定字符(Unicode 代码点)转换为其 UTF-16 表示形式。
    static int
    toCodePoint(char high, char low)
    将指定的代理项对转换为其补充代码点值。
    static char
    toLowerCase(char ch)
    使用 UnicodeData 文件中的大小写映射信息将字符参数转换为小写。
    static int
    toLowerCase(int codePoint)
    使用 UnicodeData 文件中的大小写映射信息将字符(Unicode 代码点)参数转换为小写。
    返回表示此 Character 值的 String 对象。
    static String
    toString(char c)
    返回表示指定 charString 对象。
    static String
    toString(int codePoint)
    返回表示指定字符(Unicode 代码点)的 String 对象。
    static char
    toTitleCase(char ch)
    使用 UnicodeData 文件中的大小写映射信息将字符参数转换为标题大小写。
    static int
    toTitleCase(int codePoint)
    使用 UnicodeData 文件中的大小写映射信息将字符(Unicode 代码点)参数转换为 titlecase。
    static char
    toUpperCase(char ch)
    使用 UnicodeData 文件中的大小写映射信息将字符参数转换为大写。
    static int
    toUpperCase(int codePoint)
    使用 UnicodeData 文件中的大小写映射信息将字符(Unicode 代码点)参数转换为大写。
    static Character
    valueOf(char c)
    返回代表指定 char 值的 Character 实例。

    在类 java.lang.Object 中声明的方法

    clone, finalize, getClass, notify, notifyAll, wait, wait, wait
  • 字段详细信息

    • MIN_RADIX

      public static final int MIN_RADIX
      可用于与字符串相互转换的最小基数。该字段的常量值是基数转换方法中基数参数允许的最小值,例如digit方法、forDigit方法和Integer类的toString方法。
      参见:
    • MAX_RADIX

      public static final int MAX_RADIX
      可用于与字符串相互转换的最大基数。该字段的常量值是类Integerdigit 方法、forDigit 方法和toString 方法等基数转换方法中基数参数允许的最大值。
      参见:
    • MIN_VALUE

      public static final char MIN_VALUE
      该字段的常量值是 char , '\u0000' 类型的最小值。
      自从:
      1.0.2
      参见:
    • MAX_VALUE

      public static final char MAX_VALUE
      该字段的常量值是 char , '\uFFFF' 类型的最大值。
      自从:
      1.0.2
      参见:
    • TYPE

      public static final Class <Character > TYPE
      代表原始类型 charClass 实例。
      自从:
      1.1
    • UNASSIGNED

      public static final byte UNASSIGNED
      Unicode 规范中的通用类别“Cn”。
      自从:
      1.1
      参见:
    • UPPERCASE_LETTER

      public static final byte UPPERCASE_LETTER
      Unicode 规范中的通用类别“Lu”。
      自从:
      1.1
      参见:
    • LOWERCASE_LETTER

      public static final byte LOWERCASE_LETTER
      Unicode 规范中的通用类别“Ll”。
      自从:
      1.1
      参见:
    • TITLECASE_LETTER

      public static final byte TITLECASE_LETTER
      Unicode 规范中的通用类别“Lt”。
      自从:
      1.1
      参见:
    • MODIFIER_LETTER

      public static final byte MODIFIER_LETTER
      Unicode 规范中的通用类别“Lm”。
      自从:
      1.1
      参见:
    • OTHER_LETTER

      public static final byte OTHER_LETTER
      Unicode 规范中的通用类别“Lo”。
      自从:
      1.1
      参见:
    • NON_SPACING_MARK

      public static final byte NON_SPACING_MARK
      Unicode 规范中的通用类别“Mn”。
      自从:
      1.1
      参见:
    • ENCLOSING_MARK

      public static final byte ENCLOSING_MARK
      Unicode 规范中的通用类别“Me”。
      自从:
      1.1
      参见:
    • COMBINING_SPACING_MARK

      public static final byte COMBINING_SPACING_MARK
      Unicode 规范中的通用类别“Mc”。
      自从:
      1.1
      参见:
    • DECIMAL_DIGIT_NUMBER

      public static final byte DECIMAL_DIGIT_NUMBER
      Unicode 规范中的通用类别“Nd”。
      自从:
      1.1
      参见:
    • LETTER_NUMBER

      public static final byte LETTER_NUMBER
      Unicode 规范中的通用类别“Nl”。
      自从:
      1.1
      参见:
    • OTHER_NUMBER

      public static final byte OTHER_NUMBER
      Unicode 规范中的一般类别“否”。
      自从:
      1.1
      参见:
    • SPACE_SEPARATOR

      public static final byte SPACE_SEPARATOR
      Unicode 规范中的通用类别“Zs”。
      自从:
      1.1
      参见:
    • LINE_SEPARATOR

      public static final byte LINE_SEPARATOR
      Unicode 规范中的通用类别“Zl”。
      自从:
      1.1
      参见:
    • PARAGRAPH_SEPARATOR

      public static final byte PARAGRAPH_SEPARATOR
      Unicode 规范中的通用类别“Zp”。
      自从:
      1.1
      参见:
    • CONTROL

      public static final byte CONTROL
      Unicode 规范中的通用类别“Cc”。
      自从:
      1.1
      参见:
    • FORMAT

      public static final byte FORMAT
      Unicode 规范中的通用类别“Cf”。
      自从:
      1.1
      参见:
    • PRIVATE_USE

      public static final byte PRIVATE_USE
      Unicode 规范中的通用类别“Co”。
      自从:
      1.1
      参见:
    • SURROGATE

      public static final byte SURROGATE
      Unicode 规范中的通用类别“Cs”。
      自从:
      1.1
      参见:
    • DASH_PUNCTUATION

      public static final byte DASH_PUNCTUATION
      Unicode 规范中的通用类别“Pd”。
      自从:
      1.1
      参见:
    • START_PUNCTUATION

      public static final byte START_PUNCTUATION
      Unicode 规范中的通用类别“Ps”。
      自从:
      1.1
      参见:
    • END_PUNCTUATION

      public static final byte END_PUNCTUATION
      Unicode 规范中的通用类别“Pe”。
      自从:
      1.1
      参见:
    • CONNECTOR_PUNCTUATION

      public static final byte CONNECTOR_PUNCTUATION
      Unicode 规范中的通用类别“Pc”。
      自从:
      1.1
      参见:
    • OTHER_PUNCTUATION

      public static final byte OTHER_PUNCTUATION
      Unicode 规范中的通用类别“Po”。
      自从:
      1.1
      参见:
    • MATH_SYMBOL

      public static final byte MATH_SYMBOL
      Unicode 规范中的通用类别“Sm”。
      自从:
      1.1
      参见:
    • CURRENCY_SYMBOL

      public static final byte CURRENCY_SYMBOL
      Unicode 规范中的通用类别“Sc”。
      自从:
      1.1
      参见:
    • MODIFIER_SYMBOL

      public static final byte MODIFIER_SYMBOL
      Unicode 规范中的通用类别“Sk”。
      自从:
      1.1
      参见:
    • OTHER_SYMBOL

      public static final byte OTHER_SYMBOL
      Unicode 规范中的通用类别“So”。
      自从:
      1.1
      参见:
    • INITIAL_QUOTE_PUNCTUATION

      public static final byte INITIAL_QUOTE_PUNCTUATION
      Unicode 规范中的通用类别“Pi”。
      自从:
      1.4
      参见:
    • FINAL_QUOTE_PUNCTUATION

      public static final byte FINAL_QUOTE_PUNCTUATION
      Unicode 规范中的通用类别“Pf”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_UNDEFINED

      public static final byte DIRECTIONALITY_UNDEFINED
      未定义的双向字符类型。未定义的 char 值在 Unicode 规范中具有未定义的方向性。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_LEFT_TO_RIGHT

      public static final byte DIRECTIONALITY_LEFT_TO_RIGHT
      Unicode 规范中的强双向字符类型“L”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_RIGHT_TO_LEFT

      public static final byte DIRECTIONALITY_RIGHT_TO_LEFT
      Unicode 规范中的强双向字符类型“R”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC

      public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
      Unicode 规范中的强双向字符类型“AL”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_EUROPEAN_NUMBER

      public static final byte DIRECTIONALITY_EUROPEAN_NUMBER
      Unicode 规范中的弱双向字符类型“EN”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR

      public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
      Unicode 规范中的弱双向字符类型“ES”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR

      public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
      Unicode 规范中的弱双向字符类型“ET”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_ARABIC_NUMBER

      public static final byte DIRECTIONALITY_ARABIC_NUMBER
      Unicode 规范中的弱双向字符类型“AN”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_COMMON_NUMBER_SEPARATOR

      public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
      Unicode 规范中的弱双向字符类型“CS”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_NONSPACING_MARK

      public static final byte DIRECTIONALITY_NONSPACING_MARK
      Unicode 规范中的弱双向字符类型“NSM”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_BOUNDARY_NEUTRAL

      public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL
      Unicode 规范中的弱双向字符类型“BN”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_PARAGRAPH_SEPARATOR

      public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
      Unicode 规范中的中性双向字符类型“B”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_SEGMENT_SEPARATOR

      public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR
      Unicode 规范中的中性双向字符类型“S”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_WHITESPACE

      public static final byte DIRECTIONALITY_WHITESPACE
      Unicode 规范中的中性双向字符类型“WS”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_OTHER_NEUTRALS

      public static final byte DIRECTIONALITY_OTHER_NEUTRALS
      Unicode 规范中的中性双向字符类型“ON”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING

      public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
      Unicode 规范中的强双向字符类型“LRE”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE

      public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
      Unicode 规范中的强双向字符类型“LRO”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING

      public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
      Unicode 规范中的强双向字符类型“RLE”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE

      public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
      Unicode 规范中的强双向字符类型“RLO”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_POP_DIRECTIONAL_FORMAT

      public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
      Unicode 规范中的弱双向字符类型“PDF”。
      自从:
      1.4
      参见:
    • DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE

      public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
      Unicode 规范中的弱双向字符类型“LRI”。
      自从:
      9
      参见:
    • DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE

      public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
      Unicode 规范中的弱双向字符类型“RLI”。
      自从:
      9
      参见:
    • DIRECTIONALITY_FIRST_STRONG_ISOLATE

      public static final byte DIRECTIONALITY_FIRST_STRONG_ISOLATE
      Unicode 规范中的弱双向字符类型“FSI”。
      自从:
      9
      参见:
    • DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE

      public static final byte DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
      Unicode 规范中的弱双向字符类型“PDI”。
      自从:
      9
      参见:
    • MIN_HIGH_SURROGATE

      public static final char MIN_HIGH_SURROGATE
      UTF-16编码中aUnicode 高代理码单元的最小值,常量'\uD800'。高代理也被称为主导代理人.
      自从:
      1.5
      参见:
    • MAX_HIGH_SURROGATE

      public static final char MAX_HIGH_SURROGATE
      UTF-16编码中aUnicode 高代理码单元的最大值,常量'\uDBFF'。高代理也被称为主导代理人.
      自从:
      1.5
      参见:
    • MIN_LOW_SURROGATE

      public static final char MIN_LOW_SURROGATE
      UTF-16编码中aUnicode 低代理代码单元的最小值,常量'\uDC00'。低代理也被称为尾随代理.
      自从:
      1.5
      参见:
    • MAX_LOW_SURROGATE

      public static final char MAX_LOW_SURROGATE
      UTF-16编码中aUnicode 低代理代码单元的最大值,常量'\uDFFF'。低代理也被称为尾随代理.
      自从:
      1.5
      参见:
    • MIN_SURROGATE

      public static final char MIN_SURROGATE
      UTF-16 编码中 Unicode 代理代码单元的最小值,常量 '\uD800'
      自从:
      1.5
      参见:
    • MAX_SURROGATE

      public static final char MAX_SURROGATE
      UTF-16 编码中 Unicode 代理代码单元的最大值,常量 '\uDFFF'
      自从:
      1.5
      参见:
    • MIN_SUPPLEMENTARY_CODE_POINT

      public static final int MIN_SUPPLEMENTARY_CODE_POINT
      a 的最小值 Unicode 补充代码点 ,常量 U+10000
      自从:
      1.5
      参见:
    • MIN_CODE_POINT

      public static final int MIN_CODE_POINT
      a 的最小值 Unicode代码点 ,常量 U+0000
      自从:
      1.5
      参见:
    • MAX_CODE_POINT

      public static final int MAX_CODE_POINT
      a 的最大值 Unicode代码点 ,常量 U+10FFFF
      自从:
      1.5
      参见:
    • SIZE

      public static final int SIZE
      用于表示无符号二进制形式的 char 值的位数,常量 16
      自从:
      1.5
      参见:
    • BYTES

      public static final int BYTES
      用于表示无符号二进制形式的 char 值的字节数。
      自从:
      1.8
      参见:
  • 构造方法详细信息

    • Character

      @Deprecated (since ="9", forRemoval =true) public Character(char value)
      已弃用,将被删除:此 API 元素可能会在未来版本中删除。
      使用此构造函数很少是合适的。静态工厂 valueOf(char) 通常是更好的选择,因为它可能会产生更好的空间和时间性能。
      构造一个新分配的 Character 对象,表示指定的 char 值。
      参数:
      value - 由 Character 对象表示的值。
  • 方法详情

    • describeConstable

      public Optional <DynamicConstantDesc <Character >> describeConstable()
      返回包含此实例标称描述符的 Optional
      指定者:
      describeConstable 在接口 Constable
      返回:
      Optional 描述了 Character 实例
      自从:
      15
    • valueOf

      public static Character  valueOf(char c)
      返回代表指定 char 值的 Character 实例。如果不需要新的 Character 实例,通常应优先使用此方法而不是构造函数 Character(char) ,因为此方法可能通过缓存频繁请求的值来产生明显更好的空间和时间性能。此方法将始终缓存 '\u0000''\u007F' 范围内的值(含),并可能缓存此范围之外的其他值。
      参数:
      c - 一个字符值。
      返回:
      代表 cCharacter 实例。
      自从:
      1.5
    • charValue

      public char charValue()
      返回此 Character 对象的值。
      返回:
      此对象表示的原始 char 值。
    • hashCode

      public int hashCode()
      返回此 Character 的哈希码;等于调用 charValue() 的结果。
      重写:
      hashCode 在类 Object
      返回:
      这个 Character 的哈希码值
      参见:
    • hashCode

      public static int hashCode(char value)
      返回 char 值的哈希码;与 Character.hashCode() 兼容。
      参数:
      value - 要为其返回哈希码的 char
      返回:
      char 值的哈希码值。
      自从:
      1.8
    • equals

      public boolean equals(Object  obj)
      将此对象与指定对象进行比较。结果是 true 当且仅当参数不是 null 并且是一个 Character 对象,表示与该对象相同的 char 值。
      重写:
      equals 在类 Object
      参数:
      obj - 要与之比较的对象。
      返回:
      true 如果对象相同; false否则。
      参见:
    • toString

      public String  toString()
      返回表示此 Character 值的 String 对象。结果是一个长度为 1 的字符串,其唯一组成部分是此 Character 对象表示的原始 char 值。
      重写:
      toString 在类 Object
      返回:
      此对象的字符串表示形式。
    • toString

      public static String  toString(char c)
      返回表示指定 charString 对象。结果是一个长度为 1 的字符串,仅由指定的 char 组成。
      API 注意:
      此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 toString(int) 方法。
      参数:
      c - 要转换的 char
      返回:
      指定 char 的字符串表示形式
      自从:
      1.4
    • toString

      public static String  toString(int codePoint)
      返回表示指定字符(Unicode 代码点)的 String 对象。结果是长度为 1 或 2 的字符串,仅由指定的 codePoint 组成。
      参数:
      codePoint - 要转换的 codePoint
      返回:
      指定 codePoint 的字符串表示形式
      抛出:
      IllegalArgumentException - 如果指定的 codePoint 不是 有效的 Unicode 代码点
      自从:
      11
    • isValidCodePoint

      public static boolean isValidCodePoint(int codePoint)
      确定指定的代码点是否有效 Unicode 代码点值
      参数:
      codePoint - 要测试的 Unicode 代码点
      返回:
      true 如果指定的代码点值介于 MIN_CODE_POINT MAX_CODE_POINT 之间; false否则。
      自从:
      1.5
    • isBmpCodePoint

      public static boolean isBmpCodePoint(int codePoint)
      确定指定字符(Unicode 代码点)是否在 基本多语言平面 (BMP) 中。此类代码点可以使用单个 char 表示。
      参数:
      codePoint - 要测试的字符(Unicode 代码点)
      返回:
      true 如果指定的代码点介于 MIN_VALUE MAX_VALUE 之间; false否则。
      自从:
      1.7
    • isSupplementaryCodePoint

      public static boolean isSupplementaryCodePoint(int codePoint)
      确定指定字符(Unicode 代码点)是否在 补充字符 范围内。
      参数:
      codePoint - 要测试的字符(Unicode 代码点)
      返回:
      true 如果指定的代码点介于 MIN_SUPPLEMENTARY_CODE_POINT MAX_CODE_POINT 之间; false否则。
      自从:
      1.5
    • isHighSurrogate

      public static boolean isHighSurrogate(char ch)
      确定给定的 char 值是否为 Unicode 高代理码单元(也称为前导代理代码单元).

      这些值本身不表示字符,但用于 UTF-16 编码中 补充字符 的表示。

      参数:
      ch - 要测试的 char 值。
      返回:
      true 如果 char 值介于 MIN_HIGH_SURROGATE MAX_HIGH_SURROGATE 之间; false否则。
      自从:
      1.5
      参见:
    • isLowSurrogate

      public static boolean isLowSurrogate(char ch)
      确定给定的 char 值是否为 Unicode 低代理代码单元(也称为尾随代理代码单元).

      这些值本身不表示字符,但用于 UTF-16 编码中 补充字符 的表示。

      参数:
      ch - 要测试的 char 值。
      返回:
      true 如果 char 值介于 MIN_LOW_SURROGATE MAX_LOW_SURROGATE 之间; false否则。
      自从:
      1.5
      参见:
    • isSurrogate

      public static boolean isSurrogate(char ch)
      确定给定的 char 值是否为 Unicode代理代码单元.

      这些值本身不表示字符,但用于 UTF-16 编码中 补充字符 的表示。

      当且仅当它是 低代理码单元高代理码单元 时,char 值才是代理代码单元。

      参数:
      ch - 要测试的 char 值。
      返回:
      true 如果 char 值介于 MIN_SURROGATE MAX_SURROGATE 之间; false否则。
      自从:
      1.7
    • isSurrogatePair

      public static boolean isSurrogatePair(char high, char low)
      确定指定的一对 char 值是否是有效的 Unicode 代理对

      此方法等效于表达式:

      
       isHighSurrogate(high) && isLowSurrogate(low)
        
      参数:
      high - 要测试的高代理码值
      low - 要测试的低代理代码值
      返回:
      true 如果指定的高代理代码值和低代理代码值表示有效的代理对; false否则。
      自从:
      1.5
    • charCount

      public static int charCount(int codePoint)
      确定表示指定字符(Unicode 代码点)所需的 char 值的数量。如果指定的字符等于或大于 0x10000,则该方法返回 2。否则,该方法返回 1。

      此方法不会将指定字符验证为有效的 Unicode 代码点。如有必要,调用者必须使用 isValidCodePoint 验证字符值。

      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      2 如果字符是有效的增补字符; 1 否则。
      自从:
      1.5
      参见:
    • toCodePoint

      public static int toCodePoint(char high, char low)
      将指定的代理项对转换为其补充代码点值。此方法不验证指定的代理项对。如有必要,调用者必须使用 isSurrogatePair 对其进行验证。
      参数:
      high - 高代理代码单元
      low - 低代理代码单元
      返回:
      由指定的代理对组成的补充代码点。
      自从:
      1.5
    • codePointAt

      public static int codePointAt(CharSequence  seq, int index)
      返回 CharSequence 的给定索引处的代码点。如果 CharSequence 中给定索引处的 char 值在高代理范围内,以下索引小于 CharSequence 的长度,并且以下索引处的 char 值在低代理范围内,则补充返回对应于该代理对的代码点。否则,返回给定索引处的 char 值。
      参数:
      seq - char 值序列(Unicode 代码单元)
      index - 要转换的 seq 中的 char 值(Unicode 代码单元)的索引
      返回:
      给定索引处的 Unicode 代码点
      抛出:
      NullPointerException - 如果 seq 为空。
      IndexOutOfBoundsException - 如果值 index 为负数或不小于 seq.length()
      自从:
      1.5
    • codePointAt

      public static int codePointAt(char[] a, int index)
      返回 char 数组给定索引处的代码点。如果 char 数组中给定索引处的 char 值在高代理项范围内,以下索引小于 char 数组的长度,并且以下索引处的 char 值在低代理项范围内,则返回对应于该代理对的补充代码点。否则,返回给定索引处的 char 值。
      参数:
      a - char 数组
      index - 要转换的 char 数组中 char 值(Unicode 代码单元)的索引
      返回:
      给定索引处的 Unicode 代码点
      抛出:
      NullPointerException - 如果 a 为空。
      IndexOutOfBoundsException - 如果值 index 为负数或不小于 char 数组的长度。
      自从:
      1.5
    • codePointAt

      public static int codePointAt(char[] a, int index, int limit)
      返回 char 数组给定索引处的代码点,其中只能使用 index 小于 limit 的数组元素。如果 char 数组中给定索引处的 char 值在高代理项范围内,以下索引小于 limit ,并且以下索引处的 char 值在低代理项范围内,则补充代码点对应于这个代理对被返回。否则,返回给定索引处的 char 值。
      参数:
      a - char 数组
      index - 要转换的 char 数组中 char 值(Unicode 代码单元)的索引
      limit - 可在 char 数组中使用的最后一个数组元素之后的索引
      返回:
      给定索引处的 Unicode 代码点
      抛出:
      NullPointerException - 如果 a 为空。
      IndexOutOfBoundsException - 如果 index 参数为负数或不小于 limit 参数,或者如果 limit 参数为负数或大于 char 数组的长度。
      自从:
      1.5
    • codePointBefore

      public static int codePointBefore(CharSequence  seq, int index)
      返回 CharSequence 的给定索引之前的代码点。如果CharSequence(index - 1)处的char值在低代理范围内,(index - 2)不为负,CharSequence(index - 2)处的char值在高代理范围内,则该代理对对应的补充码位为回。否则,返回 (index - 1) 处的 char 值。
      参数:
      seq - CharSequence 实例
      index - 应该返回的代码点之后的索引
      返回:
      给定索引之前的 Unicode 代码点值。
      抛出:
      NullPointerException - 如果 seq 为空。
      IndexOutOfBoundsException - 如果 index 参数小于 1 或大于 seq.length()
      自从:
      1.5
    • codePointBefore

      public static int codePointBefore(char[] a, int index)
      返回 char 数组给定索引之前的代码点。如果char数组中(index - 1)处的char值在低代理项范围内,(index - 2)不为负,且char数组中(index - 2)处的char值在高代理项范围内,则补充码位对应这个代理项对被退回。否则,返回 (index - 1) 处的 char 值。
      参数:
      a - char 数组
      index - 应该返回的代码点之后的索引
      返回:
      给定索引之前的 Unicode 代码点值。
      抛出:
      NullPointerException - 如果 a 为空。
      IndexOutOfBoundsException - 如果 index 参数小于 1 或大于 char 数组的长度
      自从:
      1.5
    • codePointBefore

      public static int codePointBefore(char[] a, int index, int start)
      返回 char 数组给定索引之前的代码点,其中只能使用 index 大于或等于 start 的数组元素。若char数组中(index - 1)处的char值在低代理范围内,(index - 2)不小于start,且char数组中(index - 2)处的char值在高代理范围内,则补充码位对应这个代理对被返回。否则,返回 (index - 1) 处的 char 值。
      参数:
      a - char 数组
      index - 应该返回的代码点之后的索引
      start - char 数组中第一个数组元素的索引
      返回:
      给定索引之前的 Unicode 代码点值。
      抛出:
      NullPointerException - 如果 a 为空。
      IndexOutOfBoundsException - 如果 index 参数不大于 start 参数或大于 char 数组的长度,或者如果 start 参数为负数或不小于 char 数组的长度。
      自从:
      1.5
    • highSurrogate

      public static char highSurrogate(int codePoint)
      返回 代理对 的前导代理项 (a 高代理码单元 ),表示 UTF-16 编码中指定的补充字符(Unicode 代码点)。如果指定的字符不是 补充字符 ,则返回未指定的 char

      如果 isSupplementaryCodePoint(x) true,则 isHighSurrogate (highSurrogate(x))toCodePoint (highSurrogate(x), lowSurrogate (x)) == x 也始终为 true

      参数:
      codePoint - 补充字符(Unicode 代码点)
      返回:
      用于表示 UTF-16 编码中字符的前导代理代码单元
      自从:
      1.7
    • lowSurrogate

      public static char lowSurrogate(int codePoint)
      返回表示 UTF-16 编码中指定补充字符(Unicode 代码点)的 代理对 的尾随代理项 (a 低代理码单元 )。如果指定的字符不是 补充字符 ,则返回未指定的 char

      如果 isSupplementaryCodePoint(x) true,则 isLowSurrogate (lowSurrogate(x))toCodePoint ( highSurrogate (x), lowSurrogate(x)) == x 也始终为 true

      参数:
      codePoint - 补充字符(Unicode 代码点)
      返回:
      用于表示 UTF-16 编码中字符的尾随代理项代码单元
      自从:
      1.7
    • toChars

      public static int toChars(int codePoint, char[] dst, int dstIndex)
      将指定字符(Unicode 代码点)转换为其 UTF-16 表示形式。如果指定的代码点是 BMP(基本多语言平面或平面 0)值,则相同的值存储在 dst[dstIndex] 中,并返回 1。如果指定的代码点是增补字符,则其代理值存储在 dst[dstIndex](高代理)和 dst[dstIndex+1](低代理)中,并返回 2。
      参数:
      codePoint - 要转换的字符(Unicode 代码点)。
      dst - char 的数组,其中存储了 codePoint 的 UTF-16 值。
      dstIndex - 存储转换值的 dst 数组的起始索引。
      返回:
      如果代码点是 BMP 代码点,则为 1,如果代码点是补充代码点,则为 2。
      抛出:
      IllegalArgumentException - 如果指定的 codePoint 不是有效的 Unicode 代码点。
      NullPointerException - 如果指定的 dst 为空。
      IndexOutOfBoundsException - 如果 dstIndex 为负数或不小于 dst.length ,或者如果 dstIndexdst 没有足够的数组元素来存储生成的 char 值。 (如果 dstIndex 等于 dst.length-1 且指定的 codePoint 是增补字符,则高代理值不存储在 dst[dstIndex] 中。)
      自从:
      1.5
    • toChars

      public static char[] toChars(int codePoint)
      将指定字符(Unicode 代码点)转换为其存储在 char 数组中的 UTF-16 表示形式。如果指定的代码点是 BMP(基本多语言平面或平面 0)值,则生成的 char 数组与 codePoint 具有相同的值。如果指定的代码点是补充代码点,则生成的 char 数组具有相应的代理项对。
      参数:
      codePoint - 一个 Unicode 代码点
      返回:
      具有 codePoint 的 UTF-16 表示的 char 数组。
      抛出:
      IllegalArgumentException - 如果指定的 codePoint 不是有效的 Unicode 代码点。
      自从:
      1.5
    • codePointCount

      public static int codePointCount(CharSequence  seq, int beginIndex, int endIndex)
      返回指定 char 序列的文本范围内的 Unicode 代码点数。文本范围从指定的 beginIndex 开始并扩展到索引 endIndex - 1 处的 char。因此,文本范围的长度(以 char s 为单位)为 endIndex-beginIndex 。文本范围内未配对的代理项各计为一个代码点。
      参数:
      seq - 字符序列
      beginIndex - 文本范围第一个 char 的索引。
      endIndex - 文本范围最后一个 char 之后的索引。
      返回:
      指定文本范围内的 Unicode 代码点数
      抛出:
      NullPointerException - 如果 seq 为空。
      IndexOutOfBoundsException - 如果 beginIndex 为负,或者 endIndex 大于给定序列的长度,或者 beginIndex 大于 endIndex
      自从:
      1.5
    • codePointCount

      public static int codePointCount(char[] a, int offset, int count)
      返回 char 数组参数的子数组中的 Unicode 代码点数。 offset 参数是子数组第一个 char 的索引,count 参数指定 char 中子数组的长度。子数组中未配对的代理项各自计为一个代码点。
      参数:
      a - char 数组
      offset - 给定 char 数组中第一个 char 的索引
      count - char s 中子数组的长度
      返回:
      指定子数组中 Unicode 代码点的数量
      抛出:
      NullPointerException - 如果 a 为空。
      IndexOutOfBoundsException - 如果 offsetcount 为负数,或者如果 offset + count 大于给定数组的长度。
      自从:
      1.5
    • offsetByCodePoints

      public static int offsetByCodePoints(CharSequence  seq, int index, int codePointOffset)
      返回给定 char 序列中的索引,该序列从给定的 index 偏移了 codePointOffset 代码点。 indexcodePointOffset 给定的文本范围内的未配对代理各计为一个代码点。
      参数:
      seq - 字符序列
      index - 要偏移的索引
      codePointOffset - 代码点的偏移量
      返回:
      字符序列中的索引
      抛出:
      NullPointerException - 如果 seq 为空。
      IndexOutOfBoundsException - 如果 index 为负数或大于 char 序列的长度,或者如果 codePointOffset 为正数并且以 index 开头的子序列少于 codePointOffset 个代码点,或者如果 codePointOffset 为负数并且 index 之前的子序列少于绝对值codePointOffset 个代码点。
      自从:
      1.5
    • offsetByCodePoints

      public static int offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)
      返回给定 char 子数组中的索引,该子数组从给定 index 偏移 codePointOffset 代码点。 startcount 参数指定 char 数组的子数组。 indexcodePointOffset 给定的文本范围内的未配对代理各计为一个代码点。
      参数:
      a - char 数组
      start - 子数组第一个 char 的索引
      count - char s 中子数组的长度
      index - 要偏移的索引
      codePointOffset - 代码点的偏移量
      返回:
      子数组中的索引
      抛出:
      NullPointerException - 如果 a 为空。
      IndexOutOfBoundsException - 如果 startcount 为负数,或者如果 start + count 大于给定数组的长度,或者如果 index 小于 start 或大于 start + count ,或者如果 codePointOffset 为正数并且文本范围以 index 开头并以start + count - 1具有少于 codePointOffset 个代码点,或者如果 codePointOffset 为负并且以 start 开始并以 index - 1 结束的文本范围少于 codePointOffset 代码点的绝对值。
      自从:
      1.5
    • isLowerCase

      public static boolean isLowerCase(char ch)
      确定指定字符是否为小写字符。

      如果字符的一般类别类型(由 Character.getType(ch) 提供)为 LOWERCASE_LETTER ,或者它具有 Unicode 标准定义的贡献属性 Other_Lowercase,则字符为小写。

      以下是小写字符的示例:

       a b c d e f g h i j k l m n o p q r s t u v w x y z
       '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6'
       '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE'
       '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6'
       '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
       

      许多其他 Unicode 字符也是小写的。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 isLowerCase(int) 方法。

      参数:
      ch - 要测试的字符。
      返回:
      true 如果字符是小写; false否则。
      参见:
    • isLowerCase

      public static boolean isLowerCase(int codePoint)
      确定指定字符(Unicode 代码点)是否为小写字符。

      如果字符的一般类别类型(由 getType(codePoint) 提供)为 LOWERCASE_LETTER ,或者它具有 Unicode 标准定义的贡献属性 Other_Lowercase,则该字符为小写。

      以下是小写字符的示例:

       a b c d e f g h i j k l m n o p q r s t u v w x y z
       '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6'
       '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE'
       '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6'
       '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
       

      许多其他 Unicode 字符也是小写的。

      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果字符是小写; false否则。
      自从:
      1.5
      参见:
    • isUpperCase

      public static boolean isUpperCase(char ch)
      确定指定字符是否为大写字符。

      如果 Character.getType(ch) 提供的一般类别类型为 UPPERCASE_LETTER ,则字符为大写。或者它具有 Unicode 标准定义的贡献属性 Other_Uppercase。

      以下是大写字符的示例:

       A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
       '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7'
       '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF'
       '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8'
       '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
       

      许多其他 Unicode 字符也是大写的。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 isUpperCase(int) 方法。

      参数:
      ch - 要测试的字符。
      返回:
      true 如果字符是大写; false否则。
      自从:
      1.0
      参见:
    • isUpperCase

      public static boolean isUpperCase(int codePoint)
      确定指定字符(Unicode 代码点)是否为大写字符。

      如果字符的一般类别类型(由 getType(codePoint) 提供)为 UPPERCASE_LETTER ,或者它具有 Unicode 标准定义的贡献属性 Other_Uppercase,则该字符为大写。

      以下是大写字符的示例:

       A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
       '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7'
       '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF'
       '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8'
       '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
       

      许多其他 Unicode 字符也是大写的。

      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果字符是大写; false否则。
      自从:
      1.5
      参见:
    • isTitleCase

      public static boolean isTitleCase(char ch)
      确定指定字符是否为标题字符。

      如果一个字符的一般类别类型(由 Character.getType(ch) 提供)是 TITLECASE_LETTER ,则该字符是首字母大写字符。

      有些字符看起来像成对的拉丁字母。例如,有一个大写字母看起来像“LJ”,对应的小写字母看起来像“lj”。第三种形式,看起来像“Lj”,是在将首字母大写的小写单词呈现为书名时使用的合适形式。

      这些是此方法返回 true 的一些 Unicode 字符:

      • LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
      • LATIN CAPITAL LETTER L WITH SMALL LETTER J
      • LATIN CAPITAL LETTER N WITH SMALL LETTER J
      • LATIN CAPITAL LETTER D WITH SMALL LETTER Z

      许多其他 Unicode 字符也是首字母大写。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 isTitleCase(int) 方法。

      参数:
      ch - 要测试的字符。
      返回:
      true 如果字符是首字母大写; false否则。
      自从:
      1.0.2
      参见:
    • isTitleCase

      public static boolean isTitleCase(int codePoint)
      确定指定字符(Unicode 代码点)是否为首字母大写字符。

      如果由 getType(codePoint) 提供的一般类别类型是 TITLECASE_LETTER ,则该字符是首字母大写字符。

      有些字符看起来像成对的拉丁字母。例如,有一个大写字母看起来像“LJ”,对应的小写字母看起来像“lj”。第三种形式,看起来像“Lj”,是在将首字母大写的小写单词呈现为书名时使用的合适形式。

      这些是此方法返回 true 的一些 Unicode 字符:

      • LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
      • LATIN CAPITAL LETTER L WITH SMALL LETTER J
      • LATIN CAPITAL LETTER N WITH SMALL LETTER J
      • LATIN CAPITAL LETTER D WITH SMALL LETTER Z

      许多其他 Unicode 字符也是首字母大写。

      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果字符是首字母大写; false否则。
      自从:
      1.5
      参见:
    • isDigit

      public static boolean isDigit(char ch)
      确定指定字符是否为数字。

      如果字符的一般类别类型(由 Character.getType(ch) 提供)是 DECIMAL_DIGIT_NUMBER ,则该字符是数字。

      一些包含数字的 Unicode 字符范围:

      • '\u0030''\u0039',ISO-LATIN-1 数字('0''9'
      • '\u0660''\u0669' ,阿拉伯-印度数字
      • '\u06F0''\u06F9' ,扩展的阿拉伯-印度数字
      • '\u0966''\u096F' ,梵文数字
      • '\uFF10''\uFF19' ,全角数字
      许多其他字符范围也包含数字。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 isDigit(int) 方法。

      参数:
      ch - 要测试的字符。
      返回:
      true 如果字符是数字; false否则。
      参见:
    • isDigit

      public static boolean isDigit(int codePoint)
      确定指定字符(Unicode 代码点)是否为数字。

      如果字符的一般类别类型(由 getType(codePoint) 提供)是 DECIMAL_DIGIT_NUMBER ,则该字符是数字。

      一些包含数字的 Unicode 字符范围:

      • '\u0030''\u0039',ISO-LATIN-1 数字('0''9'
      • '\u0660''\u0669' ,阿拉伯-印度数字
      • '\u06F0''\u06F9' ,扩展的阿拉伯-印度数字
      • '\u0966''\u096F' ,梵文数字
      • '\uFF10''\uFF19' ,全角数字
      许多其他字符范围也包含数字。
      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果字符是数字; false否则。
      自从:
      1.5
      参见:
    • isDefined

      public static boolean isDefined(char ch)
      确定字符是否以 Unicode 定义。

      如果至少满足以下条件之一,则定义字符:

      • 它在 UnicodeData 文件中有一个条目。
      • 它的值在 UnicodeData 文件定义的范围内。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 isDefined(int) 方法。

      参数:
      ch - 要测试的字符
      返回:
      true 如果该字符在 Unicode 中具有定义的含义; false否则。
      自从:
      1.0.2
      参见:
    • isDefined

      public static boolean isDefined(int codePoint)
      确定字符(Unicode 代码点)是否以 Unicode 定义。

      如果至少满足以下条件之一,则定义字符:

      • 它在 UnicodeData 文件中有一个条目。
      • 它的值在 UnicodeData 文件定义的范围内。
      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果该字符在 Unicode 中具有定义的含义; false否则。
      自从:
      1.5
      参见:
    • isLetter

      public static boolean isLetter(char ch)
      确定指定字符是否为字母。

      如果一个字符被 Character.getType(ch) 提供的一般类别类型是以下任何一种,则该字符被认为是一个字母:

      • UPPERCASE_LETTER
      • LOWERCASE_LETTER
      • TITLECASE_LETTER
      • MODIFIER_LETTER
      • OTHER_LETTER
      并非所有字母都有大小写。许多字符是字母,但既不是大写也不是小写,也不是标题。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 isLetter(int) 方法。

      参数:
      ch - 要测试的字符。
      返回:
      true 如果字符是字母; false否则。
      参见:
    • isLetter

      public static boolean isLetter(int codePoint)
      确定指定字符(Unicode 代码点)是否为字母。

      如果一个字符被 getType(codePoint) 提供的一般类别类型是以下任何一种,则该字符被认为是一个字母:

      • UPPERCASE_LETTER
      • LOWERCASE_LETTER
      • TITLECASE_LETTER
      • MODIFIER_LETTER
      • OTHER_LETTER
      并非所有字母都有大小写。许多字符是字母,但既不是大写也不是小写,也不是标题。
      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果字符是字母; false否则。
      自从:
      1.5
      参见:
    • isLetterOrDigit

      public static boolean isLetterOrDigit(char ch)
      确定指定字符是字母还是数字。

      如果 Character.isLetter(char ch)Character.isDigit(char ch) 为字符返回 true,则该字符被认为是字母或数字。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 isLetterOrDigit(int) 方法。

      参数:
      ch - 要测试的字符。
      返回:
      true 如果字符是字母或数字; false否则。
      自从:
      1.0.2
      参见:
    • isLetterOrDigit

      public static boolean isLetterOrDigit(int codePoint)
      确定指定字符(Unicode 代码点)是字母还是数字。

      如果 isLetter(codePoint) isDigit(codePoint) 为字符返回 true,则该字符被认为是字母或数字。

      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果字符是字母或数字; false否则。
      自从:
      1.5
      参见:
    • isJavaLetter

      @Deprecated (since ="1.1") public static boolean isJavaLetter(char ch)
      已弃用。
      替换为 isJavaIdentifierStart(char)。
      确定指定字符是否允许作为 Java 标识符中的第一个字符。

      当且仅当以下条件之一为真时,字符才可以开始 Java 标识符:

      • isLetter(ch) 返回 true
      • getType(ch) 返回 LETTER_NUMBER
      • ch 是货币符号(例如 '$'
      • ch 是连接标点符号(例如 '_' )。
      参数:
      ch - 要测试的字符。
      返回:
      true 如果该字符可能开始一个 Java 标识符; false否则。
      自从:
      1.0.2
      参见:
    • isJavaLetterOrDigit

      @Deprecated (since ="1.1") public static boolean isJavaLetterOrDigit(char ch)
      已弃用。
      替换为 isJavaIdentifierPart(char)。
      确定指定的字符是否可以作为 Java 标识符的一部分而不是第一个字符。

      当且仅当以下条件之一为真时,字符才可能是 Java 标识符的一部分:

      • 这是一封信
      • 它是一个货币符号(例如 '$'
      • 它是一个连接标点符号(例如 '_'
      • 这是一个数字
      • 它是一个数字字母(例如罗马数字字符)
      • 这是一个组合标记
      • 它是一个非间距标记
      • isIdentifierIgnorable 为字符返回 true
      参数:
      ch - 要测试的字符。
      返回:
      true 如果字符可能是 Java 标识符的一部分; false否则。
      自从:
      1.0.2
      参见:
    • isAlphabetic

      public static boolean isAlphabetic(int codePoint)
      确定指定字符(Unicode 代码点)是否为字母。

      如果 getType(codePoint) 提供的一般类别类型是以下任何一种,则字符被认为是字母的:

      • UPPERCASE_LETTER
      • LOWERCASE_LETTER
      • TITLECASE_LETTER
      • MODIFIER_LETTER
      • OTHER_LETTER
      • LETTER_NUMBER
      或者它具有 Unicode 标准定义的贡献属性 Other_Alphabetic。
      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果字符是 Unicode 字母字符,false 否则。
      自从:
      1.7
    • isIdeographic

      public static boolean isIdeographic(int codePoint)
      确定指定字符(Unicode 代码点)是否为 CJKV(中文、日文、韩文和越南文)表意文字,如 Unicode 标准所定义。
      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果字符是 Unicode 表意文字字符,false 否则。
      自从:
      1.7
    • isJavaIdentifierStart

      public static boolean isJavaIdentifierStart(char ch)
      确定指定字符是否允许作为 Java 标识符中的第一个字符。

      当且仅当以下条件之一为真时,字符才可以开始 Java 标识符:

      • isLetter(ch) 返回 true
      • getType(ch) 返回 LETTER_NUMBER
      • ch 是货币符号(例如 '$'
      • ch 是连接标点符号(例如 '_' )。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 isJavaIdentifierStart(int) 方法。

      参数:
      ch - 要测试的字符。
      返回:
      true 如果该字符可能开始一个 Java 标识符; false否则。
      自从:
      1.1
      参见:
    • isJavaIdentifierStart

      public static boolean isJavaIdentifierStart(int codePoint)
      确定字符(Unicode 代码点)是否允许作为 Java 标识符中的第一个字符。

      当且仅当以下条件之一为真时,字符才可以开始 Java 标识符:

      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果该字符可能开始一个 Java 标识符; false否则。
      自从:
      1.5
      参见:
    • isJavaIdentifierPart

      public static boolean isJavaIdentifierPart(char ch)
      确定指定的字符是否可以作为 Java 标识符的一部分而不是第一个字符。

      如果满足以下任何条件,则字符可能是 Java 标识符的一部分:

      • 这是一封信
      • 它是一个货币符号(例如 '$'
      • 它是一个连接标点符号(例如 '_'
      • 这是一个数字
      • 它是一个数字字母(例如罗马数字字符)
      • 这是一个组合标记
      • 它是一个非间距标记
      • isIdentifierIgnorable 为字符返回 true

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 isJavaIdentifierPart(int) 方法。

      参数:
      ch - 要测试的字符。
      返回:
      true 如果字符可能是 Java 标识符的一部分; false否则。
      自从:
      1.1
      参见:
    • isJavaIdentifierPart

      public static boolean isJavaIdentifierPart(int codePoint)
      确定字符(Unicode 代码点)是否可以作为 Java 标识符的一部分而不是第一个字符。

      如果满足以下任何条件,则字符可能是 Java 标识符的一部分:

      • 这是一封信
      • 它是一个货币符号(例如 '$'
      • 它是一个连接标点符号(例如 '_'
      • 这是一个数字
      • 它是一个数字字母(例如罗马数字字符)
      • 这是一个组合标记
      • 它是一个非间距标记
      • isIdentifierIgnorable(codePoint) 返回代码点的 true
      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果字符可能是 Java 标识符的一部分; false否则。
      自从:
      1.5
      参见:
    • isUnicodeIdentifierStart

      public static boolean isUnicodeIdentifierStart(char ch)
      确定指定字符是否允许作为 Unicode 标识符中的第一个字符。

      当且仅当以下条件之一为真时,字符才可以开始 Unicode 标识符:

      此方法符合 Unicode 标准的UAX31-R1:默认标识符要求,具有以下 UAX31 的配置文件:

       Start := ID_Start + 'VERTICAL TILDE' (U+2E2F)
       
      'VERTICAL TILDE' 添加到 Start 以实现向后兼容性。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 isUnicodeIdentifierStart(int) 方法。

      参数:
      ch - 要测试的字符。
      返回:
      true 如果字符可以开始一个 Unicode 标识符; false否则。
      自从:
      1.1
      参见:
    • isUnicodeIdentifierStart

      public static boolean isUnicodeIdentifierStart(int codePoint)
      确定指定字符(Unicode 代码点)是否允许作为 Unicode 标识符中的第一个字符。

      当且仅当以下条件之一为真时,字符才可以开始 Unicode 标识符:

      此方法符合 Unicode 标准的UAX31-R1:默认标识符要求,具有以下 UAX31 的配置文件:

       Start := ID_Start + 'VERTICAL TILDE' (U+2E2F)
       
      'VERTICAL TILDE' 添加到 Start 以实现向后兼容性。
      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果字符可以开始一个 Unicode 标识符; false否则。
      自从:
      1.5
      参见:
    • isUnicodeIdentifierPart

      public static boolean isUnicodeIdentifierPart(char ch)
      确定指定字符是否可以作为第一个字符以外的 Unicode 标识符的一部分。

      当且仅当以下陈述之一为真时,字符才可能是 Unicode 标识符的一部分:

      • 这是一封信
      • 它是一个连接标点符号(例如 '_'
      • 这是一个数字
      • 它是一个数字字母(例如罗马数字字符)
      • 这是一个组合标记
      • 它是一个非间距标记
      • isIdentifierIgnorable 为该字符返回 true
      • 它是一个 Other_ID_Start 字符。
      • 它是一个 Other_ID_Continue 字符。

      此方法符合 Unicode 标准的UAX31-R1:默认标识符要求,具有以下 UAX31 的配置文件:

       Continue := Start + ID_Continue + ignorable
       Medial := empty
       ignorable := isIdentifierIgnorable(char) returns true for the character
       
      ignorable 添加到 Continue 以实现向后兼容性。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 isUnicodeIdentifierPart(int) 方法。

      参数:
      ch - 要测试的字符。
      返回:
      true 如果字符可能是 Unicode 标识符的一部分; false否则。
      自从:
      1.1
      参见:
    • isUnicodeIdentifierPart

      public static boolean isUnicodeIdentifierPart(int codePoint)
      确定指定字符(Unicode 代码点)是否可以作为第一个字符以外的 Unicode 标识符的一部分。

      当且仅当以下陈述之一为真时,字符才可能是 Unicode 标识符的一部分:

      • 这是一封信
      • 它是一个连接标点符号(例如 '_'
      • 这是一个数字
      • 它是一个数字字母(例如罗马数字字符)
      • 这是一个组合标记
      • 它是一个非间距标记
      • isIdentifierIgnorable 为该字符返回 true
      • 它是一个 Other_ID_Start 字符。
      • 它是一个 Other_ID_Continue 字符。

      此方法符合 Unicode 标准的UAX31-R1:默认标识符要求,具有以下 UAX31 的配置文件:

       Continue := Start + ID_Continue + ignorable
       Medial := empty
       ignorable := isIdentifierIgnorable(int) returns true for the character
       
      ignorable 添加到 Continue 以实现向后兼容性。
      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果字符可能是 Unicode 标识符的一部分; false否则。
      自从:
      1.5
      参见:
    • isIdentifierIgnorable

      public static boolean isIdentifierIgnorable(char ch)
      确定指定字符是否应被视为 Java 标识符或 Unicode 标识符中的可忽略字符。

      以下 Unicode 字符在 Java 标识符或 Unicode 标识符中是可忽略的:

      • 非空白的 ISO 控制字符
        • '\u0000''\u0008'
        • '\u000E''\u001B'
        • '\u007F''\u009F'
      • 所有具有 FORMAT 一般类别值的字符

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 isIdentifierIgnorable(int) 方法。

      参数:
      ch - 要测试的字符。
      返回:
      true 如果字符是可忽略的控制字符,可能是 Java 或 Unicode 标识符的一部分; false否则。
      自从:
      1.1
      参见:
    • isIdentifierIgnorable

      public static boolean isIdentifierIgnorable(int codePoint)
      确定指定字符(Unicode 代码点)是否应被视为 Java 标识符或 Unicode 标识符中的可忽略字符。

      以下 Unicode 字符在 Java 标识符或 Unicode 标识符中是可忽略的:

      • 非空白的 ISO 控制字符
        • '\u0000''\u0008'
        • '\u000E''\u001B'
        • '\u007F''\u009F'
      • 所有具有 FORMAT 一般类别值的字符
      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果字符是可忽略的控制字符,可能是 Java 或 Unicode 标识符的一部分; false否则。
      自从:
      1.5
      参见:
    • toLowerCase

      public static char toLowerCase(char ch)
      使用 UnicodeData 文件中的大小写映射信息将字符参数转换为小写。

      请注意,Character.isLowerCase(Character.toLowerCase(ch)) 并不总是为某些字符范围返回 true,尤其是那些符号或表意文字。

      一般来说,String.toLowerCase() 应该用于将字符映射为小写。 String 案例映射方法比 Character 案例映射方法有几个好处。 String 大小写映射方法可以执行locale敏感映射、上下文敏感映射和 1:M 字符映射,而 Character 大小写映射方法不能。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 toLowerCase(int) 方法。

      参数:
      ch - 要转换的字符。
      返回:
      字符的小写等效项(如果有);否则,角色本身。
      参见:
    • toLowerCase

      public static int toLowerCase(int codePoint)
      使用 UnicodeData 文件中的大小写映射信息将字符(Unicode 代码点)参数转换为小写。

      请注意,Character.isLowerCase(Character.toLowerCase(codePoint)) 并不总是为某些字符范围返回 true,尤其是那些符号或表意文字。

      一般来说,String.toLowerCase() 应该用于将字符映射为小写。 String 案例映射方法比 Character 案例映射方法有几个好处。 String 大小写映射方法可以执行locale敏感映射、上下文敏感映射和 1:M 字符映射,而 Character 大小写映射方法不能。

      参数:
      codePoint - 要转换的字符(Unicode 代码点)。
      返回:
      字符的小写等价物(Unicode 代码点),如果有的话;否则,角色本身。
      自从:
      1.5
      参见:
    • toUpperCase

      public static char toUpperCase(char ch)
      使用 UnicodeData 文件中的大小写映射信息将字符参数转换为大写。

      请注意,Character.isUpperCase(Character.toUpperCase(ch)) 并不总是为某些字符范围返回 true,尤其是那些符号或表意文字。

      一般来说,应该使用 String.toUpperCase() 将字符映射为大写。 String 案例映射方法比 Character 案例映射方法有几个好处。 String 大小写映射方法可以执行locale敏感映射、上下文敏感映射和 1:M 字符映射,而 Character 大小写映射方法不能。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 toUpperCase(int) 方法。

      参数:
      ch - 要转换的字符。
      返回:
      字符的大写等效项(如果有);否则,角色本身。
      参见:
    • toUpperCase

      public static int toUpperCase(int codePoint)
      使用 UnicodeData 文件中的大小写映射信息将字符(Unicode 代码点)参数转换为大写。

      请注意,Character.isUpperCase(Character.toUpperCase(codePoint)) 并不总是为某些字符范围返回 true,尤其是那些符号或表意文字。

      一般来说,应该使用 String.toUpperCase() 将字符映射为大写。 String 案例映射方法比 Character 案例映射方法有几个好处。 String 大小写映射方法可以执行locale敏感映射、上下文敏感映射和 1:M 字符映射,而 Character 大小写映射方法不能。

      参数:
      codePoint - 要转换的字符(Unicode 代码点)。
      返回:
      字符的大写等效项(如果有);否则,角色本身。
      自从:
      1.5
      参见:
    • toTitleCase

      public static char toTitleCase(char ch)
      使用 UnicodeData 文件中的大小写映射信息将字符参数转换为标题大小写。如果一个字符没有明确的首字母大写映射并且根据 UnicodeData 本身不是首字母大写字符,则大写映射将作为等效的首字母大写映射返回。如果 char 参数已经是标题大写 char ,则将返回相同的 char 值。

      请注意,对于某些字符范围,Character.isTitleCase(Character.toTitleCase(ch)) 并不总是返回 true

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 toTitleCase(int) 方法。

      参数:
      ch - 要转换的字符。
      返回:
      字符的首字母大写,如果有的话;否则,角色本身。
      自从:
      1.0.2
      参见:
    • toTitleCase

      public static int toTitleCase(int codePoint)
      使用 UnicodeData 文件中的大小写映射信息将字符(Unicode 代码点)参数转换为 titlecase。如果一个字符没有明确的首字母大写映射并且根据 UnicodeData 本身不是首字母大写字符,则大写映射将作为等效的首字母大写映射返回。如果字符参数已经是首字母大写字符,则将返回相同的字符值。

      请注意,对于某些字符范围,Character.isTitleCase(Character.toTitleCase(codePoint)) 并不总是返回 true

      参数:
      codePoint - 要转换的字符(Unicode 代码点)。
      返回:
      字符的首字母大写,如果有的话;否则,角色本身。
      自从:
      1.5
      参见:
    • digit

      public static int digit(char ch, int radix)
      返回指定基数中字符 ch 的数值。

      如果基数不在 MIN_RADIXradixMAX_RADIX 范围内,或者如果 ch 的值不是指定基数中的有效数字,则返回 -1。如果至少满足以下条件之一,则字符是有效数字:

      • 方法isDigit是字符的true且字符的Unicode十进制数字值(或其单字符分解)小于指定的基数。在这种情况下,返回十进制数字值。
      • 该字符是大写拉丁字母 'A''Z' 之一,其代码小于 radix + 'A' - 10 。在这种情况下,返回 ch - 'A' + 10
      • 该字符是小写拉丁字母 'a''z' 之一,其代码小于 radix + 'a' - 10 。在这种情况下,返回 ch - 'a' + 10
      • 该字符是全角大写拉丁字母 A ('\uFF21') 到 Z ('\uFF3A') 之一,其代码小于 radix + '\uFF21' - 10。在这种情况下,返回 ch - '\uFF21' + 10
      • 该字符是全角小写拉丁字母 a ('\uFF41') 到 z ('\uFF5A') 之一,其代码小于 radix + '\uFF41' - 10。在这种情况下,返回 ch - '\uFF41' + 10

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 digit(int, int) 方法。

      参数:
      ch - 要转换的字符。
      radix - 基数。
      返回:
      由指定基数中的字符表示的数值。
      参见:
    • digit

      public static int digit(int codePoint, int radix)
      返回指定基数中指定字符(Unicode 代码点)的数值。

      如果基数不在 MIN_RADIXradixMAX_RADIX 范围内,或者如果字符不是指定基数中的有效数字,则返回 -1。如果至少满足以下条件之一,则字符是有效数字:

      • 方法isDigit(codePoint) 是字符的true且字符的Unicode十进制数字值(或其单字符分解)小于指定的基数。在这种情况下,返回十进制数字值。
      • 该字符是大写拉丁字母 'A''Z' 之一,其代码小于 radix + 'A' - 10 。在这种情况下,返回 codePoint - 'A' + 10
      • 该字符是小写拉丁字母 'a''z' 之一,其代码小于 radix + 'a' - 10 。在这种情况下,返回 codePoint - 'a' + 10
      • 该字符是全角大写拉丁字母 A ('\uFF21') 到 Z ('\uFF3A') 之一,其代码小于 radix + '\uFF21' - 10。在这种情况下,返回 codePoint - '\uFF21' + 10
      • 该字符是全角小写拉丁字母 a ('\uFF41') 到 z ('\uFF5A') 之一,其代码小于 radix + '\uFF41'- 10。在这种情况下,返回 codePoint - '\uFF41' + 10
      参数:
      codePoint - 要转换的字符(Unicode 代码点)。
      radix - 基数。
      返回:
      由指定基数中的字符表示的数值。
      自从:
      1.5
      参见:
    • getNumericValue

      public static int getNumericValue(char ch)
      返回指定 Unicode 字符表示的 int 值。例如,字符 '\u216C'(罗马数字五十)将返回一个值为 50 的整数。

      大写字母 AZ('\u0041''\u005A' )、小写字母('\u0061''\u007A' )和全角变体('\uFF21''\uFF3A''\uFF41''\uFF5A' )形式的数值从 10 到 35。这与 Uni 无关代码规范,其中不会为这些 char 值分配数值。

      如果字符没有数值,则返回 -1。如果字符具有不能表示为非负整数的数值(例如,分数值),则返回 -2。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 getNumericValue(int) 方法。

      参数:
      ch - 要转换的字符。
      返回:
      字符的数值,作为非负 int 值; -2 如果字符具有数值但该值不能表示为非负 int 值; -1 如果字符没有数值。
      自从:
      1.1
      参见:
    • getNumericValue

      public static int getNumericValue(int codePoint)
      返回指定字符(Unicode 代码点)代表的 int 值。例如,字符 '\u216C'(罗马数字五十)将返回值为 50 的 int

      大写字母 AZ('\u0041''\u005A' )、小写字母('\u0061''\u007A' )和全角变体('\uFF21''\uFF3A''\uFF41''\uFF5A' )形式的数值从 10 到 35。这与 Uni 无关代码规范,其中不会为这些 char 值分配数值。

      如果字符没有数值,则返回 -1。如果字符具有不能表示为非负整数的数值(例如,分数值),则返回 -2。

      参数:
      codePoint - 要转换的字符(Unicode 代码点)。
      返回:
      字符的数值,作为非负 int 值; -2 如果字符具有数值但该值不能表示为非负 int 值; -1 如果字符没有数值。
      自从:
      1.5
      参见:
    • isSpace

      @Deprecated (since ="1.1") public static boolean isSpace(char ch)
      已弃用。
      替换为 isWhitespace(char)。
      确定指定字符是否为 ISO-LATIN-1 空格。此方法仅为以下五个字符返回 true
      真字符
      Character 代码 Name
      '\t' U+0009 HORIZONTAL TABULATION
      '\n' U+000A NEW LINE
      '\f' U+000C FORM FEED
      '\r' U+000D CARRIAGE RETURN
      ' ' U+0020 SPACE
      参数:
      ch - 要测试的字符。
      返回:
      true 如果字符是 ISO-LATIN-1 空格; false否则。
      参见:
    • isSpaceChar

      public static boolean isSpaceChar(char ch)
      确定指定字符是否为 Unicode 空格字符。当且仅当一个字符被 Unicode 标准指定为空格字符时,该字符才被视为空格字符。如果角色的一般类别类型是以下任何一种,则此方法返回 true:
      • SPACE_SEPARATOR
      • LINE_SEPARATOR
      • PARAGRAPH_SEPARATOR

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 isSpaceChar(int) 方法。

      参数:
      ch - 要测试的字符。
      返回:
      true 如果字符是空格字符; false否则。
      自从:
      1.1
      参见:
    • isSpaceChar

      public static boolean isSpaceChar(int codePoint)
      确定指定字符(Unicode 代码点)是否为 Unicode 空格字符。当且仅当一个字符被 Unicode 标准指定为空格字符时,该字符才被视为空格字符。如果角色的一般类别类型是以下任何一种,则此方法返回 true:
      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果字符是空格字符; false否则。
      自从:
      1.5
      参见:
    • isWhitespace

      public static boolean isWhitespace(char ch)
      根据 Java 确定指定字符是否为空格。当且仅当一个字符满足以下条件之一时,它才是 Java 空白字符:
      • 它是 Unicode 空格字符(SPACE_SEPARATORLINE_SEPARATORPARAGRAPH_SEPARATOR),但也不是不间断空格('\u00A0''\u2007''\u202F')。
      • 它是 '\t',U+0009 水平制表。
      • 它是 '\n',U+000A 换行。
      • 它是 '\u000B',U+000B 垂直制表。
      • 它是 '\f',U+000C FORM FEED。
      • 它是 '\r',U+000D 回车。
      • 它是 '\u001C',U+001C 文件分隔符。
      • 它是 '\u001D',U+001D 组分隔符。
      • 它是 '\u001E',U+001E 记录分隔符。
      • 它是 '\u001F',U+001F 单位分隔符。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 isWhitespace(int) 方法。

      参数:
      ch - 要测试的字符。
      返回:
      true 如果字符是 Java 空白字符; false否则。
      自从:
      1.1
      参见:
    • isWhitespace

      public static boolean isWhitespace(int codePoint)
      根据 Java 确定指定字符(Unicode 代码点)是否为空白。当且仅当一个字符满足以下条件之一时,它才是 Java 空白字符:
      • 它是 Unicode 空格字符(SPACE_SEPARATOR LINE_SEPARATOR PARAGRAPH_SEPARATOR ),但也不是不间断空格('\u00A0''\u2007''\u202F')。
      • 它是 '\t',U+0009 水平制表。
      • 它是 '\n',U+000A 换行。
      • 它是 '\u000B',U+000B 垂直制表。
      • 它是 '\f',U+000C FORM FEED。
      • 它是 '\r',U+000D 回车。
      • 它是 '\u001C',U+001C 文件分隔符。
      • 它是 '\u001D',U+001D 组分隔符。
      • 它是 '\u001E',U+001E 记录分隔符。
      • 它是 '\u001F',U+001F 单位分隔符。
      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果字符是 Java 空白字符; false否则。
      自从:
      1.5
      参见:
    • isISOControl

      public static boolean isISOControl(char ch)
      确定指定字符是否为 ISO 控制字符。如果一个字符的代码在 '\u0000''\u001F' 范围内或在 '\u007F''\u009F' 范围内,则该字符被认为是 ISO 控制字符。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 isISOControl(int) 方法。

      参数:
      ch - 要测试的字符。
      返回:
      true 如果字符是 ISO 控制字符; false否则。
      自从:
      1.1
      参见:
    • isISOControl

      public static boolean isISOControl(int codePoint)
      确定引用的字符(Unicode 代码点)是否为 ISO 控制字符。如果一个字符的代码在 '\u0000''\u001F' 范围内或在 '\u007F''\u009F' 范围内,则该字符被认为是 ISO 控制字符。
      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果字符是 ISO 控制字符; false否则。
      自从:
      1.5
      参见:
    • getType

      public static int getType(char ch)
      返回一个值,指示字符的一般类别。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 getType(int) 方法。

      参数:
      ch - 要测试的字符。
      返回:
      int 类型的值表示角色的一般类别。
      自从:
      1.1
      参见:
    • getType

      public static int getType(int codePoint)
      返回一个值,指示字符的一般类别。
      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      int 类型的值表示角色的一般类别。
      自从:
      1.5
      参见:
    • forDigit

      public static char forDigit(int digit, int radix)
      确定指定基数中特定数字的字符表示形式。如果 radix 的值不是有效基数,或者 digit 的值不是指定基数中的有效数字,则返回空字符 ('\u0000')。

      radix 参数如果大于或等于 MIN_RADIX 且小于或等于 MAX_RADIX 则有效。 digit 参数在 0 <= digit < radix 时有效。

      如果数字小于 10,则返回 '0' + digit。否则,返回值 'a' + digit - 10

      参数:
      digit - 要转换为字符的数字。
      radix - 基数。
      返回:
      指定基数中指定数字的 char 表示。
      参见:
    • getDirectionality

      public static byte getDirectionality(char ch)
      返回给定字符的 Unicode 方向性属性。字符方向性用于计算文本的视觉顺序。未定义的 char 值的方向性值为 DIRECTIONALITY_UNDEFINED

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 getDirectionality(int) 方法。

      参数:
      ch - char 请求方向性属性。
      返回:
      char 值的方向性属性。
      自从:
      1.4
      参见:
    • getDirectionality

      public static byte getDirectionality(int codePoint)
      返回给定字符(Unicode 代码点)的 Unicode 方向性属性。字符方向性用于计算文本的视觉顺序。未定义字符的方向性值为 DIRECTIONALITY_UNDEFINED
      参数:
      codePoint - 请求方向性属性的字符(Unicode 代码点)。
      返回:
      角色的方向性属性。
      自从:
      1.5
      参见:
    • isMirrored

      public static boolean isMirrored(char ch)
      确定字符是否根据 Unicode 规范进行镜像。当在从右到左的文本中显示时,镜像字符的字形应该水平镜像。例如,'\u0028' LEFT PARENTHESIS 在语义上定义为左括号.这将在从左到右的文本中显示为“(”,而在从右到左的文本中显示为“)”。

      笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用 isMirrored(int) 方法。

      参数:
      请求镜像属性的 ch - char
      返回:
      true 如果 char 已镜像,false 如果char 未镜像或未定义。
      自从:
      1.4
    • isMirrored

      public static boolean isMirrored(int codePoint)
      确定指定字符(Unicode 代码点)是否根据 Unicode 规范进行镜像。当在从右到左的文本中显示时,镜像字符的字形应该水平镜像。例如,'\u0028' LEFT PARENTHESIS 在语义上定义为左括号.这将在从左到右的文本中显示为“(”,而在从右到左的文本中显示为“)”。
      参数:
      codePoint - 要测试的字符(Unicode 代码点)。
      返回:
      true 如果字符被镜像,false 如果字符未被镜像或未定义。
      自从:
      1.5
    • compareTo

      public int compareTo(Character  anotherCharacter)
      比较两个 Character 对象的数值。
      指定者:
      compareTo 在接口 Comparable<Character>
      参数:
      anotherCharacter - 要比较的 Character
      返回:
      0 如果参数 Character 等于这个 Character ;如果此 Character 在数值上小于 Character 参数,则该值小于 0;如果此 Character 在数值上大于 Character 参数(无符号比较),则该值大于 0。请注意,这只是一个数值比较;它不依赖于locale。
      自从:
      1.2
    • compare

      public static int compare(char x, char y)
      以数字方式比较两个 char 值。返回的值与将返回的值相同:
        Character.valueOf(x).compareTo(Character.valueOf(y))
       
      参数:
      x - 第一个要比较的 char
      y - 要比较的第二个 char
      返回:
      0 如果 x == y ;如果 x < y 小于 0 的值;如果 x > y,则值大于 0
      自从:
      1.7
    • reverseBytes

      public static char reverseBytes(char ch)
      返回通过反转指定的char值中的字节顺序获得的值。
      参数:
      ch - 要反转字节顺序的 char
      返回:
      通过反转(或等效地交换)指定 char 值中的字节获得的值。
      自从:
      1.5
    • getName

      public static String  getName(int codePoint)
      返回指定字符的名称 codePoint ,如果代码点为 unassigned 则返回 null。

      如果指定的字符没有被分配一个名称UnicodeData文件(Unicode 联盟维护的 Unicode 字符数据库的一部分),返回的名称与表达式的结果相同:

      Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);
      对于 codePoint 中的UnicodeData文件,此方法返回的名称遵循 Unicode 标准的“Unicode 名称属性”部分中的命名方案。对于其他代码点,例如 Hangul/Ideographs,上述名称生成规则与 Unicode 标准中定义的规则不同。
      参数:
      codePoint - 字符(Unicode 代码点)
      返回:
      指定字符的名称,如果未分配代码点,则为 null。
      抛出:
      IllegalArgumentException - 如果指定的 codePoint 不是有效的 Unicode 代码点。
      自从:
      1.7
    • codePointOf

      public static int codePointOf(String  name)
      返回给定字符名称指定的 Unicode 字符的代码点值。

      如果一个角色没有被指定一个名字UnicodeData文件(由 Unicode 联盟维护的 Unicode 字符数据库的一部分),其名称定义为表达式的结果:

      Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);

      name 匹配不区分大小写,删除了任何前导和尾随空白字符。对于中的代码点UnicodeData文件,此方法识别符合 Unicode 标准中“Unicode 名称属性”部分中定义的名称的名称。对于其他代码点,此方法识别使用 getName(int) 方法生成的名称。

      参数:
      name - 角色名称
      返回:
      由其名称指定的字符的代码点值。
      抛出:
      IllegalArgumentException - 如果指定的 name 不是有效的字符名称。
      NullPointerException - 如果 namenull
      自从:
      9