- 所有已实现的接口:
Serializable
,Comparable<Character>
,Constable
Character
类将原始类型 char
的值包装在一个对象中。 Character
类的对象包含一个类型为 char
的字段。
此外,此类还提供了大量的静态方法,用于确定字符的类别(小写字母、数字等)以及将字符从大写转换为小写,反之亦然。
Unicode 一致性
类 Character
的字段和方法是根据 Unicode 标准的字符信息定义的,特别是UnicodeData文件是 Unicode 字符数据库的一部分。此文件指定属性,包括每个分配的 Unicode 代码点或字符范围的名称和类别。该文件可从位于 http://www.unicode.org 的 Unicode Consortium 获得。
字符信息基于 Unicode 标准 15.0 版。
随着时间的推移,Java 平台支持不同版本的 Unicode 标准。以下 Java 版本升级到较新版本的 Unicode 标准,每个版本都表示新版本:
Java 版本 | Unicode版本 |
---|---|
Java SE 20 | Unicode 15.0 |
Java SE 19 | Unicode 14.0 |
Java SE 15 | Unicode 13.0 |
Java SE 13 | Unicode 12.1 |
Java SE 12 | Unicode 11.0 |
Java SE 11 | Unicode 10.0 |
Java SE 9 | Unicode 8.0 |
Java SE 8 | Unicode 6.2 |
Java SE 7 | Unicode 6.0 |
Java SE 5.0 | Unicode 4.0 |
Java SE 1.4 | Unicode 3.0 |
JDK 1.1 | Unicode 2.0 |
JDK 1.0.2 | Unicode 1.1.5 |
Unicode 字符表示
char
数据类型(以及 Character
对象封装的值)基于原始 Unicode 规范,该规范将字符定义为固定宽度的 16 位实体。 Unicode 标准已更改为允许其表示需要超过 16 位的字符。合法 code point 的范围现在是 U+0000 到 U+10FFFF,称为 Unicode scalar value。 (参考U+的定义nUnicode 标准中的符号。)
从 U+0000 到 U+FFFF 的字符集 有时称为 Basic Multilingual Plane (BMP) 。代码点大于U+FFFF的Characters被称为supplementary characters。 Java 平台在 char
数组以及 String
和 StringBuffer
类中使用 UTF-16 表示。在此表示中,增补字符表示为一对 char
值,第一个来自 high-surrogates 范围 (\uD800-\uDBFF),第二个来自 low-surrogates 范围 (\uDC00-\uDFFF)。
因此,char
值表示基本多语言平面 (BMP) 代码点,包括代理代码点或 UTF-16 编码的代码单元。 int
值表示所有 Unicode 代码点,包括补充代码点。 int
的低(最低有效)21 位用于表示 Unicode 代码点,高(最高有效)11 位必须为零。除非另有说明,否则关于增补字符和代理项 char
值的行为如下:
- 仅接受
char
值的方法不能支持增补字符。他们将代理项范围中的char
值视为未定义字符。例如,Character.isLetter('\uD840')
返回false
,即使此特定值后跟字符串中的任何低代理值将表示一个字母。 - 接受
int
值的方法支持所有 Unicode 字符,包括增补字符。例如,Character.isLetter(0x2F81A)
返回true
,因为代码点值表示一个字母(CJK 表意文字)。
在 Java SE API 文档中,Unicode code point 用于 U+0000 和 U+10FFFF 之间范围内的字符值,Unicode code unit 用于 16 位 char
值,它们是 UTF-16 编码的代码单元。有关 Unicode 术语的更多信息,请参阅 Unicode 词汇表。
这是一个value-based类;程序员应该将 equal 的实例视为可互换的,并且不应使用实例进行同步,否则可能会发生不可预测的行为。例如,在未来的版本中,同步可能会失败。
- 自从:
- 1.0
- 参见:
-
内部类总结
内部类修饰符和类型类描述static class
此类的实例表示 Unicode 字符集的特定子集。static final class
表示 Unicode 规范中字符块的字符子集系列。static enum
代表 Unicode 标准附件 #24:脚本名称 中定义的字符脚本的字符子集系列。 -
字段摘要
字段修饰符和类型Field描述static final int
用于表示无符号二进制形式的char
值的字节数。static final byte
Unicode 规范中的通用类别“Mc”。static final byte
Unicode 规范中的通用类别“Pc”。static final byte
Unicode 规范中的通用类别“Cc”。static final byte
Unicode 规范中的通用类别“Sc”。static final byte
Unicode 规范中的通用类别“Pd”。static final byte
Unicode 规范中的通用类别“Nd”。static final byte
Unicode 规范中的弱双向字符类型“AN”。static final byte
Unicode 规范中的弱双向字符类型“BN”。static final byte
Unicode 规范中的弱双向字符类型“CS”。static final byte
Unicode 规范中的弱双向字符类型“EN”。static final byte
Unicode 规范中的弱双向字符类型“ES”。static final byte
Unicode 规范中的弱双向字符类型“ET”。static final byte
Unicode 规范中的弱双向字符类型“FSI”。static final byte
Unicode 规范中的强双向字符类型“L”。static final byte
Unicode 规范中的强双向字符类型“LRE”。static final byte
Unicode 规范中的弱双向字符类型“LRI”。static final byte
Unicode 规范中的强双向字符类型“LRO”。static final byte
Unicode 规范中的弱双向字符类型“NSM”。static final byte
Unicode 规范中的中性双向字符类型“ON”。static final byte
Unicode 规范中的中性双向字符类型“B”。static final byte
Unicode 规范中的弱双向字符类型“PDF”。static final byte
Unicode 规范中的弱双向字符类型“PDI”。static final byte
Unicode 规范中的强双向字符类型“R”。static final byte
Unicode 规范中的强双向字符类型“AL”。static final byte
Unicode 规范中的强双向字符类型“RLE”。static final byte
Unicode 规范中的弱双向字符类型“RLI”。static final byte
Unicode 规范中的强双向字符类型“RLO”。static final byte
Unicode 规范中的中性双向字符类型“S”。static final byte
未定义的双向字符类型。static final byte
Unicode 规范中的中性双向字符类型“WS”。static final byte
Unicode 规范中的通用类别“Me”。static final byte
Unicode 规范中的通用类别“Pe”。static final byte
Unicode 规范中的通用类别“Pf”。static final byte
Unicode 规范中的通用类别“Cf”。static final byte
Unicode 规范中的通用类别“Pi”。static final byte
Unicode 规范中的通用类别“Nl”。static final byte
Unicode 规范中的通用类别“Zl”。static final byte
Unicode 规范中的通用类别“Ll”。static final byte
Unicode 规范中的通用类别“Sm”。static final int
a 的最大值 Unicode代码点 ,常量U+10FFFF
。static final char
UTF-16编码中aUnicode 高代理码单元的最大值,常量'\uDBFF'
。static final char
UTF-16编码中aUnicode 低代理代码单元的最大值,常量'\uDFFF'
。static final int
可用于与字符串相互转换的最大基数。static final char
UTF-16 编码中 Unicode 代理代码单元的最大值,常量'\uDFFF'
。static final char
该字段的常量值是char
,'\uFFFF'
类型的最大值。static final int
a 的最小值 Unicode代码点 ,常量U+0000
。static final char
UTF-16编码中aUnicode 高代理码单元的最小值,常量'\uD800'
。static final char
UTF-16编码中aUnicode 低代理代码单元的最小值,常量'\uDC00'
。static final int
可用于与字符串相互转换的最小基数。static final int
a 的最小值 Unicode 补充代码点 ,常量U+10000
。static final char
UTF-16 编码中 Unicode 代理代码单元的最小值,常量'\uD800'
。static final char
该字段的常量值是char
,'\u0000'
类型的最小值。static final byte
Unicode 规范中的通用类别“Lm”。static final byte
Unicode 规范中的通用类别“Sk”。static final byte
Unicode 规范中的通用类别“Mn”。static final byte
Unicode 规范中的通用类别“Lo”。static final byte
Unicode 规范中的一般类别“否”。static final byte
Unicode 规范中的通用类别“Po”。static final byte
Unicode 规范中的通用类别“So”。static final byte
Unicode 规范中的通用类别“Zp”。static final byte
Unicode 规范中的通用类别“Co”。static final int
用于表示无符号二进制形式的char
值的位数,常量16
。static final byte
Unicode 规范中的通用类别“Zs”。static final byte
Unicode 规范中的通用类别“Ps”。static final byte
Unicode 规范中的通用类别“Cs”。static final byte
Unicode 规范中的通用类别“Lt”。代表原始类型char
的Class
实例。static final byte
Unicode 规范中的通用类别“Cn”。static final byte
Unicode 规范中的通用类别“Lu”。 -
构造方法总结
构造方法 -
方法总结
修饰符和类型方法描述static int
charCount
(int codePoint) 确定表示指定字符(Unicode 代码点)所需的char
值的数量。char
返回此Character
对象的值。static int
codePointAt
(char[] a, int index) 返回char
数组给定索引处的代码点。static int
codePointAt
(char[] a, int index, int limit) 返回char
数组给定索引处的代码点,其中只能使用index
小于limit
的数组元素。static int
codePointAt
(CharSequence seq, int index) 返回CharSequence
的给定索引处的代码点。static int
codePointBefore
(char[] a, int index) 返回char
数组给定索引之前的代码点。static int
codePointBefore
(char[] a, int index, int start) 返回char
数组给定索引之前的代码点,其中只能使用index
大于或等于start
的数组元素。static int
codePointBefore
(CharSequence seq, int index) 返回CharSequence
的给定索引之前的代码点。static int
codePointCount
(char[] a, int offset, int count) 返回char
数组参数的子数组中的 Unicode 代码点数。static int
codePointCount
(CharSequence seq, int beginIndex, int endIndex) 返回指定 char 序列的文本范围内的 Unicode 代码点数。static int
codePointOf
(String name) 返回给定字符名称指定的 Unicode 字符的代码点值。static int
compare
(char x, char y) 以数字方式比较两个char
值。int
比较两个Character
对象的数值。返回包含此实例标称描述符的Optional
。static int
digit
(char ch, int radix) 返回指定基数中字符ch
的数值。static int
digit
(int codePoint, int radix) 返回指定基数中指定字符(Unicode 代码点)的数值。boolean
将此对象与指定对象进行比较。static char
forDigit
(int digit, int radix) 确定指定基数中特定数字的字符表示形式。static byte
getDirectionality
(char ch) 返回给定字符的 Unicode 方向性属性。static byte
getDirectionality
(int codePoint) 返回给定字符(Unicode 代码点)的 Unicode 方向性属性。static String
getName
(int codePoint) 返回指定字符的名称codePoint
,如果代码点为unassigned
则返回 null。static int
getNumericValue
(char ch) 返回指定 Unicode 字符表示的int
值。static int
getNumericValue
(int codePoint) 返回指定字符(Unicode 代码点)代表的int
值。static int
getType
(char ch) 返回一个值,指示字符的一般类别。static int
getType
(int codePoint) 返回一个值,指示字符的一般类别。int
hashCode()
返回此Character
的哈希码;等于调用charValue()
的结果。static int
hashCode
(char value) 返回char
值的哈希码;与Character.hashCode()
兼容。static char
highSurrogate
(int codePoint) static boolean
isAlphabetic
(int codePoint) 确定指定字符(Unicode 代码点)是否为字母。static boolean
isBmpCodePoint
(int codePoint) 确定指定字符(Unicode 代码点)是否在 基本多语言平面 (BMP) 中。static boolean
isDefined
(char ch) 确定字符是否以 Unicode 定义。static boolean
isDefined
(int codePoint) 确定字符(Unicode 代码点)是否以 Unicode 定义。static boolean
isDigit
(char ch) 确定指定字符是否为数字。static boolean
isDigit
(int codePoint) 确定指定字符(Unicode 代码点)是否为数字。static boolean
isHighSurrogate
(char ch) 确定给定的char
值是否为 Unicode 高代理码单元(也称为前导代理代码单元).static boolean
isIdentifierIgnorable
(char ch) 确定指定字符是否应被视为 Java 标识符或 Unicode 标识符中的可忽略字符。static boolean
isIdentifierIgnorable
(int codePoint) 确定指定字符(Unicode 代码点)是否应被视为 Java 标识符或 Unicode 标识符中的可忽略字符。static boolean
isIdeographic
(int codePoint) 确定指定字符(Unicode 代码点)是否为 CJKV(中文、日文、韩文和越南文)表意文字,如 Unicode 标准所定义。static boolean
isISOControl
(char ch) 确定指定字符是否为 ISO 控制字符。static boolean
isISOControl
(int codePoint) 确定引用的字符(Unicode 代码点)是否为 ISO 控制字符。static boolean
isJavaIdentifierPart
(char ch) 确定指定的字符是否可以作为 Java 标识符的一部分而不是第一个字符。static boolean
isJavaIdentifierPart
(int codePoint) 确定字符(Unicode 代码点)是否可以作为 Java 标识符的一部分而不是第一个字符。static boolean
isJavaIdentifierStart
(char ch) 确定指定字符是否允许作为 Java 标识符中的第一个字符。static boolean
isJavaIdentifierStart
(int codePoint) 确定字符(Unicode 代码点)是否允许作为 Java 标识符中的第一个字符。static boolean
isJavaLetter
(char ch) 已弃用。替换为 isJavaIdentifierStart(char)。static boolean
isJavaLetterOrDigit
(char ch) 已弃用。替换为 isJavaIdentifierPart(char)。static boolean
isLetter
(char ch) 确定指定字符是否为字母。static boolean
isLetter
(int codePoint) 确定指定字符(Unicode 代码点)是否为字母。static boolean
isLetterOrDigit
(char ch) 确定指定字符是字母还是数字。static boolean
isLetterOrDigit
(int codePoint) 确定指定字符(Unicode 代码点)是字母还是数字。static boolean
isLowerCase
(char ch) 确定指定字符是否为小写字符。static boolean
isLowerCase
(int codePoint) 确定指定字符(Unicode 代码点)是否为小写字符。static boolean
isLowSurrogate
(char ch) 确定给定的char
值是否为 Unicode 低代理代码单元(也称为尾随代理代码单元).static boolean
isMirrored
(char ch) 确定字符是否根据 Unicode 规范进行镜像。static boolean
isMirrored
(int codePoint) 确定指定字符(Unicode 代码点)是否根据 Unicode 规范进行镜像。static boolean
isSpace
(char ch) 已弃用。替换为 isWhitespace(char)。static boolean
isSpaceChar
(char ch) 确定指定字符是否为 Unicode 空格字符。static boolean
isSpaceChar
(int codePoint) 确定指定字符(Unicode 代码点)是否为 Unicode 空格字符。static boolean
isSupplementaryCodePoint
(int codePoint) 确定指定字符(Unicode 代码点)是否在 补充字符 范围内。static boolean
isSurrogate
(char ch) 确定给定的char
值是否为 Unicode代理代码单元.static boolean
isSurrogatePair
(char high, char low) 确定指定的一对char
值是否是有效的 Unicode 代理对 。static boolean
isTitleCase
(char ch) 确定指定字符是否为标题字符。static boolean
isTitleCase
(int codePoint) 确定指定字符(Unicode 代码点)是否为首字母大写字符。static boolean
isUnicodeIdentifierPart
(char ch) 确定指定字符是否可以作为第一个字符以外的 Unicode 标识符的一部分。static boolean
isUnicodeIdentifierPart
(int codePoint) 确定指定字符(Unicode 代码点)是否可以作为第一个字符以外的 Unicode 标识符的一部分。static boolean
isUnicodeIdentifierStart
(char ch) 确定指定字符是否允许作为 Unicode 标识符中的第一个字符。static boolean
isUnicodeIdentifierStart
(int codePoint) 确定指定字符(Unicode 代码点)是否允许作为 Unicode 标识符中的第一个字符。static boolean
isUpperCase
(char ch) 确定指定字符是否为大写字符。static boolean
isUpperCase
(int codePoint) 确定指定字符(Unicode 代码点)是否为大写字符。static boolean
isValidCodePoint
(int codePoint) 确定指定的代码点是否有效 Unicode 代码点值 。static boolean
isWhitespace
(char ch) 根据 Java 确定指定字符是否为空格。static boolean
isWhitespace
(int codePoint) 根据 Java 确定指定字符(Unicode 代码点)是否为空白。static char
lowSurrogate
(int codePoint) static int
offsetByCodePoints
(char[] a, int start, int count, int index, int codePointOffset) 返回给定char
子数组中的索引,该子数组从给定index
偏移codePointOffset
代码点。static int
offsetByCodePoints
(CharSequence seq, int index, int codePointOffset) 返回给定 char 序列中的索引,该序列从给定的index
偏移了codePointOffset
代码点。static char
reverseBytes
(char ch) 返回通过反转指定的char
值中的字节顺序获得的值。static char[]
toChars
(int codePoint) 将指定字符(Unicode 代码点)转换为其存储在char
数组中的 UTF-16 表示形式。static int
toChars
(int codePoint, char[] dst, int dstIndex) 将指定字符(Unicode 代码点)转换为其 UTF-16 表示形式。static int
toCodePoint
(char high, char low) 将指定的代理项对转换为其补充代码点值。static char
toLowerCase
(char ch) 使用 UnicodeData 文件中的大小写映射信息将字符参数转换为小写。static int
toLowerCase
(int codePoint) 使用 UnicodeData 文件中的大小写映射信息将字符(Unicode 代码点)参数转换为小写。toString()
返回表示此Character
值的String
对象。static String
toString
(char c) 返回表示指定char
的String
对象。static String
toString
(int codePoint) 返回表示指定字符(Unicode 代码点)的String
对象。static char
toTitleCase
(char ch) 使用 UnicodeData 文件中的大小写映射信息将字符参数转换为标题大小写。static int
toTitleCase
(int codePoint) 使用 UnicodeData 文件中的大小写映射信息将字符(Unicode 代码点)参数转换为 titlecase。static char
toUpperCase
(char ch) 使用 UnicodeData 文件中的大小写映射信息将字符参数转换为大写。static int
toUpperCase
(int codePoint) 使用 UnicodeData 文件中的大小写映射信息将字符(Unicode 代码点)参数转换为大写。static Character
valueOf
(char c) 返回代表指定char
值的Character
实例。
-
字段详细信息
-
MIN_RADIX
public static final int MIN_RADIX可用于与字符串相互转换的最小基数。该字段的常量值是基数转换方法中基数参数允许的最小值,例如digit
方法、forDigit
方法和Integer
类的toString
方法。- 参见:
-
MAX_RADIX
public static final int MAX_RADIX可用于与字符串相互转换的最大基数。该字段的常量值是类Integer
的digit
方法、forDigit
方法和toString
方法等基数转换方法中基数参数允许的最大值。- 参见:
-
MIN_VALUE
public static final char MIN_VALUE该字段的常量值是char
,'\u0000'
类型的最小值。- 自从:
- 1.0.2
- 参见:
-
MAX_VALUE
public static final char MAX_VALUE该字段的常量值是char
,'\uFFFF'
类型的最大值。- 自从:
- 1.0.2
- 参见:
-
TYPE
代表原始类型char
的Class
实例。- 自从:
- 1.1
-
UNASSIGNED
public static final byte UNASSIGNEDUnicode 规范中的通用类别“Cn”。- 自从:
- 1.1
- 参见:
-
UPPERCASE_LETTER
public static final byte UPPERCASE_LETTERUnicode 规范中的通用类别“Lu”。- 自从:
- 1.1
- 参见:
-
LOWERCASE_LETTER
public static final byte LOWERCASE_LETTERUnicode 规范中的通用类别“Ll”。- 自从:
- 1.1
- 参见:
-
TITLECASE_LETTER
public static final byte TITLECASE_LETTERUnicode 规范中的通用类别“Lt”。- 自从:
- 1.1
- 参见:
-
MODIFIER_LETTER
public static final byte MODIFIER_LETTERUnicode 规范中的通用类别“Lm”。- 自从:
- 1.1
- 参见:
-
OTHER_LETTER
public static final byte OTHER_LETTERUnicode 规范中的通用类别“Lo”。- 自从:
- 1.1
- 参见:
-
NON_SPACING_MARK
public static final byte NON_SPACING_MARKUnicode 规范中的通用类别“Mn”。- 自从:
- 1.1
- 参见:
-
ENCLOSING_MARK
public static final byte ENCLOSING_MARKUnicode 规范中的通用类别“Me”。- 自从:
- 1.1
- 参见:
-
COMBINING_SPACING_MARK
public static final byte COMBINING_SPACING_MARKUnicode 规范中的通用类别“Mc”。- 自从:
- 1.1
- 参见:
-
DECIMAL_DIGIT_NUMBER
public static final byte DECIMAL_DIGIT_NUMBERUnicode 规范中的通用类别“Nd”。- 自从:
- 1.1
- 参见:
-
LETTER_NUMBER
public static final byte LETTER_NUMBERUnicode 规范中的通用类别“Nl”。- 自从:
- 1.1
- 参见:
-
OTHER_NUMBER
public static final byte OTHER_NUMBERUnicode 规范中的一般类别“否”。- 自从:
- 1.1
- 参见:
-
SPACE_SEPARATOR
public static final byte SPACE_SEPARATORUnicode 规范中的通用类别“Zs”。- 自从:
- 1.1
- 参见:
-
LINE_SEPARATOR
public static final byte LINE_SEPARATORUnicode 规范中的通用类别“Zl”。- 自从:
- 1.1
- 参见:
-
PARAGRAPH_SEPARATOR
public static final byte PARAGRAPH_SEPARATORUnicode 规范中的通用类别“Zp”。- 自从:
- 1.1
- 参见:
-
CONTROL
public static final byte CONTROLUnicode 规范中的通用类别“Cc”。- 自从:
- 1.1
- 参见:
-
FORMAT
public static final byte FORMATUnicode 规范中的通用类别“Cf”。- 自从:
- 1.1
- 参见:
-
PRIVATE_USE
public static final byte PRIVATE_USEUnicode 规范中的通用类别“Co”。- 自从:
- 1.1
- 参见:
-
SURROGATE
public static final byte SURROGATEUnicode 规范中的通用类别“Cs”。- 自从:
- 1.1
- 参见:
-
DASH_PUNCTUATION
public static final byte DASH_PUNCTUATIONUnicode 规范中的通用类别“Pd”。- 自从:
- 1.1
- 参见:
-
START_PUNCTUATION
public static final byte START_PUNCTUATIONUnicode 规范中的通用类别“Ps”。- 自从:
- 1.1
- 参见:
-
END_PUNCTUATION
public static final byte END_PUNCTUATIONUnicode 规范中的通用类别“Pe”。- 自从:
- 1.1
- 参见:
-
CONNECTOR_PUNCTUATION
public static final byte CONNECTOR_PUNCTUATIONUnicode 规范中的通用类别“Pc”。- 自从:
- 1.1
- 参见:
-
OTHER_PUNCTUATION
public static final byte OTHER_PUNCTUATIONUnicode 规范中的通用类别“Po”。- 自从:
- 1.1
- 参见:
-
MATH_SYMBOL
public static final byte MATH_SYMBOLUnicode 规范中的通用类别“Sm”。- 自从:
- 1.1
- 参见:
-
CURRENCY_SYMBOL
public static final byte CURRENCY_SYMBOLUnicode 规范中的通用类别“Sc”。- 自从:
- 1.1
- 参见:
-
MODIFIER_SYMBOL
public static final byte MODIFIER_SYMBOLUnicode 规范中的通用类别“Sk”。- 自从:
- 1.1
- 参见:
-
OTHER_SYMBOL
public static final byte OTHER_SYMBOLUnicode 规范中的通用类别“So”。- 自从:
- 1.1
- 参见:
-
INITIAL_QUOTE_PUNCTUATION
public static final byte INITIAL_QUOTE_PUNCTUATIONUnicode 规范中的通用类别“Pi”。- 自从:
- 1.4
- 参见:
-
FINAL_QUOTE_PUNCTUATION
public static final byte FINAL_QUOTE_PUNCTUATIONUnicode 规范中的通用类别“Pf”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_UNDEFINED
public static final byte DIRECTIONALITY_UNDEFINED未定义的双向字符类型。未定义的char
值在 Unicode 规范中具有未定义的方向性。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_LEFT_TO_RIGHT
public static final byte DIRECTIONALITY_LEFT_TO_RIGHTUnicode 规范中的强双向字符类型“L”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_RIGHT_TO_LEFT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFTUnicode 规范中的强双向字符类型“R”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABICUnicode 规范中的强双向字符类型“AL”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_EUROPEAN_NUMBER
public static final byte DIRECTIONALITY_EUROPEAN_NUMBERUnicode 规范中的弱双向字符类型“EN”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATORUnicode 规范中的弱双向字符类型“ES”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATORUnicode 规范中的弱双向字符类型“ET”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_ARABIC_NUMBER
public static final byte DIRECTIONALITY_ARABIC_NUMBERUnicode 规范中的弱双向字符类型“AN”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATORUnicode 规范中的弱双向字符类型“CS”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_NONSPACING_MARK
public static final byte DIRECTIONALITY_NONSPACING_MARKUnicode 规范中的弱双向字符类型“NSM”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_BOUNDARY_NEUTRAL
public static final byte DIRECTIONALITY_BOUNDARY_NEUTRALUnicode 规范中的弱双向字符类型“BN”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_PARAGRAPH_SEPARATOR
public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATORUnicode 规范中的中性双向字符类型“B”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_SEGMENT_SEPARATOR
public static final byte DIRECTIONALITY_SEGMENT_SEPARATORUnicode 规范中的中性双向字符类型“S”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_WHITESPACE
public static final byte DIRECTIONALITY_WHITESPACEUnicode 规范中的中性双向字符类型“WS”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_OTHER_NEUTRALS
public static final byte DIRECTIONALITY_OTHER_NEUTRALSUnicode 规范中的中性双向字符类型“ON”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDINGUnicode 规范中的强双向字符类型“LRE”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDEUnicode 规范中的强双向字符类型“LRO”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDINGUnicode 规范中的强双向字符类型“RLE”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDEUnicode 规范中的强双向字符类型“RLO”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMATUnicode 规范中的弱双向字符类型“PDF”。- 自从:
- 1.4
- 参见:
-
DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATEUnicode 规范中的弱双向字符类型“LRI”。- 自从:
- 9
- 参见:
-
DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATEUnicode 规范中的弱双向字符类型“RLI”。- 自从:
- 9
- 参见:
-
DIRECTIONALITY_FIRST_STRONG_ISOLATE
public static final byte DIRECTIONALITY_FIRST_STRONG_ISOLATEUnicode 规范中的弱双向字符类型“FSI”。- 自从:
- 9
- 参见:
-
DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_ISOLATEUnicode 规范中的弱双向字符类型“PDI”。- 自从:
- 9
- 参见:
-
MIN_HIGH_SURROGATE
public static final char MIN_HIGH_SURROGATEUTF-16编码中aUnicode 高代理码单元的最小值,常量'\uD800'
。高代理也被称为主导代理人.- 自从:
- 1.5
- 参见:
-
MAX_HIGH_SURROGATE
public static final char MAX_HIGH_SURROGATEUTF-16编码中aUnicode 高代理码单元的最大值,常量'\uDBFF'
。高代理也被称为主导代理人.- 自从:
- 1.5
- 参见:
-
MIN_LOW_SURROGATE
public static final char MIN_LOW_SURROGATEUTF-16编码中aUnicode 低代理代码单元的最小值,常量'\uDC00'
。低代理也被称为尾随代理.- 自从:
- 1.5
- 参见:
-
MAX_LOW_SURROGATE
public static final char MAX_LOW_SURROGATEUTF-16编码中aUnicode 低代理代码单元的最大值,常量'\uDFFF'
。低代理也被称为尾随代理.- 自从:
- 1.5
- 参见:
-
MIN_SURROGATE
public static final char MIN_SURROGATEUTF-16 编码中 Unicode 代理代码单元的最小值,常量'\uD800'
。- 自从:
- 1.5
- 参见:
-
MAX_SURROGATE
public static final char MAX_SURROGATEUTF-16 编码中 Unicode 代理代码单元的最大值,常量'\uDFFF'
。- 自从:
- 1.5
- 参见:
-
MIN_SUPPLEMENTARY_CODE_POINT
public static final int MIN_SUPPLEMENTARY_CODE_POINTa 的最小值 Unicode 补充代码点 ,常量U+10000
。- 自从:
- 1.5
- 参见:
-
MIN_CODE_POINT
public static final int MIN_CODE_POINTa 的最小值 Unicode代码点 ,常量U+0000
。- 自从:
- 1.5
- 参见:
-
MAX_CODE_POINT
public static final int MAX_CODE_POINTa 的最大值 Unicode代码点 ,常量U+10FFFF
。- 自从:
- 1.5
- 参见:
-
SIZE
public static final int SIZE用于表示无符号二进制形式的char
值的位数,常量16
。- 自从:
- 1.5
- 参见:
-
BYTES
public static final int BYTES用于表示无符号二进制形式的char
值的字节数。- 自从:
- 1.8
- 参见:
-
-
构造方法详细信息
-
Character
已弃用,将被删除:此 API 元素可能会在未来版本中删除。使用此构造函数很少是合适的。静态工厂valueOf(char)
通常是更好的选择,因为它可能会产生更好的空间和时间性能。构造一个新分配的Character
对象,表示指定的char
值。- 参数:
value
- 由Character
对象表示的值。
-
-
方法详情
-
describeConstable
返回包含此实例标称描述符的Optional
。- 指定者:
describeConstable
在接口Constable
中- 返回:
Optional
描述了 Character 实例- 自从:
- 15
-
valueOf
返回代表指定char
值的Character
实例。如果不需要新的Character
实例,通常应优先使用此方法而不是构造函数Character(char)
,因为此方法可能通过缓存频繁请求的值来产生明显更好的空间和时间性能。此方法将始终缓存'\u0000'
到'\u007F'
范围内的值(含),并可能缓存此范围之外的其他值。- 参数:
c
- 一个字符值。- 返回:
-
代表
c
的Character
实例。 - 自从:
- 1.5
-
charValue
public char charValue()返回此Character
对象的值。- 返回:
-
此对象表示的原始
char
值。
-
hashCode
public int hashCode()返回此Character
的哈希码;等于调用charValue()
的结果。 -
hashCode
public static int hashCode(char value) 返回char
值的哈希码;与Character.hashCode()
兼容。- 参数:
value
- 要为其返回哈希码的char
。- 返回:
char
值的哈希码值。- 自从:
- 1.8
-
equals
将此对象与指定对象进行比较。结果是true
当且仅当参数不是null
并且是一个Character
对象,表示与该对象相同的char
值。 -
toString
返回表示此Character
值的String
对象。结果是一个长度为 1 的字符串,其唯一组成部分是此Character
对象表示的原始char
值。 -
toString
返回表示指定char
的String
对象。结果是一个长度为 1 的字符串,仅由指定的char
组成。- API 注意:
-
此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
toString(int)
方法。 - 参数:
c
- 要转换的char
- 返回:
-
指定
char
的字符串表示形式 - 自从:
- 1.4
-
toString
返回表示指定字符(Unicode 代码点)的String
对象。结果是长度为 1 或 2 的字符串,仅由指定的codePoint
组成。- 参数:
codePoint
- 要转换的codePoint
- 返回:
-
指定
codePoint
的字符串表示形式 - 抛出:
IllegalArgumentException
- 如果指定的codePoint
不是 有效的 Unicode 代码点。- 自从:
- 11
-
isValidCodePoint
public static boolean isValidCodePoint(int codePoint) 确定指定的代码点是否有效 Unicode 代码点值 。- 参数:
codePoint
- 要测试的 Unicode 代码点- 返回:
true
如果指定的代码点值介于MIN_CODE_POINT
和MAX_CODE_POINT
之间;false
否则。- 自从:
- 1.5
-
isBmpCodePoint
public static boolean isBmpCodePoint(int codePoint) 确定指定字符(Unicode 代码点)是否在 基本多语言平面 (BMP) 中。此类代码点可以使用单个char
表示。 -
isSupplementaryCodePoint
public static boolean isSupplementaryCodePoint(int codePoint) 确定指定字符(Unicode 代码点)是否在 补充字符 范围内。- 参数:
codePoint
- 要测试的字符(Unicode 代码点)- 返回:
true
如果指定的代码点介于MIN_SUPPLEMENTARY_CODE_POINT
和MAX_CODE_POINT
之间;false
否则。- 自从:
- 1.5
-
isHighSurrogate
public static boolean isHighSurrogate(char ch) - 参数:
ch
- 要测试的char
值。- 返回:
true
如果char
值介于MIN_HIGH_SURROGATE
和MAX_HIGH_SURROGATE
之间;false
否则。- 自从:
- 1.5
- 参见:
-
isLowSurrogate
public static boolean isLowSurrogate(char ch) - 参数:
ch
- 要测试的char
值。- 返回:
true
如果char
值介于MIN_LOW_SURROGATE
和MAX_LOW_SURROGATE
之间;false
否则。- 自从:
- 1.5
- 参见:
-
isSurrogate
public static boolean isSurrogate(char ch) 确定给定的char
值是否为 Unicode代理代码单元.这些值本身不表示字符,但用于 UTF-16 编码中 补充字符 的表示。
- 参数:
ch
- 要测试的char
值。- 返回:
true
如果char
值介于MIN_SURROGATE
和MAX_SURROGATE
之间;false
否则。- 自从:
- 1.7
-
isSurrogatePair
public static boolean isSurrogatePair(char high, char low) - 参数:
high
- 要测试的高代理码值low
- 要测试的低代理代码值- 返回:
true
如果指定的高代理代码值和低代理代码值表示有效的代理对;false
否则。- 自从:
- 1.5
-
charCount
public static int charCount(int codePoint) 确定表示指定字符(Unicode 代码点)所需的char
值的数量。如果指定的字符等于或大于 0x10000,则该方法返回 2。否则,该方法返回 1。此方法不会将指定字符验证为有效的 Unicode 代码点。如有必要,调用者必须使用
isValidCodePoint
验证字符值。- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
- 2 如果字符是有效的增补字符; 1 否则。
- 自从:
- 1.5
- 参见:
-
toCodePoint
public static int toCodePoint(char high, char low) 将指定的代理项对转换为其补充代码点值。此方法不验证指定的代理项对。如有必要,调用者必须使用isSurrogatePair
对其进行验证。- 参数:
high
- 高代理代码单元low
- 低代理代码单元- 返回:
- 由指定的代理对组成的补充代码点。
- 自从:
- 1.5
-
codePointAt
返回CharSequence
的给定索引处的代码点。如果CharSequence
中给定索引处的char
值在高代理范围内,以下索引小于CharSequence
的长度,并且以下索引处的char
值在低代理范围内,则补充返回对应于该代理对的代码点。否则,返回给定索引处的char
值。- 参数:
seq
-char
值序列(Unicode 代码单元)index
- 要转换的seq
中的char
值(Unicode 代码单元)的索引- 返回:
- 给定索引处的 Unicode 代码点
- 抛出:
NullPointerException
- 如果seq
为空。IndexOutOfBoundsException
- 如果值index
为负数或不小于seq.length()
。- 自从:
- 1.5
-
codePointAt
public static int codePointAt(char[] a, int index) 返回char
数组给定索引处的代码点。如果char
数组中给定索引处的char
值在高代理项范围内,以下索引小于char
数组的长度,并且以下索引处的char
值在低代理项范围内,则返回对应于该代理对的补充代码点。否则,返回给定索引处的char
值。- 参数:
a
-char
数组index
- 要转换的char
数组中char
值(Unicode 代码单元)的索引- 返回:
- 给定索引处的 Unicode 代码点
- 抛出:
NullPointerException
- 如果a
为空。IndexOutOfBoundsException
- 如果值index
为负数或不小于char
数组的长度。- 自从:
- 1.5
-
codePointAt
public static int codePointAt(char[] a, int index, int limit) 返回char
数组给定索引处的代码点,其中只能使用index
小于limit
的数组元素。如果char
数组中给定索引处的char
值在高代理项范围内,以下索引小于limit
,并且以下索引处的char
值在低代理项范围内,则补充代码点对应于这个代理对被返回。否则,返回给定索引处的char
值。- 参数:
a
-char
数组index
- 要转换的char
数组中char
值(Unicode 代码单元)的索引limit
- 可在char
数组中使用的最后一个数组元素之后的索引- 返回:
- 给定索引处的 Unicode 代码点
- 抛出:
NullPointerException
- 如果a
为空。IndexOutOfBoundsException
- 如果index
参数为负数或不小于limit
参数,或者如果limit
参数为负数或大于char
数组的长度。- 自从:
- 1.5
-
codePointBefore
返回CharSequence
的给定索引之前的代码点。如果CharSequence
中(index - 1)
处的char
值在低代理范围内,(index - 2)
不为负,CharSequence
中(index - 2)
处的char
值在高代理范围内,则该代理对对应的补充码位为回。否则,返回(index - 1)
处的char
值。- 参数:
seq
-CharSequence
实例index
- 应该返回的代码点之后的索引- 返回:
- 给定索引之前的 Unicode 代码点值。
- 抛出:
NullPointerException
- 如果seq
为空。IndexOutOfBoundsException
- 如果index
参数小于 1 或大于seq.length()
。- 自从:
- 1.5
-
codePointBefore
public static int codePointBefore(char[] a, int index) 返回char
数组给定索引之前的代码点。如果char
数组中(index - 1)
处的char
值在低代理项范围内,(index - 2)
不为负,且char
数组中(index - 2)
处的char
值在高代理项范围内,则补充码位对应这个代理项对被退回。否则,返回(index - 1)
处的char
值。- 参数:
a
-char
数组index
- 应该返回的代码点之后的索引- 返回:
- 给定索引之前的 Unicode 代码点值。
- 抛出:
NullPointerException
- 如果a
为空。IndexOutOfBoundsException
- 如果index
参数小于 1 或大于char
数组的长度- 自从:
- 1.5
-
codePointBefore
public static int codePointBefore(char[] a, int index, int start) 返回char
数组给定索引之前的代码点,其中只能使用index
大于或等于start
的数组元素。若char
数组中(index - 1)
处的char
值在低代理范围内,(index - 2)
不小于start
,且char
数组中(index - 2)
处的char
值在高代理范围内,则补充码位对应这个代理对被返回。否则,返回(index - 1)
处的char
值。- 参数:
a
-char
数组index
- 应该返回的代码点之后的索引start
-char
数组中第一个数组元素的索引- 返回:
- 给定索引之前的 Unicode 代码点值。
- 抛出:
NullPointerException
- 如果a
为空。IndexOutOfBoundsException
- 如果index
参数不大于start
参数或大于char
数组的长度,或者如果start
参数为负数或不小于char
数组的长度。- 自从:
- 1.5
-
highSurrogate
public static char highSurrogate(int codePoint) 返回 代理对 的前导代理项 (a 高代理码单元 ),表示 UTF-16 编码中指定的补充字符(Unicode 代码点)。如果指定的字符不是 补充字符 ,则返回未指定的char
。如果
isSupplementaryCodePoint(x)
为true
,则isHighSurrogate
(highSurrogate(x))
和toCodePoint
(highSurrogate(x),
lowSurrogate
(x)) == x
也始终为true
。- 参数:
codePoint
- 补充字符(Unicode 代码点)- 返回:
- 用于表示 UTF-16 编码中字符的前导代理代码单元
- 自从:
- 1.7
-
lowSurrogate
public static char lowSurrogate(int codePoint) 返回表示 UTF-16 编码中指定补充字符(Unicode 代码点)的 代理对 的尾随代理项 (a 低代理码单元 )。如果指定的字符不是 补充字符 ,则返回未指定的char
。如果
isSupplementaryCodePoint(x)
为true
,则isLowSurrogate
(lowSurrogate(x))
和toCodePoint
(
highSurrogate
(x), lowSurrogate(x)) == x
也始终为true
。- 参数:
codePoint
- 补充字符(Unicode 代码点)- 返回:
- 用于表示 UTF-16 编码中字符的尾随代理项代码单元
- 自从:
- 1.7
-
toChars
public static int toChars(int codePoint, char[] dst, int dstIndex) 将指定字符(Unicode 代码点)转换为其 UTF-16 表示形式。如果指定的代码点是 BMP(基本多语言平面或平面 0)值,则相同的值存储在dst[dstIndex]
中,并返回 1。如果指定的代码点是增补字符,则其代理值存储在dst[dstIndex]
(高代理)和dst[dstIndex+1]
(低代理)中,并返回 2。- 参数:
codePoint
- 要转换的字符(Unicode 代码点)。dst
-char
的数组,其中存储了codePoint
的 UTF-16 值。dstIndex
- 存储转换值的dst
数组的起始索引。- 返回:
- 如果代码点是 BMP 代码点,则为 1,如果代码点是补充代码点,则为 2。
- 抛出:
IllegalArgumentException
- 如果指定的codePoint
不是有效的 Unicode 代码点。NullPointerException
- 如果指定的dst
为空。IndexOutOfBoundsException
- 如果dstIndex
为负数或不小于dst.length
,或者如果dstIndex
的dst
没有足够的数组元素来存储生成的char
值。 (如果dstIndex
等于dst.length-1
且指定的codePoint
是增补字符,则高代理值不存储在dst[dstIndex]
中。)- 自从:
- 1.5
-
toChars
public static char[] toChars(int codePoint) 将指定字符(Unicode 代码点)转换为其存储在char
数组中的 UTF-16 表示形式。如果指定的代码点是 BMP(基本多语言平面或平面 0)值,则生成的char
数组与codePoint
具有相同的值。如果指定的代码点是补充代码点,则生成的char
数组具有相应的代理项对。- 参数:
codePoint
- 一个 Unicode 代码点- 返回:
-
具有
codePoint
的 UTF-16 表示的char
数组。 - 抛出:
IllegalArgumentException
- 如果指定的codePoint
不是有效的 Unicode 代码点。- 自从:
- 1.5
-
codePointCount
返回指定 char 序列的文本范围内的 Unicode 代码点数。文本范围从指定的beginIndex
开始并扩展到索引endIndex - 1
处的char
。因此,文本范围的长度(以char
s 为单位)为endIndex-beginIndex
。文本范围内未配对的代理项各计为一个代码点。- 参数:
seq
- 字符序列beginIndex
- 文本范围第一个char
的索引。endIndex
- 文本范围最后一个char
之后的索引。- 返回:
- 指定文本范围内的 Unicode 代码点数
- 抛出:
NullPointerException
- 如果seq
为空。IndexOutOfBoundsException
- 如果beginIndex
为负,或者endIndex
大于给定序列的长度,或者beginIndex
大于endIndex
。- 自从:
- 1.5
-
codePointCount
public static int codePointCount(char[] a, int offset, int count) 返回char
数组参数的子数组中的 Unicode 代码点数。offset
参数是子数组第一个char
的索引,count
参数指定char
中子数组的长度。子数组中未配对的代理项各自计为一个代码点。- 参数:
a
-char
数组offset
- 给定char
数组中第一个char
的索引count
-char
s 中子数组的长度- 返回:
- 指定子数组中 Unicode 代码点的数量
- 抛出:
NullPointerException
- 如果a
为空。IndexOutOfBoundsException
- 如果offset
或count
为负数,或者如果offset + count
大于给定数组的长度。- 自从:
- 1.5
-
offsetByCodePoints
返回给定 char 序列中的索引,该序列从给定的index
偏移了codePointOffset
代码点。index
和codePointOffset
给定的文本范围内的未配对代理各计为一个代码点。- 参数:
seq
- 字符序列index
- 要偏移的索引codePointOffset
- 代码点的偏移量- 返回:
- 字符序列中的索引
- 抛出:
NullPointerException
- 如果seq
为空。IndexOutOfBoundsException
- 如果index
为负数或大于 char 序列的长度,或者如果codePointOffset
为正数并且以index
开头的子序列少于codePointOffset
个代码点,或者如果codePointOffset
为负数并且index
之前的子序列少于绝对值codePointOffset
个代码点。- 自从:
- 1.5
-
offsetByCodePoints
public static int offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset) 返回给定char
子数组中的索引,该子数组从给定index
偏移codePointOffset
代码点。start
和count
参数指定char
数组的子数组。index
和codePointOffset
给定的文本范围内的未配对代理各计为一个代码点。- 参数:
a
-char
数组start
- 子数组第一个char
的索引count
-char
s 中子数组的长度index
- 要偏移的索引codePointOffset
- 代码点的偏移量- 返回:
- 子数组中的索引
- 抛出:
NullPointerException
- 如果a
为空。IndexOutOfBoundsException
- 如果start
或count
为负数,或者如果start + count
大于给定数组的长度,或者如果index
小于start
或大于start + count
,或者如果codePointOffset
为正数并且文本范围以index
开头并以start + count - 1
具有少于codePointOffset
个代码点,或者如果codePointOffset
为负并且以start
开始并以index - 1
结束的文本范围少于codePointOffset
代码点的绝对值。- 自从:
- 1.5
-
isLowerCase
public static boolean isLowerCase(char ch) 确定指定字符是否为小写字符。如果字符的一般类别类型(由
Character.getType(ch)
提供)为LOWERCASE_LETTER
,或者它具有 Unicode 标准定义的贡献属性 Other_Lowercase,则字符为小写。以下是小写字符的示例:
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
许多其他 Unicode 字符也是小写的。
笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
isLowerCase(int)
方法。- 参数:
ch
- 要测试的字符。- 返回:
true
如果字符是小写;false
否则。- 参见:
-
isLowerCase
public static boolean isLowerCase(int codePoint) 确定指定字符(Unicode 代码点)是否为小写字符。如果字符的一般类别类型(由
getType(codePoint)
提供)为LOWERCASE_LETTER
,或者它具有 Unicode 标准定义的贡献属性 Other_Lowercase,则该字符为小写。以下是小写字符的示例:
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
许多其他 Unicode 字符也是小写的。
- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果字符是小写;false
否则。- 自从:
- 1.5
- 参见:
-
isUpperCase
public static boolean isUpperCase(char ch) 确定指定字符是否为大写字符。如果
Character.getType(ch)
提供的一般类别类型为UPPERCASE_LETTER
,则字符为大写。或者它具有 Unicode 标准定义的贡献属性 Other_Uppercase。以下是大写字符的示例:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
许多其他 Unicode 字符也是大写的。
笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
isUpperCase(int)
方法。- 参数:
ch
- 要测试的字符。- 返回:
true
如果字符是大写;false
否则。- 自从:
- 1.0
- 参见:
-
isUpperCase
public static boolean isUpperCase(int codePoint) 确定指定字符(Unicode 代码点)是否为大写字符。如果字符的一般类别类型(由
getType(codePoint)
提供)为UPPERCASE_LETTER
,或者它具有 Unicode 标准定义的贡献属性 Other_Uppercase,则该字符为大写。以下是大写字符的示例:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
许多其他 Unicode 字符也是大写的。
- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果字符是大写;false
否则。- 自从:
- 1.5
- 参见:
-
isTitleCase
public static boolean isTitleCase(char ch) 确定指定字符是否为标题字符。如果一个字符的一般类别类型(由
Character.getType(ch)
提供)是TITLECASE_LETTER
,则该字符是首字母大写字符。有些字符看起来像成对的拉丁字母。例如,有一个大写字母看起来像“LJ”,对应的小写字母看起来像“lj”。第三种形式,看起来像“Lj”,是在将首字母大写的小写单词呈现为书名时使用的合适形式。
这些是此方法返回
true
的一些 Unicode 字符:LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
许多其他 Unicode 字符也是首字母大写。
笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
isTitleCase(int)
方法。- 参数:
ch
- 要测试的字符。- 返回:
true
如果字符是首字母大写;false
否则。- 自从:
- 1.0.2
- 参见:
-
isTitleCase
public static boolean isTitleCase(int codePoint) 确定指定字符(Unicode 代码点)是否为首字母大写字符。如果由
getType(codePoint)
提供的一般类别类型是TITLECASE_LETTER
,则该字符是首字母大写字符。有些字符看起来像成对的拉丁字母。例如,有一个大写字母看起来像“LJ”,对应的小写字母看起来像“lj”。第三种形式,看起来像“Lj”,是在将首字母大写的小写单词呈现为书名时使用的合适形式。
这些是此方法返回
true
的一些 Unicode 字符:LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
许多其他 Unicode 字符也是首字母大写。
- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果字符是首字母大写;false
否则。- 自从:
- 1.5
- 参见:
-
isDigit
public static boolean isDigit(char ch) 确定指定字符是否为数字。如果字符的一般类别类型(由
Character.getType(ch)
提供)是DECIMAL_DIGIT_NUMBER
,则该字符是数字。一些包含数字的 Unicode 字符范围:
'\u0030'
到'\u0039'
,ISO-LATIN-1 数字('0'
到'9'
)'\u0660'
到'\u0669'
,阿拉伯-印度数字'\u06F0'
到'\u06F9'
,扩展的阿拉伯-印度数字'\u0966'
到'\u096F'
,梵文数字'\uFF10'
到'\uFF19'
,全角数字
笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
isDigit(int)
方法。- 参数:
ch
- 要测试的字符。- 返回:
true
如果字符是数字;false
否则。- 参见:
-
isDigit
public static boolean isDigit(int codePoint) 确定指定字符(Unicode 代码点)是否为数字。如果字符的一般类别类型(由
getType(codePoint)
提供)是DECIMAL_DIGIT_NUMBER
,则该字符是数字。一些包含数字的 Unicode 字符范围:
'\u0030'
到'\u0039'
,ISO-LATIN-1 数字('0'
到'9'
)'\u0660'
到'\u0669'
,阿拉伯-印度数字'\u06F0'
到'\u06F9'
,扩展的阿拉伯-印度数字'\u0966'
到'\u096F'
,梵文数字'\uFF10'
到'\uFF19'
,全角数字
- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果字符是数字;false
否则。- 自从:
- 1.5
- 参见:
-
isDefined
public static boolean isDefined(char ch) 确定字符是否以 Unicode 定义。如果至少满足以下条件之一,则定义字符:
- 它在 UnicodeData 文件中有一个条目。
- 它的值在 UnicodeData 文件定义的范围内。
笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
isDefined(int)
方法。- 参数:
ch
- 要测试的字符- 返回:
true
如果该字符在 Unicode 中具有定义的含义;false
否则。- 自从:
- 1.0.2
- 参见:
-
isDefined
public static boolean isDefined(int codePoint) 确定字符(Unicode 代码点)是否以 Unicode 定义。如果至少满足以下条件之一,则定义字符:
- 它在 UnicodeData 文件中有一个条目。
- 它的值在 UnicodeData 文件定义的范围内。
- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果该字符在 Unicode 中具有定义的含义;false
否则。- 自从:
- 1.5
- 参见:
-
isLetter
public static boolean isLetter(char ch) 确定指定字符是否为字母。如果一个字符被
Character.getType(ch)
提供的一般类别类型是以下任何一种,则该字符被认为是一个字母:UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
isLetter(int)
方法。- 参数:
ch
- 要测试的字符。- 返回:
true
如果字符是字母;false
否则。- 参见:
-
isLetter
public static boolean isLetter(int codePoint) 确定指定字符(Unicode 代码点)是否为字母。如果一个字符被
getType(codePoint)
提供的一般类别类型是以下任何一种,则该字符被认为是一个字母:UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果字符是字母;false
否则。- 自从:
- 1.5
- 参见:
-
isLetterOrDigit
public static boolean isLetterOrDigit(char ch) 确定指定字符是字母还是数字。如果
Character.isLetter(char ch)
或Character.isDigit(char ch)
为字符返回true
,则该字符被认为是字母或数字。笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
isLetterOrDigit(int)
方法。- 参数:
ch
- 要测试的字符。- 返回:
true
如果字符是字母或数字;false
否则。- 自从:
- 1.0.2
- 参见:
-
isLetterOrDigit
public static boolean isLetterOrDigit(int codePoint) 确定指定字符(Unicode 代码点)是字母还是数字。如果
isLetter(codePoint)
或isDigit(codePoint)
为字符返回true
,则该字符被认为是字母或数字。- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果字符是字母或数字;false
否则。- 自从:
- 1.5
- 参见:
-
isJavaLetter
已弃用。替换为 isJavaIdentifierStart(char)。确定指定字符是否允许作为 Java 标识符中的第一个字符。当且仅当以下条件之一为真时,字符才可以开始 Java 标识符:
isLetter(ch)
返回true
getType(ch)
返回LETTER_NUMBER
ch
是货币符号(例如'$'
)ch
是连接标点符号(例如'_'
)。
- 参数:
ch
- 要测试的字符。- 返回:
true
如果该字符可能开始一个 Java 标识符;false
否则。- 自从:
- 1.0.2
- 参见:
-
isJavaLetterOrDigit
已弃用。替换为 isJavaIdentifierPart(char)。确定指定的字符是否可以作为 Java 标识符的一部分而不是第一个字符。当且仅当以下条件之一为真时,字符才可能是 Java 标识符的一部分:
- 这是一封信
- 它是一个货币符号(例如
'$'
) - 它是一个连接标点符号(例如
'_'
) - 这是一个数字
- 它是一个数字字母(例如罗马数字字符)
- 这是一个组合标记
- 它是一个非间距标记
isIdentifierIgnorable
为字符返回true
。
- 参数:
ch
- 要测试的字符。- 返回:
true
如果字符可能是 Java 标识符的一部分;false
否则。- 自从:
- 1.0.2
- 参见:
-
isAlphabetic
public static boolean isAlphabetic(int codePoint) 确定指定字符(Unicode 代码点)是否为字母。如果
getType(codePoint)
提供的一般类别类型是以下任何一种,则字符被认为是字母的:UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
LETTER_NUMBER
- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果字符是 Unicode 字母字符,false
否则。- 自从:
- 1.7
-
isIdeographic
public static boolean isIdeographic(int codePoint) 确定指定字符(Unicode 代码点)是否为 CJKV(中文、日文、韩文和越南文)表意文字,如 Unicode 标准所定义。- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果字符是 Unicode 表意文字字符,false
否则。- 自从:
- 1.7
-
isJavaIdentifierStart
public static boolean isJavaIdentifierStart(char ch) 确定指定字符是否允许作为 Java 标识符中的第一个字符。当且仅当以下条件之一为真时,字符才可以开始 Java 标识符:
isLetter(ch)
返回true
getType(ch)
返回LETTER_NUMBER
ch
是货币符号(例如'$'
)ch
是连接标点符号(例如'_'
)。
笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
isJavaIdentifierStart(int)
方法。- 参数:
ch
- 要测试的字符。- 返回:
true
如果该字符可能开始一个 Java 标识符;false
否则。- 自从:
- 1.1
- 参见:
-
isJavaIdentifierStart
public static boolean isJavaIdentifierStart(int codePoint) 确定字符(Unicode 代码点)是否允许作为 Java 标识符中的第一个字符。当且仅当以下条件之一为真时,字符才可以开始 Java 标识符:
isLetter(codePoint)
返回true
getType(codePoint)
返回LETTER_NUMBER
- 引用的字符是货币符号(例如
'$'
) - 引用的字符是连接标点符号(例如
'_'
)。
- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果该字符可能开始一个 Java 标识符;false
否则。- 自从:
- 1.5
- 参见:
-
isJavaIdentifierPart
public static boolean isJavaIdentifierPart(char ch) 确定指定的字符是否可以作为 Java 标识符的一部分而不是第一个字符。如果满足以下任何条件,则字符可能是 Java 标识符的一部分:
- 这是一封信
- 它是一个货币符号(例如
'$'
) - 它是一个连接标点符号(例如
'_'
) - 这是一个数字
- 它是一个数字字母(例如罗马数字字符)
- 这是一个组合标记
- 它是一个非间距标记
isIdentifierIgnorable
为字符返回true
笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
isJavaIdentifierPart(int)
方法。- 参数:
ch
- 要测试的字符。- 返回:
true
如果字符可能是 Java 标识符的一部分;false
否则。- 自从:
- 1.1
- 参见:
-
isJavaIdentifierPart
public static boolean isJavaIdentifierPart(int codePoint) 确定字符(Unicode 代码点)是否可以作为 Java 标识符的一部分而不是第一个字符。如果满足以下任何条件,则字符可能是 Java 标识符的一部分:
- 这是一封信
- 它是一个货币符号(例如
'$'
) - 它是一个连接标点符号(例如
'_'
) - 这是一个数字
- 它是一个数字字母(例如罗马数字字符)
- 这是一个组合标记
- 它是一个非间距标记
isIdentifierIgnorable(codePoint)
返回代码点的true
- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果字符可能是 Java 标识符的一部分;false
否则。- 自从:
- 1.5
- 参见:
-
isUnicodeIdentifierStart
public static boolean isUnicodeIdentifierStart(char ch) 确定指定字符是否允许作为 Unicode 标识符中的第一个字符。当且仅当以下条件之一为真时,字符才可以开始 Unicode 标识符:
isLetter(ch)
返回true
getType(ch)
返回LETTER_NUMBER
。- 它是一个
Other_ID_Start
字符。
此方法符合 Unicode 标准的UAX31-R1:默认标识符要求,具有以下 UAX31 的配置文件:
Start := ID_Start + 'VERTICAL TILDE' (U+2E2F)
'VERTICAL TILDE'
添加到Start
以实现向后兼容性。笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
isUnicodeIdentifierStart(int)
方法。- 参数:
ch
- 要测试的字符。- 返回:
true
如果字符可以开始一个 Unicode 标识符;false
否则。- 自从:
- 1.1
- 参见:
-
isUnicodeIdentifierStart
public static boolean isUnicodeIdentifierStart(int codePoint) 确定指定字符(Unicode 代码点)是否允许作为 Unicode 标识符中的第一个字符。当且仅当以下条件之一为真时,字符才可以开始 Unicode 标识符:
isLetter(codePoint)
返回true
getType(codePoint)
返回LETTER_NUMBER
。- 它是一个
Other_ID_Start
字符。
此方法符合 Unicode 标准的UAX31-R1:默认标识符要求,具有以下 UAX31 的配置文件:
Start := ID_Start + 'VERTICAL TILDE' (U+2E2F)
'VERTICAL TILDE'
添加到Start
以实现向后兼容性。- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果字符可以开始一个 Unicode 标识符;false
否则。- 自从:
- 1.5
- 参见:
-
isUnicodeIdentifierPart
public static boolean isUnicodeIdentifierPart(char ch) 确定指定字符是否可以作为第一个字符以外的 Unicode 标识符的一部分。当且仅当以下陈述之一为真时,字符才可能是 Unicode 标识符的一部分:
- 这是一封信
- 它是一个连接标点符号(例如
'_'
) - 这是一个数字
- 它是一个数字字母(例如罗马数字字符)
- 这是一个组合标记
- 它是一个非间距标记
isIdentifierIgnorable
为该字符返回true
。- 它是一个
Other_ID_Start
字符。 - 它是一个
Other_ID_Continue
字符。
此方法符合 Unicode 标准的UAX31-R1:默认标识符要求,具有以下 UAX31 的配置文件:
Continue := Start + ID_Continue + ignorable Medial := empty ignorable := isIdentifierIgnorable(char) returns true for the character
ignorable
添加到Continue
以实现向后兼容性。笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
isUnicodeIdentifierPart(int)
方法。- 参数:
ch
- 要测试的字符。- 返回:
true
如果字符可能是 Unicode 标识符的一部分;false
否则。- 自从:
- 1.1
- 参见:
-
isUnicodeIdentifierPart
public static boolean isUnicodeIdentifierPart(int codePoint) 确定指定字符(Unicode 代码点)是否可以作为第一个字符以外的 Unicode 标识符的一部分。当且仅当以下陈述之一为真时,字符才可能是 Unicode 标识符的一部分:
- 这是一封信
- 它是一个连接标点符号(例如
'_'
) - 这是一个数字
- 它是一个数字字母(例如罗马数字字符)
- 这是一个组合标记
- 它是一个非间距标记
isIdentifierIgnorable
为该字符返回true
。- 它是一个
Other_ID_Start
字符。 - 它是一个
Other_ID_Continue
字符。
此方法符合 Unicode 标准的UAX31-R1:默认标识符要求,具有以下 UAX31 的配置文件:
Continue := Start + ID_Continue + ignorable Medial := empty ignorable := isIdentifierIgnorable(int) returns true for the character
ignorable
添加到Continue
以实现向后兼容性。- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果字符可能是 Unicode 标识符的一部分;false
否则。- 自从:
- 1.5
- 参见:
-
isIdentifierIgnorable
public static boolean isIdentifierIgnorable(char ch) 确定指定字符是否应被视为 Java 标识符或 Unicode 标识符中的可忽略字符。以下 Unicode 字符在 Java 标识符或 Unicode 标识符中是可忽略的:
- 非空白的 ISO 控制字符
'\u0000'
到'\u0008'
'\u000E'
到'\u001B'
'\u007F'
到'\u009F'
- 所有具有
FORMAT
一般类别值的字符
笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
isIdentifierIgnorable(int)
方法。- 参数:
ch
- 要测试的字符。- 返回:
true
如果字符是可忽略的控制字符,可能是 Java 或 Unicode 标识符的一部分;false
否则。- 自从:
- 1.1
- 参见:
- 非空白的 ISO 控制字符
-
isIdentifierIgnorable
public static boolean isIdentifierIgnorable(int codePoint) 确定指定字符(Unicode 代码点)是否应被视为 Java 标识符或 Unicode 标识符中的可忽略字符。以下 Unicode 字符在 Java 标识符或 Unicode 标识符中是可忽略的:
- 非空白的 ISO 控制字符
'\u0000'
到'\u0008'
'\u000E'
到'\u001B'
'\u007F'
到'\u009F'
- 所有具有
FORMAT
一般类别值的字符
- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果字符是可忽略的控制字符,可能是 Java 或 Unicode 标识符的一部分;false
否则。- 自从:
- 1.5
- 参见:
- 非空白的 ISO 控制字符
-
toLowerCase
public static char toLowerCase(char ch) 使用 UnicodeData 文件中的大小写映射信息将字符参数转换为小写。请注意,
Character.isLowerCase(Character.toLowerCase(ch))
并不总是为某些字符范围返回true
,尤其是那些符号或表意文字。一般来说,
String.toLowerCase()
应该用于将字符映射为小写。String
案例映射方法比Character
案例映射方法有几个好处。String
大小写映射方法可以执行locale敏感映射、上下文敏感映射和 1:M 字符映射,而Character
大小写映射方法不能。笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
toLowerCase(int)
方法。- 参数:
ch
- 要转换的字符。- 返回:
- 字符的小写等效项(如果有);否则,角色本身。
- 参见:
-
toLowerCase
public static int toLowerCase(int codePoint) 使用 UnicodeData 文件中的大小写映射信息将字符(Unicode 代码点)参数转换为小写。请注意,
Character.isLowerCase(Character.toLowerCase(codePoint))
并不总是为某些字符范围返回true
,尤其是那些符号或表意文字。一般来说,
String.toLowerCase()
应该用于将字符映射为小写。String
案例映射方法比Character
案例映射方法有几个好处。String
大小写映射方法可以执行locale敏感映射、上下文敏感映射和 1:M 字符映射,而Character
大小写映射方法不能。- 参数:
codePoint
- 要转换的字符(Unicode 代码点)。- 返回:
- 字符的小写等价物(Unicode 代码点),如果有的话;否则,角色本身。
- 自从:
- 1.5
- 参见:
-
toUpperCase
public static char toUpperCase(char ch) 使用 UnicodeData 文件中的大小写映射信息将字符参数转换为大写。请注意,
Character.isUpperCase(Character.toUpperCase(ch))
并不总是为某些字符范围返回true
,尤其是那些符号或表意文字。一般来说,应该使用
String.toUpperCase()
将字符映射为大写。String
案例映射方法比Character
案例映射方法有几个好处。String
大小写映射方法可以执行locale敏感映射、上下文敏感映射和 1:M 字符映射,而Character
大小写映射方法不能。笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
toUpperCase(int)
方法。- 参数:
ch
- 要转换的字符。- 返回:
- 字符的大写等效项(如果有);否则,角色本身。
- 参见:
-
toUpperCase
public static int toUpperCase(int codePoint) 使用 UnicodeData 文件中的大小写映射信息将字符(Unicode 代码点)参数转换为大写。请注意,
Character.isUpperCase(Character.toUpperCase(codePoint))
并不总是为某些字符范围返回true
,尤其是那些符号或表意文字。一般来说,应该使用
String.toUpperCase()
将字符映射为大写。String
案例映射方法比Character
案例映射方法有几个好处。String
大小写映射方法可以执行locale敏感映射、上下文敏感映射和 1:M 字符映射,而Character
大小写映射方法不能。- 参数:
codePoint
- 要转换的字符(Unicode 代码点)。- 返回:
- 字符的大写等效项(如果有);否则,角色本身。
- 自从:
- 1.5
- 参见:
-
toTitleCase
public static char toTitleCase(char ch) 使用 UnicodeData 文件中的大小写映射信息将字符参数转换为标题大小写。如果一个字符没有明确的首字母大写映射并且根据 UnicodeData 本身不是首字母大写字符,则大写映射将作为等效的首字母大写映射返回。如果char
参数已经是标题大写char
,则将返回相同的char
值。请注意,对于某些字符范围,
Character.isTitleCase(Character.toTitleCase(ch))
并不总是返回true
。笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
toTitleCase(int)
方法。- 参数:
ch
- 要转换的字符。- 返回:
- 字符的首字母大写,如果有的话;否则,角色本身。
- 自从:
- 1.0.2
- 参见:
-
toTitleCase
public static int toTitleCase(int codePoint) 使用 UnicodeData 文件中的大小写映射信息将字符(Unicode 代码点)参数转换为 titlecase。如果一个字符没有明确的首字母大写映射并且根据 UnicodeData 本身不是首字母大写字符,则大写映射将作为等效的首字母大写映射返回。如果字符参数已经是首字母大写字符,则将返回相同的字符值。请注意,对于某些字符范围,
Character.isTitleCase(Character.toTitleCase(codePoint))
并不总是返回true
。- 参数:
codePoint
- 要转换的字符(Unicode 代码点)。- 返回:
- 字符的首字母大写,如果有的话;否则,角色本身。
- 自从:
- 1.5
- 参见:
-
digit
public static int digit(char ch, int radix) 返回指定基数中字符ch
的数值。如果基数不在
MIN_RADIX
≤radix
≤MAX_RADIX
范围内,或者如果ch
的值不是指定基数中的有效数字,则返回-1
。如果至少满足以下条件之一,则字符是有效数字:- 方法
isDigit
是字符的true
且字符的Unicode十进制数字值(或其单字符分解)小于指定的基数。在这种情况下,返回十进制数字值。 - 该字符是大写拉丁字母
'A'
到'Z'
之一,其代码小于radix + 'A' - 10
。在这种情况下,返回ch - 'A' + 10
。 - 该字符是小写拉丁字母
'a'
到'z'
之一,其代码小于radix + 'a' - 10
。在这种情况下,返回ch - 'a' + 10
。 - 该字符是全角大写拉丁字母 A (
'\uFF21'
) 到 Z ('\uFF3A'
) 之一,其代码小于radix + '\uFF21' - 10
。在这种情况下,返回ch - '\uFF21' + 10
。 - 该字符是全角小写拉丁字母 a (
'\uFF41'
) 到 z ('\uFF5A'
) 之一,其代码小于radix + '\uFF41' - 10
。在这种情况下,返回ch - '\uFF41' + 10
。
笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
digit(int, int)
方法。- 参数:
ch
- 要转换的字符。radix
- 基数。- 返回:
- 由指定基数中的字符表示的数值。
- 参见:
- 方法
-
digit
public static int digit(int codePoint, int radix) 返回指定基数中指定字符(Unicode 代码点)的数值。如果基数不在
MIN_RADIX
≤radix
≤MAX_RADIX
范围内,或者如果字符不是指定基数中的有效数字,则返回-1
。如果至少满足以下条件之一,则字符是有效数字:- 方法
isDigit(codePoint)
是字符的true
且字符的Unicode十进制数字值(或其单字符分解)小于指定的基数。在这种情况下,返回十进制数字值。 - 该字符是大写拉丁字母
'A'
到'Z'
之一,其代码小于radix + 'A' - 10
。在这种情况下,返回codePoint - 'A' + 10
。 - 该字符是小写拉丁字母
'a'
到'z'
之一,其代码小于radix + 'a' - 10
。在这种情况下,返回codePoint - 'a' + 10
。 - 该字符是全角大写拉丁字母 A (
'\uFF21'
) 到 Z ('\uFF3A'
) 之一,其代码小于radix + '\uFF21' - 10
。在这种情况下,返回codePoint - '\uFF21' + 10
。 - 该字符是全角小写拉丁字母 a (
'\uFF41'
) 到 z ('\uFF5A'
) 之一,其代码小于radix + '\uFF41'- 10
。在这种情况下,返回codePoint - '\uFF41' + 10
。
- 参数:
codePoint
- 要转换的字符(Unicode 代码点)。radix
- 基数。- 返回:
- 由指定基数中的字符表示的数值。
- 自从:
- 1.5
- 参见:
- 方法
-
getNumericValue
public static int getNumericValue(char ch) 返回指定 Unicode 字符表示的int
值。例如,字符'\u216C'
(罗马数字五十)将返回一个值为 50 的整数。大写字母 AZ(
'\u0041'
到'\u005A'
)、小写字母('\u0061'
到'\u007A'
)和全角变体('\uFF21'
到'\uFF3A'
和'\uFF41'
到'\uFF5A'
)形式的数值从 10 到 35。这与 Uni 无关代码规范,其中不会为这些char
值分配数值。如果字符没有数值,则返回 -1。如果字符具有不能表示为非负整数的数值(例如,分数值),则返回 -2。
笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
getNumericValue(int)
方法。- 参数:
ch
- 要转换的字符。- 返回:
-
字符的数值,作为非负
int
值; -2 如果字符具有数值但该值不能表示为非负int
值; -1 如果字符没有数值。 - 自从:
- 1.1
- 参见:
-
getNumericValue
public static int getNumericValue(int codePoint) 返回指定字符(Unicode 代码点)代表的int
值。例如,字符'\u216C'
(罗马数字五十)将返回值为 50 的int
。大写字母 AZ(
'\u0041'
到'\u005A'
)、小写字母('\u0061'
到'\u007A'
)和全角变体('\uFF21'
到'\uFF3A'
和'\uFF41'
到'\uFF5A'
)形式的数值从 10 到 35。这与 Uni 无关代码规范,其中不会为这些char
值分配数值。如果字符没有数值,则返回 -1。如果字符具有不能表示为非负整数的数值(例如,分数值),则返回 -2。
- 参数:
codePoint
- 要转换的字符(Unicode 代码点)。- 返回:
-
字符的数值,作为非负
int
值; -2 如果字符具有数值但该值不能表示为非负int
值; -1 如果字符没有数值。 - 自从:
- 1.5
- 参见:
-
isSpace
已弃用。替换为 isWhitespace(char)。确定指定字符是否为 ISO-LATIN-1 空格。此方法仅为以下五个字符返回true
:Character 代码 Name '\t'
U+0009
HORIZONTAL TABULATION
'\n'
U+000A
NEW LINE
'\f'
U+000C
FORM FEED
'\r'
U+000D
CARRIAGE RETURN
' '
U+0020
SPACE
- 参数:
ch
- 要测试的字符。- 返回:
true
如果字符是 ISO-LATIN-1 空格;false
否则。- 参见:
-
isSpaceChar
public static boolean isSpaceChar(char ch) 确定指定字符是否为 Unicode 空格字符。当且仅当一个字符被 Unicode 标准指定为空格字符时,该字符才被视为空格字符。如果角色的一般类别类型是以下任何一种,则此方法返回 true:SPACE_SEPARATOR
LINE_SEPARATOR
PARAGRAPH_SEPARATOR
笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
isSpaceChar(int)
方法。- 参数:
ch
- 要测试的字符。- 返回:
true
如果字符是空格字符;false
否则。- 自从:
- 1.1
- 参见:
-
isSpaceChar
public static boolean isSpaceChar(int codePoint) 确定指定字符(Unicode 代码点)是否为 Unicode 空格字符。当且仅当一个字符被 Unicode 标准指定为空格字符时,该字符才被视为空格字符。如果角色的一般类别类型是以下任何一种,则此方法返回 true:- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果字符是空格字符;false
否则。- 自从:
- 1.5
- 参见:
-
isWhitespace
public static boolean isWhitespace(char ch) 根据 Java 确定指定字符是否为空格。当且仅当一个字符满足以下条件之一时,它才是 Java 空白字符:- 它是 Unicode 空格字符(
SPACE_SEPARATOR
、LINE_SEPARATOR
或PARAGRAPH_SEPARATOR
),但也不是不间断空格('\u00A0'
、'\u2007'
、'\u202F'
)。 - 它是
'\t'
,U+0009 水平制表。 - 它是
'\n'
,U+000A 换行。 - 它是
'\u000B'
,U+000B 垂直制表。 - 它是
'\f'
,U+000C FORM FEED。 - 它是
'\r'
,U+000D 回车。 - 它是
'\u001C'
,U+001C 文件分隔符。 - 它是
'\u001D'
,U+001D 组分隔符。 - 它是
'\u001E'
,U+001E 记录分隔符。 - 它是
'\u001F'
,U+001F 单位分隔符。
笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
isWhitespace(int)
方法。- 参数:
ch
- 要测试的字符。- 返回:
true
如果字符是 Java 空白字符;false
否则。- 自从:
- 1.1
- 参见:
- 它是 Unicode 空格字符(
-
isWhitespace
public static boolean isWhitespace(int codePoint) 根据 Java 确定指定字符(Unicode 代码点)是否为空白。当且仅当一个字符满足以下条件之一时,它才是 Java 空白字符:- 它是 Unicode 空格字符(
SPACE_SEPARATOR
、LINE_SEPARATOR
或PARAGRAPH_SEPARATOR
),但也不是不间断空格('\u00A0'
、'\u2007'
、'\u202F'
)。 - 它是
'\t'
,U+0009 水平制表。 - 它是
'\n'
,U+000A 换行。 - 它是
'\u000B'
,U+000B 垂直制表。 - 它是
'\f'
,U+000C FORM FEED。 - 它是
'\r'
,U+000D 回车。 - 它是
'\u001C'
,U+001C 文件分隔符。 - 它是
'\u001D'
,U+001D 组分隔符。 - 它是
'\u001E'
,U+001E 记录分隔符。 - 它是
'\u001F'
,U+001F 单位分隔符。
- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果字符是 Java 空白字符;false
否则。- 自从:
- 1.5
- 参见:
- 它是 Unicode 空格字符(
-
isISOControl
public static boolean isISOControl(char ch) 确定指定字符是否为 ISO 控制字符。如果一个字符的代码在'\u0000'
到'\u001F'
范围内或在'\u007F'
到'\u009F'
范围内,则该字符被认为是 ISO 控制字符。笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
isISOControl(int)
方法。- 参数:
ch
- 要测试的字符。- 返回:
true
如果字符是 ISO 控制字符;false
否则。- 自从:
- 1.1
- 参见:
-
isISOControl
public static boolean isISOControl(int codePoint) 确定引用的字符(Unicode 代码点)是否为 ISO 控制字符。如果一个字符的代码在'\u0000'
到'\u001F'
范围内或在'\u007F'
到'\u009F'
范围内,则该字符被认为是 ISO 控制字符。- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果字符是 ISO 控制字符;false
否则。- 自从:
- 1.5
- 参见:
-
getType
public static int getType(char ch) 返回一个值,指示字符的一般类别。笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
getType(int)
方法。- 参数:
ch
- 要测试的字符。- 返回:
int
类型的值表示角色的一般类别。- 自从:
- 1.1
- 参见:
-
getType
public static int getType(int codePoint) 返回一个值,指示字符的一般类别。- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
int
类型的值表示角色的一般类别。- 自从:
- 1.5
- 参见:
-
forDigit
public static char forDigit(int digit, int radix) 确定指定基数中特定数字的字符表示形式。如果radix
的值不是有效基数,或者digit
的值不是指定基数中的有效数字,则返回空字符 ('\u0000'
)。radix
参数如果大于或等于MIN_RADIX
且小于或等于MAX_RADIX
则有效。digit
参数在0 <= digit < radix
时有效。如果数字小于 10,则返回
'0' + digit
。否则,返回值'a' + digit - 10
。- 参数:
digit
- 要转换为字符的数字。radix
- 基数。- 返回:
-
指定基数中指定数字的
char
表示。 - 参见:
-
getDirectionality
public static byte getDirectionality(char ch) 返回给定字符的 Unicode 方向性属性。字符方向性用于计算文本的视觉顺序。未定义的char
值的方向性值为DIRECTIONALITY_UNDEFINED
。笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
getDirectionality(int)
方法。- 参数:
ch
-char
请求方向性属性。- 返回:
char
值的方向性属性。- 自从:
- 1.4
- 参见:
-
getDirectionality
public static byte getDirectionality(int codePoint) 返回给定字符(Unicode 代码点)的 Unicode 方向性属性。字符方向性用于计算文本的视觉顺序。未定义字符的方向性值为DIRECTIONALITY_UNDEFINED
。- 参数:
codePoint
- 请求方向性属性的字符(Unicode 代码点)。- 返回:
- 角色的方向性属性。
- 自从:
- 1.5
- 参见:
-
isMirrored
public static boolean isMirrored(char ch) 确定字符是否根据 Unicode 规范进行镜像。当在从右到左的文本中显示时,镜像字符的字形应该水平镜像。例如,'\u0028'
LEFT PARENTHESIS 在语义上定义为左括号.这将在从左到右的文本中显示为“(”,而在从右到左的文本中显示为“)”。笔记:此方法无法处理 补充字符 。要支持所有 Unicode 字符,包括增补字符,请使用
isMirrored(int)
方法。- 参数:
-
请求镜像属性的
ch
-char
- 返回:
true
如果 char 已镜像,false
如果char
未镜像或未定义。- 自从:
- 1.4
-
isMirrored
public static boolean isMirrored(int codePoint) 确定指定字符(Unicode 代码点)是否根据 Unicode 规范进行镜像。当在从右到左的文本中显示时,镜像字符的字形应该水平镜像。例如,'\u0028'
LEFT PARENTHESIS 在语义上定义为左括号.这将在从左到右的文本中显示为“(”,而在从右到左的文本中显示为“)”。- 参数:
codePoint
- 要测试的字符(Unicode 代码点)。- 返回:
true
如果字符被镜像,false
如果字符未被镜像或未定义。- 自从:
- 1.5
-
compareTo
比较两个Character
对象的数值。- 指定者:
compareTo
在接口Comparable<Character>
中- 参数:
anotherCharacter
- 要比较的Character
。- 返回:
-
值
0
如果参数Character
等于这个Character
;如果此Character
在数值上小于Character
参数,则该值小于0
;如果此Character
在数值上大于Character
参数(无符号比较),则该值大于0
。请注意,这只是一个数值比较;它不依赖于locale。 - 自从:
- 1.2
-
compare
public static int compare(char x, char y) 以数字方式比较两个char
值。返回的值与将返回的值相同:Character.valueOf(x).compareTo(Character.valueOf(y))
- 参数:
x
- 第一个要比较的char
y
- 要比较的第二个char
- 返回:
-
值
0
如果x == y
;如果x < y
小于0
的值;如果x > y
,则值大于0
- 自从:
- 1.7
-
reverseBytes
public static char reverseBytes(char ch) 返回通过反转指定的char
值中的字节顺序获得的值。- 参数:
ch
- 要反转字节顺序的char
。- 返回:
-
通过反转(或等效地交换)指定
char
值中的字节获得的值。 - 自从:
- 1.5
-
getName
返回指定字符的名称codePoint
,如果代码点为unassigned
则返回 null。如果指定的字符没有被分配一个名称UnicodeData文件(Unicode 联盟维护的 Unicode 字符数据库的一部分),返回的名称与表达式的结果相同:
对于Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);
codePoint
中的UnicodeData文件,此方法返回的名称遵循 Unicode 标准的“Unicode 名称属性”部分中的命名方案。对于其他代码点,例如 Hangul/Ideographs,上述名称生成规则与 Unicode 标准中定义的规则不同。- 参数:
codePoint
- 字符(Unicode 代码点)- 返回:
- 指定字符的名称,如果未分配代码点,则为 null。
- 抛出:
IllegalArgumentException
- 如果指定的codePoint
不是有效的 Unicode 代码点。- 自从:
- 1.7
-
codePointOf
返回给定字符名称指定的 Unicode 字符的代码点值。如果一个角色没有被指定一个名字UnicodeData文件(由 Unicode 联盟维护的 Unicode 字符数据库的一部分),其名称定义为表达式的结果:
Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);
name
匹配不区分大小写,删除了任何前导和尾随空白字符。对于中的代码点UnicodeData文件,此方法识别符合 Unicode 标准中“Unicode 名称属性”部分中定义的名称的名称。对于其他代码点,此方法识别使用getName(int)
方法生成的名称。- 参数:
name
- 角色名称- 返回:
- 由其名称指定的字符的代码点值。
- 抛出:
IllegalArgumentException
- 如果指定的name
不是有效的字符名称。NullPointerException
- 如果name
是null
- 自从:
- 9
-