java 在java中检测汉字

Question

提问by Ran Deloun

Using Java how to detect if a String contains Chinese characters?

使用Java如何检测一个字符串是否包含汉字？

    String chineseStr = "已下架" ;

if (isChineseString(chineseStr)) {
  System.out.println("The string contains Chinese characters");
}else{
  System.out.println("The string contains Chinese characters");
}

Can you please help me to solve the problem?

你能帮我解决这个问题吗？

Answer 1

回答by Joop Eggen

Now Character.isIdeographic(int codepoint)would tell wether the codepoint is a CJKV (Chinese, Japanese, Korean and Vietnamese) ideograph.

现在Character.isIdeographic(int codepoint)可以判断代码点是否是 CJKV（中文、日文、韩文和越南文）表意文字。

Nearer is using Character.UnicodeScript.HAN.

Nearer 正在使用 Character.UnicodeScript.HAN。

So:

所以：

System.out.println(containsHanScript("xxx已下架xxx"));

public static boolean containsHanScript(String s) {
    for (int i = 0; i < s.length(); ) {
        int codepoint = s.codePointAt(i);
        i += Character.charCount(codepoint);
        if (Character.UnicodeScript.of(codepoint) == Character.UnicodeScript.HAN) {
            return true;
        }
    }
    return false;
}

Or in java 8:

或者在 Java 8 中：

public static boolean containsHanScript(String s) {
    return s.codePoints().anyMatch(
            codepoint ->
            Character.UnicodeScript.of(codepoint) == Character.UnicodeScript.HAN);
}

Answer 2

回答by Ruchira Gayan Ranaweera

You can try with Google APIor Language Detection API

您可以尝试使用 Google API或语言检测 API

Language Detection API contains simple demo. You can try it first.

语言检测 API 包含简单的演示。你可以先试试。

Answer 3

回答by ccpizza

A more literal approach:

更直接的方法：

if ("粽子".matches("[\u4E00-\u9FA5]+")) {
    System.out.println("is Chinese");
}

If you also need to catch rarely used and exotic characters then you'll need to add all the ranges: What's the complete range for Chinese characters in Unicode?

如果您还需要捕获很少使用的和异国情调的字符，那么您需要添加所有范围：Unicode 中汉字的完整范围是多少？

java 在java中检测汉字

提问by Ran Deloun

回答by Joop Eggen

回答by Ruchira Gayan Ranaweera

回答by ccpizza

相关推荐

最近更新

标签

java 在java中检测汉字

提问by Ran Deloun

回答by Joop Eggen

回答by Ruchira Gayan Ranaweera

回答by ccpizza

相关推荐

java 在 Web 上运行 Apache Spark 作业后如何获取输出

java 交换字符串中的两个字母

如何使用 Java 将整数拆分为数组？

java 如何模拟在方法内部创建的对象？

相关推荐

最近更新

标签