java 为什么我的 DOM 解析器无法读取 UTF-8

Question

提问by ivanz

I have problem that my DOM parser can′t load file when there are UTF-8 characters in XML file Now, i am aware that i have to give him instruction to read utf-8, but i don′t know how to put it in my code here it is:

我遇到的问题是我的 DOM 解析器在 XML 文件中有 UTF-8 字符时无法加载文件现在，我知道我必须给他阅读 utf-8 的指令，但我不知道如何放置在我的代码中，它是：

File xmlFile = new File(fileName);
DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
Document doc = dBuilder.parse(xmlFile);
doc.getDocumentElement().normalize();

i am aware that there is method setencoding(), but i don′t know where to put it in my code...

我知道有 setencoding() 方法，但我不知道把它放在我的代码中的什么地方...

Answer 1

回答by Rajesh Mbm

Try this. Worked for me

试试这个。对我来说有效

        InputStream inputStream= new FileInputStream(completeFileName);
        Reader reader = new InputStreamReader(inputStream,"UTF-8");
        InputSource is = new InputSource(reader);
        is.setEncoding("UTF-8");

        DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
        DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
        Document doc = dBuilder.parse(is);

Answer 2

回答by Eugene

Try to use Reader and provide encoding as parameter:

尝试使用 Reader 并提供编码作为参数：

InputStream inputStream = new FileInputStream(fileName);
documentBuilder.parse(new InputSource(new InputStreamReader(inputStream, "UTF-8")));

Answer 3

回答by john-salib

I used what Eugene did up there and changed it a little.

我使用了 Eugene 在那里所做的并稍微改变了它。

DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();

FileInputStream in = new FileInputStream(new File("XML.xml"));
Document doc = dBuilder.parse(in, "UTF-8");

though this will be read as UTF-8if you are printing in eclipse console it won't show any 'UTF-8' characters unless the java file is saved as 'UTF-8', or at least that what happened with me

尽管这将被视为UTF-8在 Eclipse 控制台中打印，但它不会显示任何“UTF-8”字符，除非将 java 文件另存为“UTF-8”，或者至少是我发生的情况

java 为什么我的 DOM 解析器无法读取 UTF-8

提问by ivanz

回答by Rajesh Mbm

回答by Eugene

回答by john-salib

相关推荐

最近更新

标签

java 为什么我的 DOM 解析器无法读取 UTF-8

提问by ivanz

回答by Rajesh Mbm

回答by Eugene

回答by john-salib

相关推荐

在 Servlet 中使用 org.json 会导致 java.lang.ClassNotFoundException: org.json.JSONException

java 如何从不同文件夹中的包导入类？

java 如何从JAVA中的二维数组获取二维子数组？

java 当我需要一个字符串时，R.string.XXX 从strings.xml 返回一个int

相关推荐

最近更新

标签