java Word 文档文件到 JSON
声明:本页面是StackOverFlow热门问题的中英对照翻译,遵循CC BY-SA 4.0协议,如果您需要使用它,必须同样遵循CC BY-SA许可,注明原文地址和作者信息,同时你必须将它归于原作者(不是我):StackOverFlow
原文地址: http://stackoverflow.com/questions/26655741/
Warning: these are provided under cc-by-sa 4.0 license. You are free to use/share it, But you must attribute it to the original authors (not me):
StackOverFlow
Word Doc File to JSON
提问by Rohan K
I will be parsing and converting a document in ms word format to JSON (or by via an XML finally to JSON). How such parsing and conversion will take care of image embeded in word doc. how this images can be represented in json format. Any pointers or demo example.
我将解析 ms word 格式的文档并将其转换为 JSON(或最终通过 XML 转换为 JSON)。这种解析和转换将如何处理嵌入在 word doc 中的图像。如何以 json 格式表示这些图像。任何指针或演示示例。
I am thinking of using apache poi as parser and customised java class for json string builder.
我正在考虑使用 apache poi 作为解析器和 json 字符串构建器的自定义 java 类。
Is there any readily available tool for such parsing and conversion.
是否有任何现成的工具可用于此类解析和转换。
采纳答案by Tomasz Godziński
Try to convert MS Document to Base64 (sequence of ASCII characters) and send it as a String via JSON or XML. Then you can decode it, the document should be the same (with embedded images).
尝试将 MS 文档转换为 Base64(ASCII 字符序列)并通过 JSON 或 XML 将其作为字符串发送。然后你可以解码它,文档应该是一样的(带有嵌入的图像)。
回答by Prashant Pandey
Just .zip the word file, a .docx file is nothing but a collection of xml. You'll find xml files after you open your .zip file. Then convert your xml file into json via google feed API.
只需.zip word 文件,.docx 文件只不过是xml 的集合。打开 .zip 文件后,您将找到 xml 文件。然后通过谷歌提要 API 将您的 xml 文件转换为 json。