从Office 2007复制并粘贴到
时间:2020-03-06 14:45:12 来源:igfitidea点击:
我想将Office 2007文档(docx)中的文本复制并粘贴到textarea中。在使用Firefox 3的Window上,该字段中还添加了其他的jiberish:
...Normal 0 false false false EN-US X-NONE X-NONE MicrosoftInternetExplorer4 Normal 0 false false false EN-US X-NONE X-NONE MicrosoftInternetExplorer4 Normal 0 false false false EN-US X-NONE X-NONE MicrosoftInternetExplorer4 <!--[if gte mso 9]>...
似乎是来自较新文档结构的样式信息和条件注释。关于如何解析或者防止这种情况的任何想法?可能是正面的Javascript或者背面的Java。
解决方案
我发现消除这种随机干扰的最简单方法是复制所需的文本,将其粘贴到记事本或者类似的明文编辑器中,从记事本复制它,然后将其粘贴到字段中。
同样,通过一个脚本或者应用程序来运行它,该脚本或者应用程序会剔除"智能"引号和破折号,这也不是一个坏主意。
有第三方工具可以消除错误的" Microsoft蠕虫"内容。我们甚至可以在服务器上注册一些代码,然后在自己的代码中使用它们("清理垃圾"按钮是谁吗?)
与林肯的想法类似,我们可以使用PureText来自动执行该过程。基本上,我们按其热键而不是Ctrl + V(我将其设置为Win + V),然后将其粘贴到剪贴板上的纯文本版本。我不确定是否会删除Office添加的额外数据,但是值得尝试。