使用JBoss Richfaces从PDF提取文本
时间:2020-03-05 18:55:33 来源:igfitidea点击:
我正在尝试编写一个网络应用程序来管理我的博士学位论文的参考资料。
我曾经在个人Confluence(出色的工具!http://www.atlassian.com/software/confluence/)实例中管理此信息,但是我对PDF的打开以及将值剪切和粘贴到我想记录一下。
我已经公开了一个Web服务,它将根据PDF文件名和页码返回图像。相同的Web服务还公开了一种方法,该方法将在提供的矩形(左上角x-y坐标,右下角x-y坐标)内返回文本。
我希望能够在PDF图像的一部分上拖动一个矩形,然后调用Web服务给我文本(然后将其存储在EntityBean上)。我正在使用JBoss应用程序堆栈(Application Server,Hibernate,Seam和Richfaces)。有人知道我将如何实现这一目标吗?我已经看到了在其他RIA工具箱(例如dojo)中绘制自定义图像的能力,但是我看不到在Richfaces中执行此操作的方法。
希望有人可以证明我是错的,或者提供一些有关我可以做什么的想法(因为我不是Web开发人员,所以我主要在构建此工具,因为现在可用的RIA框架引起了我的兴趣!)
我已经有了提取文本的代码,我的问题纯粹是如何让用户在网络浏览器内的图像上方绘制"选择矩形"?
非常感谢,
艾多斯
解决方案
回答
尝试使用RichFaces Paint 2D标签
它将Graphics2D包公开给用户界面。
使用javascript跟踪用户在图像上的拖动事件,然后将坐标发布到支持bean,以在选择框上绘制图形以重新呈现图像。
回答
我们考虑过门德利吗?它将尝试从pdf中解析和提取书目信息。
回答
我们可以使用itext(http://www.lowagie.com/iText/)