使用JPA / Toplink批量插入-IGI

时间：2020-03-05 18:53:59 　来源:igfitidea点击:

我有一个通过HTTP接口接收消息的Web应用程序，例如：

http://server/application?source=123&destination=234&text=hello

该请求包含发件人的ID，收件人的ID和消息的文本。

此消息应按以下方式处理：

从数据库中查找源和目标都匹配的User对象
创建对象树：一条消息，其中包含消息文本的字段以及两个用于源和目标的用户对象
将这棵树持久保存到数据库中。

该树将由我无法触摸的其他应用程序加载。

我将Oracle用作后备数据库，将JPA与Toplink一起用于数据库处理任务。如果可能的话，我会留下来。

没有太多的优化，我就可以在我的环境中实现约30个请求/秒的吞吐量。数量不多，我需要约300个请求/秒。因此，我测量了性能瓶颈所在的位置，发现对em.persist()的调用花费了大部分时间。如果我简单地注释掉那条线，吞吐量将超过1000个请求/秒。

我试图编写一个小型测试应用程序，该应用程序使用简单的JDBC调用将一百万条消息持久保存到同一数据库中。我使用了批处理，这意味着我先进行了100次插入，然后进行了一次提交，然后重复进行直到所有记录都在数据库中为止。在这种情况下，我测量了〜500个请求/秒的吞吐量，这可以满足我的需求。

显然，我需要在此处优化插入性能。但是，正如我前面提到的，我想为此继续使用JPA和Toplink，而不是纯JDBC。

我们知道使用JPA和Toplink创建批量插入的方法吗？我们可以推荐其他任何方法来提高JPA持久性吗？

添加信息：

"请求/秒"在这里是指：请求总数/从测试开始到写入数据库的最后一条记录的总时间。

我试图通过在servlet内容和持久性之间创建一个内存中队列来使对em.persist()的调用异步。它极大地提高了性能。但是，队列的确增长很快，并且由于应用程序将连续不断地接收〜200个请求/秒，这对我来说不是一个可以接受的解决方案。

在这种分离的方法中，我在提交事务之前收集了所有100毫秒的请求，并在所有收集的项目上调用了em.persist()。 EntityManagerFactory缓存在每个事务之间。

解决方案

回答

我们对"请求/秒"的度量是多少？换句话说，对于第31个请求会发生什么？哪些资源被阻止？如果它是前端/ servlet / Web部分，我们可以在另一个线程中运行em.persist()并立即返回吗？

另外，我们是否每次都在创建交易？我们是否在每个请求中都创建EntityManagerFactory对象？

回答

我们应该与JPA接口分离，并使用裸露的TopLink API。我们可能可以将要持久保存的对象插入到UnitOfWork中，并按计划(同步或者异步)提交UnitOfWork。注意，em.persist()的代价之一是整个对象图的隐式克隆。如果我们自己uow.registerObject()两个用户对象，则TopLink会更好地工作，并保存自身必须进行的身份测试。因此，我们将得到：

uow=sess.acquireUnitOfWork();
for (job in batch) {
 thingyCl=uow.registerObject(new Thingy());
 user1Cl=uow.registerObject(user1);
 user2Cl=uow.registerObject(user2);
 thingyCl.setUsers(user1Cl,user2Cl);
}
uow.commit();

这是一所非常老派的TopLink btw;)

请注意，批处理将有很大帮助，因为批处理写入，尤其是带有参数绑定的批处理写入将开始工作，对于这个简单的示例，批处理可能会对性能产生很大影响。

其他要寻找的东西：测序大小。实际上，花费大量时间在TopLink中编写对象实际上是从数据库中读取序列信息，尤其是对于较小的默认值(我的序列大小可能有数百甚至更多)。

使用JPA / Toplink批量插入

解决方案

回答

回答

相关推荐

最近更新

标签

使用JPA / Toplink批量插入

解决方案

回答

回答

相关推荐

GtkWidget.events属性用于(如)GtkTreeView小部件的目的是什么？

如何在Windows的Perl中创建图形？

我们从混淆程序中获得的exe速度是否有所不同？

母版页中的路径

相关推荐

最近更新

标签