postgresql Postgres 的 ETL 选项

声明:本页面是StackOverFlow热门问题的中英对照翻译,遵循CC BY-SA 4.0协议,如果您需要使用它,必须同样遵循CC BY-SA许可,注明原文地址和作者信息,同时你必须将它归于原作者(不是我):StackOverFlow 原文地址: http://stackoverflow.com/questions/4597387/
Warning: these are provided under cc-by-sa 4.0 license. You are free to use/share it, But you must attribute it to the original authors (not me): StackOverFlow

提示:将鼠标放在中文语句上可以显示对应的英文。显示中英文
时间:2020-09-20 00:28:37  来源:igfitidea点击:

ETL options with Postgres

postgresqldata-warehouseetl

提问by Mr Shoubs

Currently we warehouse our postgres db using SSIS, but there are certain things we can't do, for example with an ADO.Net provider it isn't possible to use parameters in a data source of the data flow component, we're trying out an OLEDB provider PGNP which looks like it does what we require.

目前我们使用 SSIS 存储我们的 postgres 数据库,但有些事情我们不能做,例如使用 ADO.Net 提供程序不可能在数据流组件的数据源中使用参数,我们正在尝试出一个 OLEDB 提供者 PGNP,它看起来像我们需要的那样。

I'd like to know what other options are available and your opinions of them. I've used open talend, but the performance wasn't that good compared to SSIS.

我想知道还有哪些其他选择以及您对它们的看法。我使用过 open talend,但与 SSIS 相比,性能并不好。

采纳答案by filiprem

You can try Pentaho Data Integration (PDI, formerly, kettle).

您可以尝试 Pentaho Data Integration(PDI,以前称为 Kettle)。

Community Edition is free.

社区版是免费的。

It has a GUI similar to SSIS, easy to use after a short introduction.

它有一个类似于 SSIS 的 GUI,简单介绍后易于使用。

It is a Java application, and it uses original, native postgresql JDBC driver - performance should be at least comparable to SSIS.

它是一个 Java 应用程序,它使用原始的、原生的 postgresql JDBC 驱动程序 - 性能至少应该与 SSIS 相当。

PDI CE download: http://sourceforge.net/projects/pentaho/files/

PDI CE 下载:http: //sourceforge.net/projects/pentaho/files/

回答by Mr Shoubs

We ended up using CloverETL. Does what it says on the tin:

我们最终使用了CloverETL。它在锡上说了什么:

CloverETL? is data integration platform scaling from open source desktop to a commercial cloud cluster. It's a Java-based open platform that helps design, automate, and monitor data integration processes.

三叶草ETL?是从开源桌面扩展到商业云集群的数据集成平台。它是一个基于 Java 的开放平台,可帮助设计、自动化和监控数据集成过程。