建立索引以获得最快的读取响应的最佳方法是什么?

时间:2020-03-05 18:54:51  来源:igfitidea点击:

我需要索引最多500,000个条目才能最快读取。索引需要定期在磁盘上重建。我试图在一个简单的文件(如磁盘上的哈希值)或者嵌入式数据库中的单个表之间做出选择。我不需要RDBMS引擎。

解决方案

回答

这就是MapReduce的发明目的。 Hadoop是一个很棒的Java实现。

回答

我假设我们要引用关系DBMS(例如mySql,Oracle或者Postgres)上的索引表。

索引是辅助数据存储,以特定顺序记录表的字段子集。

如果创建索引,则任何包含在其WHERE子句中索引的字段子集的查询都将执行得更快。

但是,添加索引会降低INSERT性能。

通常,除非索引被破坏,否则不需要重建。它们应该由DBMS随时维护。

回答

如果不需要完全更新数据,我们可能还想考虑将数据仓库工具用于OLAP(例如MSOLAP)。可以根据预先计算的数据执行闪电般的快速只读查询。

回答

也许是BDB?这是很高的表现。不使用DBMS的数据库。

回答

如果我们通过键存储状态对象,那么Berkeley DB怎么样。

回答

cdb,如果数据不变。

/艾伦

回答

PyTables Pro声称"对于不需要快速更新或者删除的情况,OPSI可能是可用的最佳索引引擎之一"。但是我还没有亲自使用它,但是PyTables的F / OSS版本已经为我们提供了良好的性能:

http://www.pytables.org/moin/PyTablesPro