文件系统管理工具
寻找有关文件系统管理工具的建议。我们有数TB的图像,pdf,excel表格等。
我们正在寻找一种可以帮助我们管理,存档等图像的软件。
我们没有将所有文件信息存储在数据库中,但是有些存储在数据库中,我们希望找到一个可以帮助我们将存档过程集成到数据库中的应用程序。
谢谢!
解决方案
如果某些数据保存在磁盘上,则搜索应用程序可能更合适。我们可以使用Google,Microsoft搜索或者类似程序。
某些数据库产品(例如Oracle)提供了类似于文件系统的存储,我们可以将文件放入其中。由于它是一个Oracle管理的文件系统,因此具有所有Oracle备份和管理工具。由于它是一个文件系统,因此我们只需使用普通的OS工具(如cp
)即可将文件移入或者移出文件。
最佳实践是避免将RDBMS浪费在RDMBS无法使用的大型BLOBS数据上。使用数据库来处理它的名称,日期和内容。实际的图像文件或者电子表格文件可以保留在普通文件系统世界中。如果执行此操作,则不会花费很多精力或者复杂性-我们只是在文件中收集基本信息。
我们不会重复存储(电子表格只是普通文件)。我们不要在数据库中放置数据库无法处理的大对象。
文件系统比数据库更快,更简单且更可靠。随时使用它进行批量存储。该数据库具有出色的搜索功能。仅使用数据库即可。
我一直在贸易杂志上见过这些家伙。 http://www.dtsearch.com/我相信他们甚至早在Google之前就已经存在了。不知道这是我们要找的东西。
为了澄清,我想我应该说所有文件都在文件服务器上,但是在数据库中有对它们的引用(上传日志等),因此我们只是希望也许有一些工具可以让我们对其进行设置,以便它将文件归档在某个目录中,它可以运行某种sql命令,以便更新数据库以知道该文件已归档。
但感谢信息。我认为在这种情况下,我们将不得不自己动手做。
我们可以定期运行作业以列出已添加到文件系统中的文件
自上次运行作业以来。在Windows上,此批处理文件将列出所有文件和文件夹
在" archivedirectory"中,以便我们可以将列表与上次运行时间进行比较。
cd archivedirectory del oldlist.txt rename newlist.txt oldlist.txt dir /s /b > newlist.txt
如果在Windows上安装diffutils,则可以使用标准的diff工具列出新文件。
隔离新文件:
diff oldlist.txt newlist.txt > newfiles.txt
现在," newfiles.txt"中以">"开头的任何行都应为我们提供新文件。
(我们可以使用grep
和sed
进一步缩小它。Windows版本可以从gnuwin32获得)
现在,我们应该可以对该文件运行进一步的操作了,也许可以使用某些语言,例如Python,Cor Java,
向数据库添加信息。