为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。 【DM版本】:dm8 【操作系统】:kylinv10 【CPU】:x86 【问题描述】*:我在一个单机DM上,插入数据后,我用dexp对整个库进行导出dmp文件,然后用命令获取MD5值,我发现如果插入的数据比较少,那么前后导出的dmp文件的md5值可能会有2个值左右,但如果插入数据多的话,则会有无数个MD5值?下面的test.txt是我当时测得一些数据,我想问一下这个MD5值变化是因为DM什么机制导致的,有没有办法避免
test.txt
分析 使用md5校验数据库多次导出文件的方式来衡量导出的数据是否一致的做法是有问题的,不严谨,不推荐;这个方法比较合适的使用场景是从A机器传输到B机器后进行文件完整性验证。
原因
总体上,您的验证结果完全可以解释,尤其是原因2:数据量很少时实际并发线程是1(没有并发)所以多次导出写入文件md5验证一致,一旦数据超过一定数量md5变数越多是因为并发线程写入的顺序(不可控)影响;它和数据本身是否有序也没有关系(比如聚集索引组织表),只要保证重新导入的时候按原存储结构存储即可。
分析
使用md5校验数据库多次导出文件的方式来衡量导出的数据是否一致的做法是有问题的,不严谨,不推荐;这个方法比较合适的使用场景是从A机器传输到B机器后进行文件完整性验证。
原因
总体上,您的验证结果完全可以解释,尤其是原因2:数据量很少时实际并发线程是1(没有并发)所以多次导出写入文件md5验证一致,一旦数据超过一定数量md5变数越多是因为并发线程写入的顺序(不可控)影响;它和数据本身是否有序也没有关系(比如聚集索引组织表),只要保证重新导入的时候按原存储结构存储即可。