为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。 【DM版本】: 【操作系统】: 【CPU】: 【问题描述】*: Oracle数据库 language=SIMPLIFIED CHINESE_CHINA.ZHS16GBK dm8 CHARSET=1 从Oracle数据库GBK字符集使用DM数据迁移工具迁移到DM8 UTF-8字符集 两边数据库的字符集不同,但是迁移后的数据中文没有乱码,请问是在迁移的过程中迁移工具自动做了转换处理? 方便告诉转换是怎么实现的吗?
这个正常和迁移工具没关系。应该是不同字符集内部编码转换的。没记错的话应该GBK字符集能够编码的汉字,UTF8都能够编码,也就是UTF8能够识别的汉字比GBK多。(注:DM中的GBK字符是GB18030)。 但是UTF8和GBK存储中文所占用的存储字节不一样,正常情况GBK 存储一个汉字占用2个字节,UTF8占用3个字节。比如:VARCHAR(10) 在GBK字符集中可以存储5个完整汉字,UTF8字符集中只能存储3个完整汉字
这个正常和迁移工具没关系。应该是不同字符集内部编码转换的。没记错的话应该GBK字符集能够编码的汉字,UTF8都能够编码,也就是UTF8能够识别的汉字比GBK多。(注:DM中的GBK字符是GB18030)。
但是UTF8和GBK存储中文所占用的存储字节不一样,正常情况GBK 存储一个汉字占用2个字节,UTF8占用3个字节。比如:VARCHAR(10) 在GBK字符集中可以存储5个完整汉字,UTF8字符集中只能存储3个完整汉字