合 Oracle如何提高或加速数据泵(expdp和impdp)的操作性能

发布日期 2022年11月8日 · 已更新 2022年12月3日

0 925 3

Tags： Oracle 数据泵性能 expdp 并行 impdp 加速 parallel 数据泵逻辑导出导入提高性能

👉 本文共约4380个字，系统预计阅读时间或需17分钟。

影响DataPump相关的DataPump参数
access_method
cluster=n
data_options=disable_append_hint
estimate
exclude=comment
exclude=statistics
network_link
parallel
query
remap_*
影响DataPump操作性能的相关数据库参数
aq_tm_processes=0
deferred_segment_creation=true
filesystemio_option=...
NLS_CHARACTERSET=... and NLS_NCHAR_CHARACTERSET=...
NLS_COMP=... and NLS_SORT=...
parallel_force_local=true
streams_pool_size
_memory_broker_stat_interval=999
表DDL级别影响DataPump性能的相关参数
network_link+securefiles
securefiles(不使用network_link)
表DML级别影响DataPump性能的相关参数
12c中禁用日志
11.2.0.4含有大的clob字段
总结
参考

影响DataPump相关的DataPump参数

当执行datapump导出和导入时都想尽一切办法来提高性能，这里介绍一些可以显著提高DataPump性能的相关DataPump与数据库参数

access_method

在某些情况下由Data Pump API所选择的方法不能快速的访问你的数据集。在这种情况下除了显式地设置该参数来测试每一种访问方法之外你是无法知道那种访问方法更高效的。该参数有两种选项direct_path与external_table

cluster=n

在RAC环境中可以显著提供高Data Pump API基本操作的速度。注意这个参数只对Data Pump API操作起作用，在RAC环境中，建议将该参数设置为n。而如果将parallel_force_local设置为true所带来的影响不仅仅只针对Data Pump API操作

data_options=disable_append_hint

它只是impdp参数，在非常特殊的情况下，可以安全的使用并且可能减少导入数据的时间。只有满足以下所有条件时才使用data_options=disable_append_hint参数。
1.导入操作将向已经存在的表，分区或子分区导入数据
2.将被导入的已经存在的对象数非常少(比如是10或者更小)
3.当执行导入操作时其它会话对于这些被导入的对象只执行select语句。
data_options=disable_append_hint参数只有在11.2.0.1与更高版本中才可以使用。只有在要锁定由其它会话所释放对象花费很长时间的情况下使用data_option=disable_append_hint才能节省时间。

estimate

estimate参数有两个相互排斥的选项，一个是blocks，另一个是statistics.在执行导出操作时使用blocks方法来评估数据集大小比使用statistics方法消耗的时间更长。但是使用blocks方法评估的数据集大小要比使用statistics方法评估的数据集大小要精确些。如果导出文件的评估大小不是最主要关注的事，建议使用estimate=statistics。

exclude=comment

在某些情况下，终端用户不需要列和对象类型对应的注释，如果忽略这些数据，DataPump操作将会减少执行时间。

exclude=statistics

如果不需要使用排斥的include参数，那么排除和导出统计信息将会缩短整个导出操作的时间。dbms_stats.gather_database_stats过程将在数据导入到目标数据库后来生成统计信息。DataPump操作当由DataPump引擎和任何其它的RDBMS会话并行执行对小表生成统计信息时可能会hang且无限期。对于运行时间超过1小时或更长时间的DataPump操作，可以考虑禁用数据库的自动统计信息收集任务为了临时禁用11g的自动统计信息收集任务因此DataPump操作不会与该任务产生竞争，以sys用户执行以下命令:
exec dbms_auto_task_admin.diable(client_name=>'auto optimizer stats collection',
operation=>null,window_name=>null);
在DataPump操作完成之后重新启动统计信息收集任务:
exec DBMS_AUTO_TASK_ADMIN.ENABLE(client_name => 'auto optimizer stats collection', operation => NULL, window_name => NULL);

为了临时禁用10g的自动统计信息收集任务因此DataPump操作不会与该任务产生竞争，以sys用户执行以下命令:
exec sys.dbms_scheduler.disable ('GATHER_STATS_JOB');
在DataPump操作完成之后重新启动统计信息收集任务:
exec sys.dbms_scheduler.enable ('GATHER_STATS_JOB');

network_link

使用这个参数将会有效限制DataPump API的并行度，除非你的网络吞吐量和网络带宽比本地设备更好，使用network_link将会比使用导出文件慢很多。对于DataPump API性能来说，因为它倾向于比dump文件操作要慢很多，只建议network_link作为最后一招来使用。可以考虑使用移动或共享设备来存储dump文件来代替network_link来执行数据的迁移。

parallel

如果有多个CPU使用并且没有使用CPU绑定或磁盘I/O绑定或内存绑定且在dumpfile参数中没有使用多个dump文件，那么并行执行将会对性能产生正面影响。如果parallel参数设置为N,N>1，那么为了更好的使用并行执行建议dumpfile参数应该设置为不比parallel参数小。

需要注意的是，parallel参数是DataPump API可以使用的并发Data Pump工作进程的上限，但DataPump API可能使用的DataPump工作进程数要比这个参数指定的少，依赖于主机环境中的瓶颈，parallel参数指定的值小于可用CPU个数时Data Pump API基本操作可能会更快。

query

使用query参数会显著增加任何DataPump API基本操作的负载，这种开销与被查询表的数据量成正比。

remap_*

使用任何remap_*参数会显著增加任何DataPump API基本操作的负载，这种开销与被查询表的数据量成正比。

影响DataPump操作性能的相关数据库参数

aq_tm_processes=0

当这个参数被显式设置为0，可能对高级队列操作产生负面影响，进而对使用高级队列的DataPump基本操作产生负面影响。可以复原这个参数或者设置一个大于0的值

deferred_segment_creation=true

只适用于导入操作，这将会消除为空表分配空间所花费的时间。对于导出操作设置这个参数将不会对性能产生显著的影响。这个参数在11.2.0.2或更高版本中非常有用。

filesystemio_option=...

在特定情况下数据库实例将会对ACFS文件系统执行写操作，指定Data Pump API执行的写操作类型性质作为导出操作的一部分，NONE以外的其它参数值都可能造成导出操作变慢。

NLS_CHARACTERSET=... and NLS_NCHAR_CHARACTERSET=...

当源数据库与目标数据库之间这两个参数存在差异时，在任何时候执行导入操作时对于指定的分区表都不能使用多个DataPump工作进程来创建分区表和填充。在有些情况下，只有一个DataPump工作进程可以对表数据执行操作，这将会对表获得排他锁来阻止任何其它DataPump工作进程对相同的表执行操作。当分区表不存在排他锁时可以使用多个DataPump工作进程同时操作来显著提高对分区表导入数据的性能。

NLS_COMP=... and NLS_SORT=...

在一些罕见的情况下，数据库的这两个参数被设置为了binary这将显著提高DataPump API基本操作的速度。对于你的环境是否将这两个参数设置为binary能提高性能需要进行测试。在会话登录后在会话级别设置这两个参数可以通过以下的登录触发器来实现。

CREATE OR REPLACE TRIGGER sys.expdp_nls_session_settings AFTER LOGON ON DATABASE
DECLARE
V_MODULE VARCHAR2(60);
BEGIN
SELECT SYS_CONTEXT ('USERENV', 'MODULE') INTO V_MODULE FROM DUAL;
IF UPPER(V_MODULE) LIKE 'UDE%'
THEN
BEGIN
EXECUTE IMMEDIATE 'ALTER SESSION SET NLS_COMP=''BINARY''';
EXECUTE IMMEDIATE 'ALTER SESSION SET NLS_SORT=''BINARY''';
END;
END IF;
END;
/

CREATE OR REPLACE TRIGGER sys.expdp_nls_session_settings AFTER LOGON ON DATABASE

DECLARE

V_MODULE VARCHAR2(60);

BEGIN

SELECT SYS_CONTEXT ('USERENV', 'MODULE') INTO V_MODULE FROM DUAL;

IF UPPER(V_MODULE) LIKE 'UDE%'

THEN

BEGIN

EXECUTE IMMEDIATE 'ALTER SESSION SET NLS_COMP=''BINARY''';

EXECUTE IMMEDIATE 'ALTER SESSION SET NLS_SORT=''BINARY''';

END;

END IF;

END;

parallel_force_local=true

在RAC环境中可以显著提高DataPump API基本操作的性能并且避免并行DML操作的bug。但这个参数只能对11.2.0.2或更高版本使用。

streams_pool_size

为了避免bug 17365043 'STREAMS AQ: ENQUEUE BLOCKED ON LOW MEMORY WHEN REDUCING STREAMS_POOL_SIZE'
建议将streams_pool_size设置以下查询所返回的结果值

select 'ALTER SYSTEM SET STREAMS_POOL_SIZE='||(max(to_number(trim(c.ksppstvl)))+67108864)||' SCOPE=SPFILE;'
from sys.x$ksppi a, sys.x$ksppcv b, sys.x$ksppsv c
where a.indx = b.indx and a.indx = c.indx and lower(a.ksppinm) in ('__streams_pool_size','streams_pool_size');

select 'ALTER SYSTEM SET STREAMS_POOL_SIZE='||(max(to_number(trim(c.ksppstvl)))+67108864)||' SCOPE=SPFILE;'

from sys.x$ksppi a, sys.x$ksppcv b, sys.x$ksppsv c

where a.indx = b.indx and a.indx = c.indx and lower(a.ksppinm) in ('__streams_pool_size','streams_pool_size');

本人提供Oracle(OCP、OCM)、MySQL(OCP)、PostgreSQL(PGCA、PGCE、PGCM)等数据库的培训和考证业务，私聊QQ646634621或微信dbaup66，谢谢！

后续精彩内容已被站长无情隐藏，请输入验证码解锁本文！

获取验证码：请先关注本站微信公众号，然后回复“验证码”，获取验证码。在微信里搜索“AiDBA”或者“dbaup6”或者微信扫描右侧二维码都可以关注本站微信公众号。

打赏赞(3)

标签： Oracle 数据泵性能 expdp 并行 impdp 加速 parallel 数据泵逻辑导出导入提高性能

小麦苗

学习或考证，均可联系麦老师，请加微信db_bao或QQ646634621

发表回复取消回复

要发表评论，您必须先登录。

1、声明：本网站有部分文章整合或转载自网络，文章著作权归属原作者或原团队；若有侵权，深表歉意，请联系本站站长进行处理，谢谢！！！
2、本站提供数据库的培训和考证业务，培训包含但不限于Oracle、MySQL、PostgreSQL、SQL Server、国产数据库等，考证包括但不限于Oracle OCP、Oracle OCM、MySQL OCP、PGCA、PGCE、PGCM等，私聊QQ646634621或微信dbaup66，非诚勿扰，谢谢！！！
3、麦老师新建了《西安DBA数据架构师》微信群，有志同道合的朋友可以私聊我入群，我们一起聊技术，聊生活，空了可以喝酒约饭。
4、为了方便大家更有针对性的讨论学习数据库，故新建数据库分类群，包括Oracle群、MySQL群、SQL Server群、PG&GP群、国产&信创群。志同道合的朋友可以入群聊技术聊人生，捣乱的勿进，喷子勿进，极端人士勿进，谢谢。

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

合 Oracle如何提高或加速数据泵(expdp和impdp)的操作性能

影响DataPump相关的DataPump参数

access_method

cluster=n

data_options=disable_append_hint

estimate

exclude=comment

exclude=statistics

network_link

parallel

query

remap_*

影响DataPump操作性能的相关数据库参数

aq_tm_processes=0

deferred_segment_creation=true

filesystemio_option=...

NLS_CHARACTERSET=... and NLS_NCHAR_CHARACTERSET=...

NLS_COMP=... and NLS_SORT=...

parallel_force_local=true

streams_pool_size

相关文章

您可能还喜欢...

发表回复取消回复

网站公告

网站寄语

本站其它工具

搜索本网站

标签云☁

网站日历

网站归档

网站分类

合 Oracle如何提高或加速数据泵(expdp和impdp)的操作性能

影响DataPump相关的DataPump参数

access_method

cluster=n

data_options=disable_append_hint

estimate

exclude=comment

exclude=statistics

network_link

parallel

query

remap_*

影响DataPump操作性能的相关数据库参数

aq_tm_processes=0

deferred_segment_creation=true

filesystemio_option=...

NLS_CHARACTERSET=... and NLS_NCHAR_CHARACTERSET=...

NLS_COMP=... and NLS_SORT=...

parallel_force_local=true

streams_pool_size

相关文章

您可能还喜欢...

PG并发创建和重建索引之CONCURRENTLY

Oracle之函数索引

【故障处理】ORA-12545: Connect failed because target host or object does not exist

发表回复 取消回复

网站公告

网站寄语

本站其它工具

搜索本网站

标签云☁

网站日历

网站归档

网站分类

发表回复取消回复