SQLLDR导入
1.简介
SQL*LOADER是ORACLE的数据加载工具,通常用来将操作系统文件(数据)迁移到ORACLE数据库中。SQL*LOADER是大型数据仓库选择使用的加载方法,因为它提供了最快速的途径(DIRECT,PARALLEL)。
2.语法和参数
语法: SQLLDR keyword=value [,keyword=value,...];
Sqlldr 参数一览
Keyword | 默认值 | 描述 |
userid | ORACLE 用户名/口令 | |
control | 控制文件名 | |
log | 日志文件名 | |
bad | 错误文件名 | |
data | 数据文件名 | |
discard | 废弃文件名 | |
discardmax | 全部 | 允许废弃的文件的数目 |
skip | 0 | 要跳过的逻辑记录的数目 |
load | 全部 | 要加载的逻辑记录的数目 |
errors | 允许的错误的数目 | |
rows | 常规:64 默认路径:全部 | 常规路径绑定数组中或直接路径保存数据间的行数 |
bindsize | 256000 | 常规路径绑定数组的大小 |
silent | 运行过程中隐藏消息 | |
direct | FALSE | 使用直接路径 |
parfile | 参数文件: 包含参数说明的文件的名称 | |
parallel | FALSE | 执行并行加载 |
file | 执行文件 | |
skip_unusable_indexes | FALSE | 不允许/允许使用无用的索引或索引分区 |
skip_index_maintenance | FALSE | 没有维护索引, 将受到影响的索引标记为无用 |
commit_discontinued | FALSE | 提交加载中断时已加载的行 |
readsize | 1048576 | 读取缓冲区的大小 |
external_table | NOT_USED | 使用外部表进行加载; NOT_USED, GENERATE_ONLY, EXECUTE |
columnarrayrows | 5000 | 直接路径列数组的行数 |
streamsize | 256000 | 直接路径流缓冲区的大小 (以字节计) |
multithreading | 在直接路径中使用多线程 | |
resumable | FALSE | 启用或禁用当前的可恢复会话 |
resumable_name | 有助于标识可恢复语句的文本字符串 | |
resumable_timeout | 7200 | RESUMABLE 的等待时间 (以秒计) |
date_cache | 1000 | 日期转换高速缓存的大小 (以条目计) |
3. 范例
利用PLSQL生成测试数据cux_sqlldr_test.txt
BEGIN FOR iIN1..100 LOOP IFMOD(i,2)=1THEN dbms_output.put_line('"'||i||'","column1_'||i||'",'||'"column2_'||i||'",'||'"column3_'||i||'",'||'"show_column_'||i||'",'||'"hide_column_'||i||'","2017-01-01"'); ELSE dbms_output.put_line('"'||i||'","column1_'||i||'", ,'||'"column3_'||i||'",'||'"show_column_'||i||'",'||'"hide_column_'||i||'"'); ENDIF; ENDLOOP; END;
建表
CREATETABLE cux.cux_sqlldr_test (line_num NUMBER, seq_num NUMBER, column1 VARCHAR2(30), column2 VARCHAR2(30)NOTNULL, column3 VARCHAR2(30)DEFAULT'column2', show_column VARCHAR2(30), hide_column VARCHAR2(30), creation_date DATE ); CREATEORREPLACE SYNONYM apps.cux_sqlldr_test FOR cux.cux_sqlldr_test; CREATESEQUENCE cux.cux_sqlldr_test_sSTARTWITH10001; CREATEORREPLACESYNONYM apps.cux_sqlldr_test_s FOR cux.cux_sqlldr_test_s;
4.Sqlldr 有两种使用方式
(1)在控制文件中包涵数据.
创建一个文件命名为cux_sqlldr_test.ctl,在服务器下创建目录Sqlldr,在sqlldr下创建log和bad文件夹,
上传cux_sqlldr_test.ctl至服务器 ,如下图所示:
cux_sqlldr_test.ctl内容如下:
OPTIONS (skip=3,rows=128) load data CHARACTERSET ZHS16GBK infile * badfile "/u02/ebsuat/app/fs2/EBSapps/appl/cux/12.0.0/sqlldr/bad/cux_sqlldr_test.bad" discardfile "/u02/ebsuat/app/fs2/EBSapps/appl/cux/12.0.0/sqlldr/bad/cux_sqlldr_test.disc" TRUNCATE into table cux_sqlldr_test WHEN column1 != "column1_1" Fields terminated by "," Optionally enclosed by '"' TRAILING NULLCOLS ( line_num RECNUM , seq_num "cux_sqlldr_test_s.nextval" , column1 , column2 , column3 NULLIF (column3="column3_4"), show_column "UPPER(:show_column)" , hide_column FILLER , creation_date DATE 'YYYY-MM-DD' "CASE WHEN :creation_date is null THEN TO_CHAR(sysdate,'YYYY-MM-DD') ELSE :creation_date END" ) BEGINDATA "1","column1_1","column2_1","column3_1","show_column_1","hide_column_1","2017-01-01" "2","column1_2", ,"column3_2","show_column_2","hide_column_2" "3","column1_3","column2_3","column3_3","show_column_3","hide_column_3","2017-01-01" "4","column1_4", ,"column3_4","show_column_4","hide_column_4" "5","column1_5","column2_5","column3_5","show_column_5","hide_column_5","2017-01-01" "6","column1_6", ,"column3_6","show_column_6","hide_column_6" "7","column1_7","column2_7","column3_7","show_column_7","hide_column_7","2017-01-01" "8","column1_8", ,"column3_8","show_column_8","hide_column_8" "9","column1_9","column2_9","column3_9","show_column_9","hide_column_9","2017-01-01" "10","column1_10", ,"column3_10","show_column_10","hide_column_10"
运行命令
sqlldr userid=apps/appsjiahuicontrol=/u02/ebsuat/app/fs2/EBSapps/appl/cux/12.0.0/sqlldr/file/cux_sqlldr_test.ctl log=$CUX_TOP/sqlldr/file/cux_sqlldr_test.log
查看结果
查看表
由上图可以看出,运行命令后,在file文件夹下生成了cux_sqlldr_test.log,在bad下生成了cux_sqlldr_test.bad,在表中生成了3条记录,下面分析一下cux_sqlldr_test.ctl的内容和结果
代码 | 说明 |
OPTIONS (skip=3,rows=128) | sqlldr 的内容可以写在cotrol文件load_data的前面,此处跳过前3行,每次提交128行 |
load data | 加载数据 |
CHARACTERSET ZHS16GBK | 字符集编码(如果出现乱码要考虑一下) |
infile * | 加载的文件,* 表示本文件 |
badfile | 错误的数据所放的文件(校验错误) |
discardfile | 丢弃的数据放的路径(记录的格式错误或过滤行) |
TRUNCATE into table cux_sqlldr_test | 先TRUNCATE cux_sqlldr_test再将记录插入表 |
WHEN column1 != "column1_1" | 过滤行,对于值为column1_1的行过滤 |
Fields terminated by "," | 多个字段间用“,”隔开 |
Optionally enclosed by '"' | 单个字段用“"”,“"”开始结束 |
TRAILING NULLCOLS | 对于值为空的字段允许为空 |
(line_num RECNUM | 序号,自动生成,并不取自数据 |
seq_num "cux_sqlldr_test_s.nextval" | 取每条记录的第一个字段,此处应为1..10,但是这里赋值序列。 |
表2
代码 | 说明 |
column1 | column1 |
column2 | column2,表定义为非空字段,虽然上面允许为空,但是如果该值为空,不能插入表种 |
column3 NULLIF (column3="column3_4") | column3="column3_4"时候默认为空 |
show_column "UPPER(:show_column)" | 大写列(调用UPPER大写函数) |
hide_column FILLER | FILLER 隐藏列 |
creation_date DATE 'YYYY-MM-DD'"CASE WHEN :creation_date is null THENTO_CHAR(sysdate,'YYYY-MM-DD') ELSE :creation_date END" | 日期类型,格式为YYYY-MM-DD,为空的时候取系统日期 |
BEGINDATA | 数据开始 |
******* | 数据内容,默认每行一条记录 |
从日志可以看出7条数据中,4条记录无法没导入的原因。
查看cux_sqlldr_test.bad,其中记录4条错误的数据。
(2)在控制文件中不包涵数据.
上传cux_sqlldr_test.txt,cux_sqlldr_test.ctl至服务器,cux_sqlldr_test.txt由上面PLSQL脚本生成,cux_sqlldr_test.ctl如下
OPTIONS (skip=3,rows=128) load data CHARACTERSET ZHS16GBK infile "/u02/ebsuat/app/fs2/EBSapps/appl/cux/12.0.0/sqlldr/file/cux_sqlldr_test.txt" badfile "/u02/ebsuat/app/fs2/EBSapps/appl/cux/12.0.0/sqlldr/bad/cux_sqlldr_test.bad" discardfile "/u02/ebsuat/app/fs2/EBSapps/appl/cux/12.0.0/sqlldr/bad/cux_sqlldr_test.disc" TRUNCATE into table cux_sqlldr_test WHEN column1 != "column1_4" Fields terminated by "," Optionally enclosed by '"' TRAILING NULLCOLS ( line_num RECNUM , seq_num "cux_sqlldr_test_s.nextval" , column1 , column2 "nvl(:column2,'***')", column3 NULLIF (column3="column3_4"), show_column "UPPER(:show_column)" , hide_column FILLER , creation_date DATE 'YYYY-MM-DD' "CASE WHEN :creation_date is null THEN TO_CHAR(sysdate,'YYYY-MM-DD') ELSE :creation_date END" )
运行命令
sqlldr userid=apps/appsjiahuicontrol=/u02/ebsuat/app/fs2/EBSapps/appl/cux/12.0.0/sqlldr/file/cux_sqlldr_test.ctl log=$CUX_TOP/sqlldr/file/cux_sqlldr_test.log
100条数据由于skip = 3 从第4条开始处理变成97条,第四条数据由于WHEN column1 != "column1_4"
被丢弃在bad的cux_sqlldr_test.disc路径下,没有错误数据。查看表共96条数据,如下图所示:
column2 "nvl(:column2,'***')", 对于 column2默认为 “***” .
其他
此外,sqlload可以实现同时加载多个文件,同时把数据加载到多个表。