Apache NiFi 2.x处理器:GetFile 2.2.0
包
org.apache.nifi | nifi-standard-nar
描述
从目录中的文件创建流文件(FlowFiles)。NiFi会忽略那些它没有至少读取权限的文件。
标签
文件、文件系统、获取、摄取、输入、本地、源
输入要求
禁止
支持敏感的动态属性
否
属性
- 批次大小:处理器每次调用时提取的最大文件数。
- 显示名称:批次大小
- 描述:处理器每次调用时提取的最大文件数
- API名称:批次大小
- 默认值:10
- 表达式语言作用域:不支持
- 敏感:否
- 是否必需:是
- 忽略隐藏文件:指示是否应忽略隐藏文件。
- 显示名称:忽略隐藏文件
- 描述:指示是否应忽略隐藏文件
- API名称:忽略隐藏文件
- 默认值:true
- 允许值:true、false
- 表达式语言作用域:不支持
- 敏感:否
- 是否必需:是
- 文件过滤器:只有文件名与给定正则表达式匹配的文件才会被选中。
- 显示名称:文件过滤器
- 描述:只有文件名与给定正则表达式匹配的文件才会被选中
- API名称:文件过滤器
- 默认值:[^.].*
- 表达式语言作用域:不支持
- 敏感:否
- 是否必需:是
- 输入目录:从中提取文件的输入目录。
- 显示名称:输入目录
- 描述:从中提取文件的输入目录
- API名称:输入目录
- 表达式语言作用域:JVM级别定义的环境变量和系统属性
- 敏感:否
- 是否必需:是
- 保留源文件:如果为true,则文件在被复制到内容存储库后不会被删除;这会导致文件被持续提取,对测试很有用。如果不保留原始文件,NiFi需要对其提取文件的目录具有写入权限,否则将忽略该文件。
- 显示名称:保留源文件
- 描述:如果为true,则文件在被复制到内容存储库后不会被删除;这会导致文件被持续提取,对测试很有用。如果不保留原始文件,NiFi需要对其提取文件的目录具有写入权限,否则将忽略该文件。
- API名称:保留源文件
- 默认值:false
- 允许值:true、false
- 表达式语言作用域:不支持
- 敏感:否
- 是否必需:是
- 最大文件年龄:文件被提取的最大年龄;任何超过此时间(根据最后修改日期)的文件将被忽略。
- 显示名称:最大文件年龄
- 描述:文件被提取的最大年龄;任何超过此时间(根据最后修改日期)的文件将被忽略
- API名称:最大文件年龄
- 表达式语言作用域:不支持
- 敏感:否
- 是否必需:否
- 最大文件大小:文件被提取的最大大小。
- 显示名称:最大文件大小
- 描述:文件被提取的最大大小
- API名称:最大文件大小
- 表达式语言作用域:不支持
- 敏感:否
- 是否必需:否
- 最小文件年龄:文件被提取的最小年龄;任何小于此时间(根据最后修改日期)的文件将被忽略。
- 显示名称:最小文件年龄
- 描述:文件被提取的最小年龄;任何小于此时间(根据最后修改日期)的文件将被忽略
- API名称:最小文件年龄
- 默认值:0秒
- 表达式语言作用域:不支持
- 敏感:否
- 是否必需:是
- 最小文件大小:文件被提取的最小大小。
- 显示名称:最小文件大小
- 描述:文件被提取的最小大小
- API名称:最小文件大小
- 默认值:0字节
- 表达式语言作用域:不支持
- 敏感:否
- 是否必需:是
- 路径过滤器:当“递归子目录”为true时,只有路径与给定正则表达式匹配的子目录才会被扫描。
- 显示名称:路径过滤器
- 描述:当“递归子目录”为true时,只有路径与给定正则表达式匹配的子目录才会被扫描
- API名称:路径过滤器
- 表达式语言作用域:不支持
- 敏感:否
- 是否必需:否
- 轮询间隔:指示在执行目录列表操作之前等待的时间。
- 显示名称:轮询间隔
- 描述:指示在执行目录列表操作之前等待的时间
- API名称:轮询间隔
- 默认值:0秒
- 表达式语言作用域:不支持
- 敏感:否
- 是否必需:是
- 递归子目录:指示是否从子目录中提取文件。
- 显示名称:递归子目录
- 描述:指示是否从子目录中提取文件
- API名称:递归子目录
- 默认值:true
- 允许值:true、false
- 表达式语言作用域:不支持
- 敏感:否
- 是否必需:是
限制
所需权限 | 解释 |
读取文件系统 | 赋予操作员读取NiFi有权访问的任何文件的能力。 |
写入文件系统 | 赋予操作员删除NiFi有权访问的任何文件的能力。 |
关系
名称 | 描述 |
成功 | 所有文件都被路由到“成功”关系。 |
写入属性
名称 | 描述 |
filename | 文件名被设置为磁盘上文件的名称。 |
path | 路径被设置为文件在磁盘上所在目录的相对路径。例如,如果“输入目录”属性设置为/tmp,从/tmp提取的文件的path属性将被设置为./。如果“递归子目录”属性设置为true,并且从/tmp/abc/1/2/3提取文件,那么path属性将被设置为abc/1/2/3。 |
file.creationTime | 文件的创建日期和时间。可能并非在所有文件系统上都有效。 |
file.lastModifiedTime | 文件的最后修改日期和时间。可能并非在所有文件系统上都有效。 |
file.lastAccessTime | 文件的最后访问日期和时间。可能并非在所有文件系统上都有效。 |
file.owner | 文件的所有者。可能并非在所有文件系统上都有效。 |
file.group | 文件的组所有者。可能并非在所有文件系统上都有效。 |
file.permissions | 文件的读/写/执行权限。可能并非在所有文件系统上都有效。 |
absolute.path | 文件被提取的完整/绝对路径。当前的“path”属性仍然会被填充,但可能是相对路径。 |
另请参阅
- org.apache.nifi.processors.standard.FetchFile
- org.apache.nifi.processors.standard.PutFile