Apache NiFi 2.x处理器:GetFile 2.2.0

Apache NiFi 2.x处理器:GetFile 2.2.0

经验文章nimo972025-03-18 22:34:3110A+A-

org.apache.nifi | nifi-standard-nar

描述

从目录中的文件创建流文件(FlowFiles)。NiFi会忽略那些它没有至少读取权限的文件。

标签

文件、文件系统、获取、摄取、输入、本地、源

输入要求

禁止

支持敏感的动态属性

属性

  • 批次大小:处理器每次调用时提取的最大文件数。
    • 显示名称:批次大小
    • 描述:处理器每次调用时提取的最大文件数
    • API名称:批次大小
    • 默认值:10
    • 表达式语言作用域:不支持
    • 敏感:否
    • 是否必需:是
  • 忽略隐藏文件:指示是否应忽略隐藏文件。
    • 显示名称:忽略隐藏文件
    • 描述:指示是否应忽略隐藏文件
    • API名称:忽略隐藏文件
    • 默认值:true
    • 允许值:true、false
    • 表达式语言作用域:不支持
    • 敏感:否
    • 是否必需:是
  • 文件过滤器:只有文件名与给定正则表达式匹配的文件才会被选中。
    • 显示名称:文件过滤器
    • 描述:只有文件名与给定正则表达式匹配的文件才会被选中
    • API名称:文件过滤器
    • 默认值:[^.].*
    • 表达式语言作用域:不支持
    • 敏感:否
    • 是否必需:是
  • 输入目录:从中提取文件的输入目录。
    • 显示名称:输入目录
    • 描述:从中提取文件的输入目录
    • API名称:输入目录
    • 表达式语言作用域:JVM级别定义的环境变量和系统属性
    • 敏感:否
    • 是否必需:是
  • 保留源文件:如果为true,则文件在被复制到内容存储库后不会被删除;这会导致文件被持续提取,对测试很有用。如果不保留原始文件,NiFi需要对其提取文件的目录具有写入权限,否则将忽略该文件。
    • 显示名称:保留源文件
    • 描述:如果为true,则文件在被复制到内容存储库后不会被删除;这会导致文件被持续提取,对测试很有用。如果不保留原始文件,NiFi需要对其提取文件的目录具有写入权限,否则将忽略该文件。
    • API名称:保留源文件
    • 默认值:false
    • 允许值:true、false
    • 表达式语言作用域:不支持
    • 敏感:否
    • 是否必需:是
  • 最大文件年龄:文件被提取的最大年龄;任何超过此时间(根据最后修改日期)的文件将被忽略。
    • 显示名称:最大文件年龄
    • 描述:文件被提取的最大年龄;任何超过此时间(根据最后修改日期)的文件将被忽略
    • API名称:最大文件年龄
    • 表达式语言作用域:不支持
    • 敏感:否
    • 是否必需:否
  • 最大文件大小:文件被提取的最大大小。
    • 显示名称:最大文件大小
    • 描述:文件被提取的最大大小
    • API名称:最大文件大小
    • 表达式语言作用域:不支持
    • 敏感:否
    • 是否必需:否
  • 最小文件年龄:文件被提取的最小年龄;任何小于此时间(根据最后修改日期)的文件将被忽略。
    • 显示名称:最小文件年龄
    • 描述:文件被提取的最小年龄;任何小于此时间(根据最后修改日期)的文件将被忽略
    • API名称:最小文件年龄
    • 默认值:0秒
    • 表达式语言作用域:不支持
    • 敏感:否
    • 是否必需:是
  • 最小文件大小:文件被提取的最小大小。
    • 显示名称:最小文件大小
    • 描述:文件被提取的最小大小
    • API名称:最小文件大小
    • 默认值:0字节
    • 表达式语言作用域:不支持
    • 敏感:否
    • 是否必需:是
  • 路径过滤器:当“递归子目录”为true时,只有路径与给定正则表达式匹配的子目录才会被扫描。
    • 显示名称:路径过滤器
    • 描述:当“递归子目录”为true时,只有路径与给定正则表达式匹配的子目录才会被扫描
    • API名称:路径过滤器
    • 表达式语言作用域:不支持
    • 敏感:否
    • 是否必需:否
  • 轮询间隔:指示在执行目录列表操作之前等待的时间。
    • 显示名称:轮询间隔
    • 描述:指示在执行目录列表操作之前等待的时间
    • API名称:轮询间隔
    • 默认值:0秒
    • 表达式语言作用域:不支持
    • 敏感:否
    • 是否必需:是
  • 递归子目录:指示是否从子目录中提取文件。
    • 显示名称:递归子目录
    • 描述:指示是否从子目录中提取文件
    • API名称:递归子目录
    • 默认值:true
    • 允许值:true、false
    • 表达式语言作用域:不支持
    • 敏感:否
    • 是否必需:是

限制

所需权限

解释

读取文件系统

赋予操作员读取NiFi有权访问的任何文件的能力。

写入文件系统

赋予操作员删除NiFi有权访问的任何文件的能力。

关系

名称

描述

成功

所有文件都被路由到“成功”关系。

写入属性

名称

描述

filename

文件名被设置为磁盘上文件的名称。

path

路径被设置为文件在磁盘上所在目录的相对路径。例如,如果“输入目录”属性设置为/tmp,从/tmp提取的文件的path属性将被设置为./。如果“递归子目录”属性设置为true,并且从/tmp/abc/1/2/3提取文件,那么path属性将被设置为abc/1/2/3。

file.creationTime

文件的创建日期和时间。可能并非在所有文件系统上都有效。

file.lastModifiedTime

文件的最后修改日期和时间。可能并非在所有文件系统上都有效。

file.lastAccessTime

文件的最后访问日期和时间。可能并非在所有文件系统上都有效。

file.owner

文件的所有者。可能并非在所有文件系统上都有效。

file.group

文件的组所有者。可能并非在所有文件系统上都有效。

file.permissions

文件的读/写/执行权限。可能并非在所有文件系统上都有效。

absolute.path

文件被提取的完整/绝对路径。当前的“path”属性仍然会被填充,但可能是相对路径。

另请参阅

  • org.apache.nifi.processors.standard.FetchFile
  • org.apache.nifi.processors.standard.PutFile
点击这里复制本文地址 以上内容由nimo97整理呈现,请务必在转载分享时注明本文地址!如对内容有疑问,请联系我们,谢谢!
qrcode

尼墨宝库 © All Rights Reserved.  蜀ICP备2024111239号-7