如何在 Apache Flink 中创建外部目录表



我尝试创建和 ExternalCatalog 以在 Apache Flink 表中使用。我创建并添加到 Flink 表环境中(这里是官方文档)。由于某种原因,"目录"中存在的唯一外部表,在扫描过程中找不到它。我在上面的代码中错过了什么?

  val catalogName = s"externalCatalog$fileNumber"
  val ec: ExternalCatalog = getExternalCatalog(catalogName, 1, tableEnv)
  tableEnv.registerExternalCatalog(catalogName, ec)
  val s1: Table = tableEnv.scan("S_EXT")
  def getExternalCatalog(catalogName: String, fileNumber: Int, tableEnv: BatchTableEnvironment): ExternalCatalog = {
    val cat = new InMemoryExternalCatalog(catalogName)
    // external Catalog table
    val externalCatalogTableS = getExternalCatalogTable("S")
    // add external Catalog table
    cat.createTable("S_EXT", externalCatalogTableS, ignoreIfExists = false)
    cat
  }
  private def getExternalCatalogTable(fileName: String): ExternalCatalogTable = {
    // connector descriptor
    val connectorDescriptor = new FileSystem()
    connectorDescriptor.path(getFilePath(fileNumber, fileName))
    // format
    val fd = new Csv()
    fd.field("X", Types.STRING)
    fd.field("Y", Types.STRING)
    fd.fieldDelimiter(",")
    // statistic
    val statistics = new Statistics()
    statistics.rowCount(0)
    // metadata
    val md = new Metadata()
    ExternalCatalogTable.builder(connectorDescriptor)
      .withFormat(fd)
      .withStatistics(statistics)
      .withMetadata(md)
      .asTableSource()
  }

上面的示例是 git 中此测试文件的一部分。

这可能是命名空间问题。外部目录中的表由目录名称列表(可能是架构)标识,最后由表名标识。

在您的示例中,以下内容应该有效:

val s1: Table = tableEnv.scan("externalCatalog1", "S_EXT")

您可以查看 ExternalCatalogTest 以了解如何使用外部目录。

相关内容

  • 没有找到相关文章

最新更新