PgSQL-如何仅在数据库完全为空时导入数据库转储



使用ansible实现自动化的用例。当数据库完全为空(里面没有表)时,我只想导入数据库转储。当然,执行sql语句总是有办法的,但这是最后的手段,我相信应该有更优雅的解决方案。

据我所见,pg_restore手册没有提供此选项。

以下是我计划如何使用ansible:

  - name: db_restore | Receive latest DB backup
    shell: s3cmd --skip-existing get `s3cmd ls s3://{{ aws_bucket }}/ | grep sentry | tail -1 | awk '{print $4}'` sql.latest.tgz
    args:
        chdir: /root/
        creates: sql.latest.tgz
  - name: db_restore | Check if file exists
    stat: path=/root/sql.latest.tgz
    register: sql_latest
  - name: db_restore | Restore latest DB backup if backup file found
    shell: PGPASSWORD={{ dbpassword }} tar -xzOf /root/sentry*.tgz db.sql | psql -U{{ dbuser }} -h{{ pgsql_server }} --set ON_ERROR_STOP=on {{ dbname }}
    when: sql_latest.stat.exists
    ignore_errors: True

理想情况下,这应该检查DB是否为空。不存在用于此目的的可靠模块。谷歌也保持沉默。。当前的解决方案实际上也有效,当导入失败时会出现错误,我可以忽略错误,但看到误报有点痛苦。

实际上并没有"空"这样的东西;它通常具有内置类型、默认的PL/PgSQL语言等,即使您是从template0创建的。如果你从一个不同的模板创建,里面可能会有更多。

PostgreSQL不会记录第一次非模板写入数据库的情况,所以也不能说"创建后更改了"。

这就是为什么pg_restore没有--if-empty选项的原因。这真的没有道理。

到目前为止,最好的选择是执行psql来查询information_schema,并确定public模式中是否有表。或者,更好的是,查询是否存在您知道将由转储创建的特定表和类型。

例如

psql -qAt mydbname -c "select 1 from information_schema.tables where table_schema = 'public' and table_name = 'testtable';"

然后,您可以测试stdout上返回的零/非零行。或者将其封装在SELECT EXISTS(...)中以从psql中获得布尔值。或者,如果表存在,如果需要从psql退出零/非零状态,则使用ERRORDO块。

要将数据库视为空,我们必须知道从创建时起没有添加任何内容。由于postgres没有跟踪这一点(正如@Craig Ringer已经提到的),我建议对ansible采用不同的方法。

所以,只需使用一个处理程序机制,如:

- name: Create zabbbix postgres DB
  postgresql_db: name="{{zabbix_db_name}}"
  notify:
    - Init zabbix database

由于很难判断,如果一个数据库是"空的",正如其他人所解释的那样,检查数据库是否存在要容易得多,然后一步创建和恢复。我是这样做的:

- name: Check my_database database already exists
  become: yes
  become_user: postgres
  shell: psql -l | grep my_database
  ignore_errors: true
  register: my_database_db_existence
- debug: var=my_database_db_existence
- name: Copy backup of the my-database database
  shell: your-s3-command here
  when: my_database_db_existence | failed
- name: Restore my_database database on first run
  become_user: postgres
  shell: createdb -O my_user my_database && psql -d my_database -f /path/to/my_dump.sql
  when: my_database_db_existence | failed

第页。S.还写了一篇详细的博客文章,解释了实现中的每一项任务。

在我的Ansible连续部署中,我宁愿不检查空数据库。我运行具有默认属性的容器,并在不存在的情况下创建数据库,然后恢复数据库(创建方案、表等):

    - hosts: all
      vars:
        database_name: "maindb"
        pg_admin_name: "postgres"
        pg_admin_password: "postgres"
        pghost: "localhost"
        pg_user_name: "vr_user"
        pg_user_password: "ChanGeMe2021"
      tasks:
        - name: Check if database is exist
          community.postgresql.postgresql_info:
            login_host: "{{ pghost }}"
            login_user: "{{ pg_admin_name }}"
            login_password: "{{ pg_admin_password }}"
            filter:
              - "databases"
          register: pg_info
        - name: Create database if not exist
          block:
            - name: Say status 
              ansible.builtin.debug:
                msg: "Database is not exist!"
            - name: Copy dadabase shchema
              ansible.builtin.copy:
                src: "./files/maindb.sql" 
                dest: "/tmp/maindb.sql" 
            - name: Create database
              community.postgresql.postgresql_db:
                login_host: "{{ pghost }}"
                login_user: "{{ pg_admin_name }}"
                login_password: "{{ pg_admin_password }}"
                name: "{{ database_name }}"
                encoding: UTF-8
                # lc_collate: ru_RU.utf8
                # lc_ctype: ru_RU.utf8
            - name: Create role 
              community.postgresql.postgresql_user:
                login_host: "{{ pghost }}"
                login_user: "{{ pg_admin_name }}"
                login_password: "{{ pg_admin_password }}"
                name: "{{ pg_user_name }}"
                password: "{{ pg_user_password }}"
            - name: Restore database
              community.postgresql.postgresql_db:
                login_host: "{{ pghost }}"
                login_user: "{{ pg_admin_name }}"
                login_password: "{{ pg_admin_password }}"
                name: "{{ database_name }}"
                state: restore
                target: "/tmp/maindb.sql"
              register: pg_restore_result
              failed_when: "'ERROR' in pg_restore_result.stderr"
            - name: Print restore result  
              ansible.builtin.debug:
                msg: "{{ pg_restore_result }}"
          rescue:
            - name: Rollback database
              community.postgresql.postgresql_db:
                login_host: "{{ pghost }}"
                login_user: "{{ pg_admin_name }}"
                login_password: "{{ pg_admin_password }}"
                name: "{{ database_name }}"
                state: absent
            - name: Print when errors
              ansible.builtin.debug:
                msg: "Restore failed, because: {{ pg_restore_result.stderr_lines[1] }}"
          when: pg_info.databases[database_name] is not defined

这个代码你可以在这里找到

最新更新