Large Data 처리 가이드

BLOB/CLOB <- TEXT, BYTEA

  • 1GB 이하

  • TOAST에 의존한다.

    • PostgreSQL의 각 page영역은 일반적으로 8kb의 고정된 크기로 되어있고 각 tuple이 여러 페이지에 나뉘어 존재할 수 없다. (매우 큰 값을 바로 저장할 수 없다.)

      이 한계를 극복하기 위해서, 큰 필드 값은 압축되어 저장되거나 여러 개의 물리적 ROWS로 분할되어 저장된다.

    • 이 기법을 TOAST (The Oversized-Attribute Storage Technique)라고 하며 PostgreSQL에서 큰 데이터 값을 메모리 내에서 효율적으로 처리하는 데에 사용된다.


Large Object

  • 4TB 이하

  • 특징

    • 파일에 대한 표준 작업과 유사한 읽기/쓰기 API를 사용하여 생성, 수정 및 삭제할 수 있다.

    • 대형 개체의 일부를 읽고 업데이트하는 작업을 효율적으로 수행할 수 있는 반면 TOAST 로 처리된 필드의 대부분 작업은 전체 값을 단위로 읽거나 쓴다.

    • Chunk로 쪼개고 DB에 row로 저장. B-tree로 chunk index 탐색 가능하게 한다.


Migration 가이드

오라클의 LOB은 4GB까지 지원하는 반면, O2의 LOB은 TEXT, BYTEA 타입에 기반하기 때문에 1GB까지 지원한다. 따라서 1GB 넘는 데이터 이관 시에는 PostgreSQL의 Large Object를 사용해야 한다.

Last updated