파이썬 SQLAlchemy Core PostgreSQL JSON ARRAY Enum MySQL ON DUPLICATE KEY 완벽 가이드

🚀 실무에서 꼭 필요한 DB 특화 기능 활용법을 쉽고 빠르게 익혀보세요

데이터베이스를 다루다 보면 단순한 CRUD 작업만으로는 부족할 때가 많습니다.
특히 PostgreSQL의 JSON, ARRAY, Enum과 같은 고급 자료형이나, MySQL에서 자주 사용되는 ON DUPLICATE KEY 구문은 실무 개발자가 반드시 이해하고 활용해야 할 핵심 기능입니다.
하지만 공식 문서만으로는 개념이 어렵게 느껴질 수 있고, 실제 코드에 적용하려면 시행착오가 따르기 마련이죠.
이 글에서는 SQLAlchemy Core를 통해 이러한 DB 특화 기능을 파이썬 코드에서 간결하고 직관적으로 다루는 방법을 소개합니다.
기초를 익힌 분들에게는 실무에서 바로 적용할 수 있는 팁이 되고, 초보자에게는 데이터베이스 프로그래밍의 깊이를 한 단계 더 높이는 계기가 될 것입니다.

SQLAlchemy는 파이썬에서 가장 널리 사용되는 ORM이자 SQL 툴킷으로, 단순 쿼리 작성부터 복잡한 데이터 매핑까지 폭넓은 기능을 제공합니다.
특히 Core 모드를 활용하면 데이터베이스 고유의 기능을 직접적으로 다루면서도 파이썬스러운 코드 스타일을 유지할 수 있다는 장점이 있습니다.
이번 글에서는 PostgreSQL과 MySQL에서 자주 마주하는 특화 기능들을 SQLAlchemy Core로 구현하는 구체적인 예시와 함께 설명드리니, 끝까지 읽으시면 분명 실무에 도움이 될 것입니다.

🗄️ PostgreSQL JSON 다루기

PostgreSQL은 JSON과 JSONB라는 강력한 데이터 타입을 지원합니다.
JSON 타입은 원본 문자열 그대로 저장하는 반면, JSONB는 바이너리 형식으로 저장되어 인덱싱과 검색 성능이 뛰어납니다.
SQLAlchemy Core에서는 sqlalchemy.dialects.postgresql.JSON 또는 JSONB를 사용하여 컬럼을 정의할 수 있습니다.
이를 통해 반정형 데이터를 테이블에 효율적으로 저장하고, 동적 스키마를 가진 데이터를 쉽게 처리할 수 있습니다.

🔎 JSON 컬럼 정의와 활용

예를 들어 사용자 프로필에 취향이나 환경설정 같은 다양한 데이터를 JSON 컬럼으로 저장할 수 있습니다.
SQLAlchemy Core에서는 컬럼을 정의할 때 PostgreSQL 전용 Dialect를 불러와 사용하면 됩니다.

CODE BLOCK

from sqlalchemy import Table, Column, Integer, MetaData
from sqlalchemy.dialects.postgresql import JSONB

metadata = MetaData()

users = Table(
    "users", metadata,
    Column("id", Integer, primary_key=True),
    Column("profile", JSONB)  # JSONB 타입 정의
)

이렇게 정의된 컬럼에는 딕셔너리 형태의 데이터를 직접 삽입할 수 있으며, PostgreSQL의 JSON 함수와 연계해 원하는 키 값만 빠르게 조회할 수 있습니다.

⚡ JSON 함수와 연산자 활용

PostgreSQL은 JSON 데이터를 다룰 때 다양한 연산자를 제공합니다.
예를 들어 -> 연산자는 JSON 객체에서 키를 조회하고, ->> 연산자는 텍스트 값으로 추출합니다.
SQLAlchemy Core에서는 이 연산자들을 직접 쓸 수 있도록 매핑을 지원합니다.

CODE BLOCK

from sqlalchemy import select

# profile 컬럼의 "nickname" 키 값만 조회
stmt = select(users.c.profile["nickname"])

💡 TIP: JSONB 타입에 GIN 인덱스를 적용하면 대량의 JSON 데이터를 다룰 때도 빠른 검색이 가능합니다.

📂 PostgreSQL ARRAY 활용법

PostgreSQL은 배열(Array) 타입을 지원하여 하나의 컬럼에 여러 값을 저장할 수 있습니다.
예를 들어 사용자 취미, 태그, 여러 개의 이메일 주소와 같이 리스트 형태의 데이터를 테이블 컬럼에 직접 저장할 수 있죠.
SQLAlchemy Core에서는 sqlalchemy.dialects.postgresql.ARRAY를 통해 배열 컬럼을 정의하고 활용할 수 있습니다.

📝 ARRAY 컬럼 정의

예를 들어 사용자가 가진 태그를 배열로 저장한다고 할 때, 다음과 같이 정의할 수 있습니다.

CODE BLOCK

from sqlalchemy import Table, Column, Integer, String, MetaData
from sqlalchemy.dialects.postgresql import ARRAY

metadata = MetaData()

users = Table(
    "users", metadata,
    Column("id", Integer, primary_key=True),
    Column("tags", ARRAY(String))  # 문자열 배열 컬럼
)

이렇게 정의하면 파이썬의 리스트 데이터를 그대로 삽입할 수 있으며, PostgreSQL은 이를 배열 타입으로 저장합니다.

🔍 배열 함수와 연산자

PostgreSQL은 배열을 다루기 위한 다양한 함수와 연산자를 제공합니다.
예를 들어 ANY와 ALL 연산자를 사용해 배열 내부에 특정 값이 포함되어 있는지 쉽게 확인할 수 있습니다.
SQLAlchemy Core에서는 이 연산자들도 매핑하여 사용할 수 있습니다.

CODE BLOCK

from sqlalchemy import select

# "python"이라는 태그를 가진 사용자만 조회
stmt = select(users).where("python" == any_(users.c.tags))

💎 핵심 포인트:
ARRAY 컬럼은 유연하지만, 데이터 정규화가 필요한 경우에는 별도 테이블로 분리하는 것이 더 적절할 수 있습니다.

🔢 PostgreSQL Enum 타입 매핑

PostgreSQL은 Enum 타입을 기본적으로 지원하여 값의 범위를 미리 정의하고 컬럼에 강제할 수 있습니다.
SQLAlchemy Core는 이러한 PostgreSQL 전용 Enum을 sqlalchemy.dialects.postgresql.ENUM 클래스로 매핑할 수 있습니다.
이 방식은 데이터 무결성을 유지하고, 특정 값만 허용해야 하는 경우 유용합니다.

📌 Enum 타입 정의

예를 들어 사용자의 역할(role)을 “admin”, “editor”, “viewer”로 제한한다고 하면 다음과 같이 정의할 수 있습니다.

CODE BLOCK

from sqlalchemy import Table, Column, Integer, MetaData
from sqlalchemy.dialects.postgresql import ENUM

metadata = MetaData()

roles = ("admin", "editor", "viewer")

users = Table(
    "users", metadata,
    Column("id", Integer, primary_key=True),
    Column("role", ENUM(*roles, name="role_enum"))
)

위 예제에서는 “role_enum”이라는 이름으로 Enum 타입을 생성하고, 컬럼에 적용했습니다.
이후 해당 컬럼에는 지정한 값들만 입력이 가능해집니다.

⚠️ Enum 관리 시 유의할 점

Enum은 데이터 무결성을 보장하지만, 나중에 값의 추가나 변경이 필요할 때 마이그레이션이 까다로울 수 있습니다.
따라서 자주 변하는 데이터라면 별도 테이블을 두고 참조하는 방식이 더 적합할 수 있습니다.

⚠️ 주의: Enum 값 수정은 직접 SQL 명령으로 타입을 변경해야 하므로, 초기 설계 시 가능한 한 값들을 신중히 결정하는 것이 좋습니다.

🔁 MySQL ON DUPLICATE KEY 구문

MySQL에서는 ON DUPLICATE KEY UPDATE 구문을 활용하여 중복 키가 발생했을 때 기존 데이터를 업데이트할 수 있습니다.
이는 데이터 삽입과 동시에 충돌을 방지하는 매우 실용적인 기능으로, “업서트(Upsert)” 전략이라고도 불립니다.
SQLAlchemy Core는 MySQL Dialect에서 이 구문을 매핑할 수 있도록 지원합니다.

📝 기본 사용법

예를 들어 사용자 이메일이 기본 키이거나 고유 제약 조건을 가진 경우, 같은 이메일로 데이터를 삽입하려 하면 오류가 발생합니다.
하지만 ON DUPLICATE KEY UPDATE 구문을 사용하면 기존 데이터를 업데이트하여 충돌을 방지할 수 있습니다.

CODE BLOCK

from sqlalchemy.dialects.mysql import insert

stmt = insert(users).values(
    id=1, email="test@example.com", name="홍길동"
)

on_duplicate_stmt = stmt.on_duplicate_key_update(
    name=stmt.inserted.name
)

위 예제에서 새로운 사용자가 추가될 때 동일한 email 값이 이미 존재하면, 기존 레코드의 name 컬럼만 업데이트됩니다.

⚡ 활용 사례

📌로그 수집 시 중복 데이터를 허용하지 않고 최신 데이터로 갱신
📌상품 정보 업데이트 시 기존 데이터 보존 + 새로운 가격만 반영
📌사용자 접속 기록을 최신 상태로 유지

💡 TIP: 대량 데이터 처리에서는 ON DUPLICATE KEY UPDATE가 성능 저하를 일으킬 수 있으므로, 필요한 경우에만 사용하는 것이 좋습니다.

⚡ SQLAlchemy Core로 구현하기

지금까지 PostgreSQL의 JSON, ARRAY, Enum과 MySQL의 ON DUPLICATE KEY와 같은 DB 특화 기능을 살펴봤습니다.
이제 SQLAlchemy Core를 활용해 이러한 기능들을 파이썬 코드에서 유연하게 구현하는 방법을 정리해 보겠습니다.
Core 모드는 ORM보다 더 SQL 친화적이며, 데이터베이스 고유 기능을 직접 제어할 수 있다는 점이 가장 큰 장점입니다.

🛠️ PostgreSQL 특화 기능 예제

PostgreSQL의 다양한 자료형(JSON, ARRAY, Enum)은 다음과 같이 SQLAlchemy Core에서 정의할 수 있습니다.

CODE BLOCK

from sqlalchemy import Table, Column, Integer, String, MetaData
from sqlalchemy.dialects.postgresql import JSONB, ARRAY, ENUM

metadata = MetaData()

roles = ("admin", "editor", "viewer")

users = Table(
    "users", metadata,
    Column("id", Integer, primary_key=True),
    Column("profile", JSONB),         # JSONB 컬럼
    Column("tags", ARRAY(String)),    # ARRAY 컬럼
    Column("role", ENUM(*roles, name="role_enum"))  # Enum 컬럼
)

이렇게 정의하면 PostgreSQL 고유 기능을 파이썬 코드에서 직접 활용할 수 있고, ORM보다 더 세밀한 쿼리 최적화가 가능합니다.

🔄 MySQL UPSERT 구현

MySQL에서는 ON DUPLICATE KEY UPDATE 구문을 SQLAlchemy Core에서 다음과 같이 구현할 수 있습니다.

CODE BLOCK

from sqlalchemy.dialects.mysql import insert

stmt = insert(users).values(
    id=1, email="test@example.com", name="홍길동"
)

stmt = stmt.on_duplicate_key_update(
    name=stmt.inserted.name
)

이렇게 하면 데이터 삽입 시 충돌이 발생할 경우 자동으로 업데이트가 이루어져, 데이터 무결성을 유지하면서 코드 복잡도를 줄일 수 있습니다.

💡 실무 적용 팁

🗂️JSONB 컬럼에는 GIN 인덱스를 적용해 빠른 검색 성능 확보
📑ARRAY는 데이터가 자주 변할 경우 별도 테이블로 정규화 고려
🔒Enum 값은 초기 설계 시 신중히 정의하여 마이그레이션 비용 최소화
⚡MySQL 업서트는 대량 데이터 처리 시 성능 영향이 있으므로 필요한 곳에만 적용

❓ 자주 묻는 질문 (FAQ)

PostgreSQL에서 JSON과 JSONB의 차이는 무엇인가요?

JSON은 문자열 그대로 저장되고, JSONB는 바이너리 형식으로 저장되어 인덱싱과 검색 속도가 더 빠릅니다.

ARRAY 타입을 사용하면 언제 유용한가요?

사용자의 취미, 태그 목록, 여러 이메일 주소처럼 리스트 형태의 데이터를 하나의 컬럼에 저장할 때 유용합니다.

Enum 타입은 어떤 상황에서 쓰는 게 좋을까요?

값의 범위가 한정적이고 자주 바뀌지 않는 경우, 데이터 무결성을 보장하기 위해 Enum을 사용하는 것이 적합합니다.

MySQL ON DUPLICATE KEY UPDATE는 무엇을 의미하나요?

고유 키 충돌 시 새로운 데이터를 삽입하는 대신 기존 데이터를 업데이트하여 충돌을 방지하는 구문입니다.

SQLAlchemy Core와 ORM은 어떻게 다른가요?

Core는 SQL 구문에 더 가까운 저수준 API를 제공해 세밀한 제어가 가능하며, ORM은 객체 지향적으로 매핑해 직관적 코드를 작성할 수 있습니다.

JSON 컬럼을 효율적으로 검색하려면 어떻게 해야 하나요?

JSONB 타입을 사용하고 GIN 인덱스를 적용하면 대용량 데이터에서도 빠르게 검색할 수 있습니다.

MySQL 업서트 기능을 대량 데이터에도 적용해도 되나요?

가능합니다.
하지만 대량 데이터에서는 성능 저하가 발생할 수 있으므로 필요한 상황에서만 활용하는 것이 좋습니다.

Enum 값을 변경하거나 추가하려면 어떻게 하나요?

PostgreSQL에서는 직접 SQL 명령을 통해 Enum 타입을 ALTER해야 합니다.
따라서 초기 설계 시 Enum 값은 신중히 결정하는 것이 중요합니다.

📌 SQLAlchemy Core로 확장하는 PostgreSQL과 MySQL 기능 정리

PostgreSQL은 JSON, ARRAY, Enum과 같은 강력한 데이터 타입을 제공하며, MySQL은 ON DUPLICATE KEY UPDATE를 통해 업서트 기능을 지원합니다.
이 글에서는 SQLAlchemy Core를 활용해 이러한 특화 기능들을 구현하는 방법을 단계별로 살펴봤습니다.
Core 모드를 활용하면 단순히 데이터를 주고받는 수준을 넘어, 데이터베이스 고유 기능을 코드로 직접 제어할 수 있다는 장점이 있습니다.
이는 대규모 서비스나 성능 최적화가 중요한 환경에서 큰 차이를 만들어냅니다.

정리하자면, JSONB와 ARRAY는 비정형 데이터를 효율적으로 다루고, Enum은 데이터 무결성을 보장하며, MySQL의 업서트 구문은 중복 데이터 처리를 간결하게 만듭니다.
SQLAlchemy Core는 이 모든 기능을 파이썬 코드와 유연하게 결합할 수 있게 해주므로, 데이터베이스 설계와 개발 효율성을 동시에 높일 수 있습니다.
앞으로 프로젝트에서 이러한 기능들을 적절히 적용하면, 안정성과 확장성 모두를 잡을 수 있을 것입니다.

🏷️ 관련 태그 : SQLAlchemy, 파이썬데이터베이스, PostgreSQL, MySQL, JSONB, ARRAY, Enum, 업서트, 데이터모델링, DB프로그래밍