pandas 카테고리형 생성 가이드 astype(category)와 CategoricalDtype ordered 완전정복 🐼 한 줄 변환부터 순서형 분류까지 데이터 전처리 속도를 높이는 실전 방법 데이터를 다루다 보면 같은 값이…
파이썬 pandas 복사와 뷰 완벽 가이드 .copy(deep=True)와 Copy-on-Write 2.x 동작 원리 🐍 실수 없이 데이터프레임을 다루는 복사 전략과 안전한 수정 규칙을 한 번에 정리합니다 데이터를…
pandas Arrow 백엔드 dtype_backend=’pyarrow’ 완벽 가이드 Dtype·널 모델 변화와 메모리 속도 트레이드오프 🧭 한 줄 설정으로 더 가벼운 메모리와 다양한 타입을 쓰는 대신 속도 균형을…
파이썬 pandas CategoricalIndex와 IntervalIndex 완벽 가이드 데이터 범주와 구간 인덱스 이해하기 📌 범주형과 구간형 인덱스로 메모리 절감과 조회 속도를 잡는 실전 사용법 데이터 칼럼의 유니크…
파이썬 정규표현식 성능 최적화 finditer 스트리밍과 findall 그룹 튜플 주의로 큰 텍스트 처리 가속 🐍 큰 텍스트는 finditer로 스트리밍하고 그룹만 필요하면 findall의 튜플 반환에 주의하세요…
파이썬 JSON·XML 로깅과 관찰성 성능 지표 파싱 시간 메모리 피크 레코드 처리률 압축률 가이드 🚀 실제 서비스에 바로 쓰는 파이썬 JSON·XML 관찰성 설계와 성능 측정…
파이썬 XML iterparse로 대용량 파일 처리 el.clear로 메모리 최적화 레시피 📌 대용량 XML도 끊김 없이 파싱하는 가장 간단한 한 줄 패턴을 공개합니다 수십 MB에서 수GB에…
파이썬 XML iterparse 스트리밍 가이드, 성능 최적화와 태그 필터 이벤트 처리 메모리 제한 대형 파일 병렬 파이프라인 📌 대용량 XML을 멈추지 않고 흘려보내는 방법, iterparse로…
파이썬 JSON 스트리밍 ijson iterparse 메모리 피크 완화 가이드 📌 대용량 JSON도 끊김 없이 처리하는 이벤트 기반 파싱 실전 전략 수십 메가에서 수 기가바이트까지 커지는…