[BigQuery/빅쿼리-SQL] 문자열을 배열로 분해하기 (split 함수, split_part 함수)
·
SQL
빅데이터 분석에서 제일 많이 사용되는 자료형은 문자열이다. 문자열 자료형은 범용적인 자료형으로 더 세부적으로 분해해서 사용해야 한다. 앞에서 사용한 접근 로그 샘플을 기반으로 페이지 계층을 나누어 보았다. 배열의 인덱스는 일반적으로 1로 시작한다. 하지만 빅쿼리는 배열의 인덱스를 0부터 시작하고자 하면 OFFSET, 1부터 시작하고자 하면 ORDINAL을 지정한다. 추가로 배열의 길이 이상의 인덱스에 접근하고자 하면 보통 NULL값이 나오지만 빅쿼리는 오류를 리턴한다. NULL로 리턴하고자하면 SAFE_OFFSET or SAFE_ORDINAL을 지정해야 한다는 점을 유의하자!