Snowpark를 사용하여 데이터 읽기¶

데이터가 작업 데이터베이스에 있든, 파일로 제공되든 관계없이 Snowpark는 데이터를 가져와서 DataFrame으로 변환한 후 Snowflake 테이블에서 확인하는 Python 우선의 간단한 방법을 제공하므로 컨텍스트 전환 없이 모델링, 변환 및 분석을 수행할 수 있습니다.

Snowpark Python DB-API를 사용하여 외부 데이터 소스에서 데이터 읽기¶

표준 Python DB-API 2.0 드라이버를 사용하여 데이터를 외부 데이터베이스(SQL Server, Oracle, PostgreSQL, MySQL, Databricks)에서 Snowpark DataFrame으로 직접 가져옵니다. Snowpark Python DB-API는 클라이언트(로컬 모드) 또는 저장 프로시저나 노트북(외부 액세스 통합 사용)을 사용하여 Snowflake 내부에서 실행할 수 있습니다. 결과는 Snowflake 테이블에 조인, 변환, 작성할 수 있는 다른 DataFrame처럼 동작합니다. 자세한 내용은 Snowpark Python DB-API 사용 섹션을 참조하세요.

Snowpark Python JDBC를 사용하여 외부 데이터 소스에서 데이터 읽기¶

외부 데이터베이스에서 Snowpark DataFrame으로 직접 데이터를 가져오기 위해 사용자가 제공하는 표준 JDBC 드라이버를 사용합니다. Snowpark Python JDBC는 클라이언트에서 실행하거나 저장 프로시저 또는 노트북을 사용하여 Snowflake 내부에서 실행할 수 있습니다. UDTF는 대상 데이터를 수집하기 위해 생성됩니다. 결과는 Snowflake 테이블에 조인, 변환, 작성할 수 있는 다른 DataFrame처럼 동작합니다. 자세한 내용은 Snowpark Python JDBC 사용 섹션을 참조하세요.

참고

이 기능을 사용하려면 JDBC 드라이버를 스테이지에 업로드하고, 외부 액세스 통합을 구성하고, Snowflake가 소스 엔드포인트에 연결할 수 있는지 확인합니다.

Snowpark XML RowTag Reader를 사용하여 XML 파일에서 데이터 읽기¶

Snowpark XML을 사용하여 대규모 스테이징 XML 파일을 효율적으로 읽습니다. Reader는 rowTag`에서 파일을 분할하고, 각 일치 항목을 하나의 행으로 로드하고, 하위 요소를 :code:`VARIANT 열에 매핑하여(중첩 구조가 유지됨) Snowpark 또는 SQL로 즉시 쿼리할 수 있습니다. PERMISSIVE`(:code:`_corrupt_record`에서 유효하지 않은 행 격리) 또는 :code:`FAILFAST 동작을 사용하여 XSD에 대해 각 행의 유효성을 검사할 수도 있습니다. 출력은 변환하여 테이블에 저장할 수 있는 표준 DataFrame입니다. 자세한 내용은 Using the Snowpark XML RowTag Reader 섹션을 참조하세요.