Snowparkを使用したデータの読み取り¶
データが運用データベースにあるか、ファイルとして受信されているかに関係なく、Snowparkを使用すると、簡単なPython優先の方法でデータを取得し、 DataFrame に変換し、Snowflakeテーブルで表示できるため、コンテキストを切り替えずにモデリング、変換、分析を続けることができます。
Snowpark Python DB-API を使用した外部ソースからのデータの読み取り¶
標準のPython DB-API 2.0ドライバーを使用して、外部データベース(SQL サーバー、Oracle、 PostgreSQL、 MySQL、Databricks)からSnowpark DataFrame に直接データを取り出します。Snowpark Python DB-API は、クライアント(「ローカル」モード)から、またはSnowflake内でストアドプロシージャまたはノートブック(外部アクセス統合を使用)を使用して実行できます。結果は、結合、変換し、Snowflakeテーブルに書き込める他の DataFrame と同じように動作します。詳細については、 Snowpark Python DB-APIの使用 をご参照ください。
Snowpark Python JDBC を使用した外部ソースからのデータの読み取り¶
提供されている標準 JDBC ドライバーを使用して、外部データベースからデータを直接Snowpark DataFrame に取得します。Snowpark Python JDBC は、ストアドプロシージャまたはノートブックを使用して、クライアントから、またはSnowflake内で実行できます。UDTF は、ターゲットデータを取り込むために作成されました。結果は、Snowflakeテーブルへの結合、変換、書き込みに使用できる他の DataFrame と同じように動作します。詳細については、 Snowpark Python JDBC の使用 をご覧ください。
注釈
この機能を使用するには、 JDBC ドライバーをステージにアップロードし、外部アクセス統合を構成して、Snowflakeがソースエンドポイントに到達できることを確認します。
Snowpark XMLRowTag リーダーを使用した XML ファイルからのデータの読み取り¶
Snowpark XML を使用して大規模なステージングされた XML ファイルを効率的に読み取ります。リーダーは rowTag でファイルを分割し、各一致を1行としてロードし、子要素を VARIANT 列にマッピング(ネストされた構造を保持)するので、Snowparkまたは SQL で直ちにクエリできます。また、各行を PERMISSIVE ( _corrupt_record で無効な行を隔離)または FAILFAST 動作を持つ XSD で検証できます。出力は、変換してテーブルに保存できる標準 DataFrame です。詳細については、 Using the Snowpark XML RowTag Reader をご参照ください。