Utilisation de Snowpark pour lire des données¶
Que vos données se trouvent dans des bases de données opérationnelles ou qu’elles arrivent sous forme de fichiers, Snowpark vous offre un moyen simple et axé sur Python de les extraire, de les convertir en DataFrame et de les afficher dans des tables Snowflake, afin que vous puissiez continuer à modéliser, transformer et analyser sans avoir à changer de contexte.
Lecture de données provenant de sources externes à l’aide de Snowpark Python DB-API¶
Utilisez les pilotes Python DB-API 2.0 standard pour extraire des données de bases de données externes (SQL Server, Oracle, PostgreSQL, MySQL, Databricks) directement dans un DataFrame Snowpark. Snowpark Python DB-API peut être exécuté à partir de votre client (mode « local ») ou à l’intérieur de Snowflake à l’aide de procédures stockées ou de notebooks (avec intégration d’accès externe). Le résultat se comporte comme n’importe quel autre DataFrame que vous pouvez utiliser pour joindre, transformer et écrire dans des tables Snowflake. Pour plus d’informations, voir Utilisation de DB-API Snowpark Python.
Lecture de données provenant de sources externes à l’aide de Snowpark Python JDBC¶
Utilisez les pilotes JDBC standard que vous fournissez pour extraire des données de bases de données externes directement dans un DataFrame Snowpark. Snowpark Python JDBC peut s’exécuter depuis votre client ou dans Snowflake à l’aide de procédures stockées ou de notebooks. Une UDTF est créée pour ingérer vos données cibles. Le résultat se comporte comme n’importe quel autre DataFrame que vous pouvez utiliser pour joindre, transformer et écrire dans des tables Snowflake. Pou plus d’informations, voir Utilisation de l’API JDBC de Snowpark Python.
Note
Pour utiliser cette fonctionnalité, chargez le pilote JDBC dans une zone de préparation, configurez une intégration d’accès externe et assurez-vous que Snowflake peut atteindre le point de terminaison source.
Lecture de données provenant de fichiers XML utilisant le lecteur Snowpark XML RowTag¶
Utilisez Snowpark XML pour lire efficacement les fichiers XML volumineux en zone de préparation : le lecteur divise le fichier sur rowTag, charge chaque correspondance sous la forme d’une seule ligne, et mappe les éléments enfants dans des colonnes VARIANT (structure imbriquée préservée) pour une interrogation immédiate avec Snowpark ou SQL. Vous pouvez également valider chaque ligne par rapport à un XSD avec un comportement PERMISSIVE (mise en quarantaine des lignes non valides dans _corrupt_record) ou FAILFAST. La sortie est un DataFrame standard que vous pouvez transformer et enregistrer dans des tables. Pour plus d’informations, voir Using the Snowpark XML RowTag Reader.