๐Ÿง‘โ€๐ŸณYouPrepโ„ข Native SQL

Overview

YouPrepโ„ข Native SQL is our powerful option that allows to leverage all the power of your Datawarehouse or database, by delegating YouPrep transformation steps directly to your datasource.

How does it work? We translate your transformation pipeline made with YouPrep directly into one SQL statement. It's very powerful, specially when you must deal with a lot of data within your tables.

The NativeSQL option is available for several connectors:

  • Athena

  • BigQuery

  • PostgreSQL

  • Redshift

  • Snowflake

Step coverage

Find below the availability of YouPrep steps under Native SQL:

Step
PostgreSQL
Snowflake
Redshift
BigQuery
Athena

Add text column

โœ…

โœ…

โœ…

โœ…

โœ…

Add total rows

โŒ

โŒ

โŒ

โŒ

โŒ

Aggregate

โœ…

โœ…

โœ…

โœ…

โœ…

Append

โŒ

โŒ

โŒ

โŒ

โŒ

Compare text columns

โœ…

โœ…

โœ…

โœ…

โœ…

Argmax

โœ…

โœ…

โœ…

โœ…

โœ…

Argmin

โœ…

โœ…

โœ…

โœ…

โœ…

Concatenate columns

โœ…

โœ…

โœ…

โœ…

โœ…

Convert

โœ…

โœ…

โœ…

โœ…

โœ…

Convert date to text

โœ…

โœ…

โœ…

โœ…

โœ…

Convert text to date

โœ…

โœ…

โœ…

โœ…

โœ…

Cumulated sum

โœ…

โœ…

โœ…

โœ…

โœ…

Delete columns

โœ…

โœ…

โœ…

โœ…

โœ…

Geographically Disolve

โŒ

โŒ

โŒ

โŒ

โŒ

Duplicate

โœ…

โœ…

โœ…

โœ…

โœ…

Duration

โœ…

โœ…

โœ…

โœ…

โœ…

Evolution

โœ…

โœ…

โœ…

โœ…

โœ…

Extract date information

โœ…

โœ…

โœ…

โœ…

โœ…

Extract substring

โœ…

โœ…

โœ…

โœ…

โœ…

Fill null

โœ…

โœ…

โœ…

โœ…

โœ…

Filter

โœ…

โœ…

โœ…

โœ…

โœ…

Formula

โœ…

โœ…

โœ…

โœ…

โœ…

Geographical hierarchy

โŒ

โŒ

โŒ

โŒ

โŒ

Get unique group(s) / value(s)

โœ…

โœ…

โœ…

โœ…

โœ…

Hierarchical rollup

โŒ

โŒ

โŒ

โŒ

โŒ

IfThenElse

โœ…

โœ…

โœ…

โœ…

โœ…

Join

โŒ

โŒ

โŒ

โŒ

โŒ

Keep column(s)

โœ…

โœ…

โœ…

โœ…

โœ…

Moving average

โŒ

โŒ

โŒ

โŒ

โŒ

Percentage

โœ…

โœ…

โœ…

โœ…

โœ…

Pivot

โŒ

โŒ

โŒ

โŒ

โŒ

Rank

โœ…

โœ…

โœ…

โœ…

โœ…

Rename

โœ…

โœ…

โœ…

โœ…

โœ…

Replace

โœ…

โœ…

โœ…

โœ…

โœ…

Geographical Simplification

โŒ

โŒ

โŒ

โŒ

โŒ

Sort

โœ…

โœ…

โœ…

โœ…

โœ…

Split column

โœ…

โœ…

โœ…

โœ…

โœ…

Columns statistics

โŒ

โŒ

โŒ

โŒ

โŒ

To lowercase

โœ…

โœ…

โœ…

โœ…

โœ…

To Uppercase

โœ…

โœ…

โœ…

โœ…

โœ…

Top N rows

โœ…

โœ…

โœ…

โœ…

โœ…

Unpivot

โœ…

โœ…

โœ…

โœ…

โœ…

Waterfall

โŒ

โŒ

โŒ

โŒ

โŒ

Hybrid Pipeline

To address the issues caused by the lack of support of some steps, we have implemented a hybrid pipeline approach.

This means you can have a unique pipeline mixing NativeSQL supported steps and unsupported steps. All transformation steps can be executed regardless of context, with the flexibility to execute the pipeline partially in NativeSQL and partially in Toucan, depending on the steps utilized.

NativeSQL steps are executed first whenever possible. An unsupported step causes the Toucan engine to take over the pipeline.

This feature is only available for datasets connected to Snowflake, Google Big Query, AWS Redshift, AWS Athena, PostgreSQL

How to activate the NativeSQL option

This option is activated by default on Toucan.

Warning

This option is activated at the instance level, which means that it will be applied for all your Apps.

Some limitations

Note

Data transformation made with YouPrep on columns must be explicit (on a precise column). It's not possible to make a data transformation step on a non-predefined column (for example by referring to the column though the usage of a variable).

Last updated