Retour

Faire un classement depuis un Job ETL Talend

Temps de lecture : 2 minutes

Dans ce tutoriel vous apprendrez à faire un classement dans un Job ETL Talend en utilisant le composant tSortRow.

Prérequis :

  • Avoir installé le Studio Talend, la partie ETL (Extract Transform Load) des solutions Talend.
  • Si connecté au Cloud Talend depuis le Studio Talend, il faut que l’utilisateur soit muni d’un rôle « Integration Developer » avec ses autorisations par défaut.
  • L’application gratuite Talend Open Studio for Data Integration est suffisante pour ce tutoriel.
  • Avoir étudié les tutoriels suivants : Agréger des données dans un Job Talend et ses tutoriels dépendants.

Composants ETL utilisés dans le traitement :

  • Composants d’extraction ou chargement : tFileInputDelimited et tFileOutputDelimited .
  • Composants de transformation : tAggregateRow, tSortRow.
  • Composants de médiation : Aucun.
  • Composants d’affichage : Aucun.

Contexte :

Vous disposez d’un fichier VENTES.csv indiquant sur une année les données de vente par magasin et par produit :

Vous souhaitez classer les produits pour afficher en premier ceux qui ont les meilleures chiffres de vente tout magasin confondus.

Solution :

Reprenez le Job développé dans le tutoriel Agréger des données dans un Job Talend puis supprimez le lien avec le composant cible, ajoutez un composant tSortRow depuis la palette de composants et liez le par des liens principaux puis cliquez sur le tSortRow et allez dans la vue Composant :

Allez dans les paramètres simples de la vue Composant puis ouvrez le schéma. Mappez les colonnes PRODUIT et VENDUS vers le schéma de sortie puis cliquez sur OK. Ajoutez la colonnes VENDUS en tant que critère de tri puis indiquez que le tri est numérique et décroissant (Ordre DESC) :

Allez dans la vue Exécuter puis lancez l’exécution de votre Job et vérifiez qu’il se termine sans erreur :

Les produits ont été classés dans l’ordre décroissant du nombre de leur vente tout magasin confondus :

Vous savez désormais comment faire un classement dans un Job ETL Talend en utilisant le composant tSortRow.

Laisser un commentaire

Il n'y a pas de commentaires pour le moment. Soyez le premier à participer !