Binnen Tableau kun je berekeningen uitvoeren op geaggregeerde velden, maar ook op niet-geaggregeerde velden. Het is belangrijk om het verschil tussen deze twee te begrijpen. Het antwoord dat je probeert te krijgen is misschien niet precies wat je zoekt. Als je de fout maakt om de andere methode te gebruiken. In deze blog zal ik uitleggen wat ik bedoel met geaggregeerde en niet-geaggregeerde velden. Daarna leg ik het verschil uit aan de hand van een voorbeeld.
Bij het uitvoeren van analyses zal Tableau standaard automatisch je velden aggregeren of disaggregeren op basis van hoe je ze in je weergave plaatst. We hebben allemaal het veld "Verkoop" zien veranderen in SUM(Verkoop) wanneer we het bijvoorbeeld op de rijplank plaatsen. Dat is een soort aggregatie. Aggregaties maken een samenvatting van je gegevens mogelijk, wat de waarde van de informatie verhoogt door je gegevens voor te bereiden om te worden bekeken in visualisaties. Waar Tableau in uitblinkt.
Zowel metingen als dimensies kunnen worden geaggregeerd, maar meestal worden metingen geaggregeerd. Maatregelen worden automatisch geaggregeerd wanneer ze in de weergave worden gezet. Een van de manieren om de aggregatie van een veld te wijzigen, is door met de rechtermuisknop op een pil in de weergave te klikken en van daaruit de aggregatie te wijzigen. Standaard is de aggregatie SUM. Er bestaan echter verschillende soorten aggregaties voor maatregelen:
Aggregaties bestaan ook voor dimensies, maar ze zijn beperkter in vergelijking met maatregelen:
Zie voor meer informatie over aggregaties de Helpdocumentatie over Gegevensaggregatie in Tableau.
Het is mogelijk om de aggregatie van uw velden te wijzigen vanuit het gegevensvenster of vanuit de schappen waarin uw velden staan. Aggregaties kunnen echter ook worden geconfigureerd als berekende velden. Door berekende velden te gebruiken, kan de gebruiker zijn eigen gegevens creëren op een manier die niet wordt geleverd door de gegevensbron zelf. Daarom biedt het de mogelijkheid om de manier van aggregeren te veranderen bij het combineren van velden.
Stel bijvoorbeeld dat ik Winst en Verkoop in mijn gegevensbron heb en ik wil een verhouding tussen winst en verkoop maken. Hiervoor moet ik een berekend veld maken. Het is echter heel belangrijk om te definiëren wat ik precies wil zien in deze berekening. En dat hangt af van het gebruik van geaggregeerde of niet-geaggregeerde velden in mijn berekening.
In het voorbeeld van de winst/omzetverhouding kan de berekening op twee manieren worden geschreven die tot totaal verschillende resultaten zullen leiden. De eerste is met een SUM rond elk veld, zoals hieronder:
Of zonder aggregatie als volgt:
Om het verschil te begrijpen, is het belangrijk om te begrijpen hoe Tableau deze twee berekeningen interpreteert. In het eerste voorbeeld telt Tableau alle winst- en verkoopwaarden van elke rij bij elkaar op en deelt ze door elkaar. Dit resulteert in een vooraf geaggregeerd veld. Daarom zal de pil, wanneer dit nieuw gecreëerde veld op de weergave wordt geplaatst, een AGG() om het veld heen hebben. Afhankelijk van je dimensies in de weergave, zal de berekening zo veranderen dat alleen de leden van die dimensie worden meegenomen. In het onderstaande voorbeeld wordt deze berekening gebruikt voor het veld subcategorie:
Je kunt zien dat de getallen correct lijken. Ze blijven allemaal binnen het verhoudingsbereik. Als ik echter hetzelfde voorbeeld gebruik met de berekening zonder aggregatie, krijg ik de volgende andere resultaten:
Het resultaat klopt absoluut niet. Als je merkt dat ik in plaats van AGG de standaard SUM-aggregatie krijg voor mijn niet-geaggregeerde berekening. Dat komt omdat Tableau dat veld automatisch heeft geaggregeerd zodra het in de weergave is geplaatst. Het ligt in de aard van Tableau om te aggregeren.
Wat het niet-geaggregeerde veld doet, is dat Tableau voor elke rij de verhouding tussen winst en verkoop berekent en die waarde opslaat. En aan het einde worden in dit geval alle berekende waarden bij elkaar opgeteld. Als we van dit winstratioveld een dimensie maken in plaats van een maatregel, is het logischer hoe het wordt gedaan:
Voor elk product in de subcategorieën wordt de winstverhouding afzonderlijk berekend. Wat Tableau deed was het optellen van al deze individueel berekende waarden aan het einde. Voor het voorbeeld van de berekening van de winstverhouding moet de berekening daarom worden gemaakt met geaggregeerde velden.
Bezoek onze site The Information Lab NL voor meer blogposts, training en consultancy met betrekking tot Tableau, Alteryx en Snowflake.