Data-analyse WK

In onze klas taak voor de studierichting netwerkeconomie, hebben Christian en ik ons gericht op de data in verband met het WK sinds 1930. We hebben voornamelijk gekeken naar het aantal matchen per WK en het totaal aantal bezoekers per WK. Onze taak was om deze data te analyseren en verbanden te ontdekken tussen deze twee variabelen met Knime bij deze samenwerking hebben we gebruik gemaakt van Discord om elkaars scherm te delen en bestanden door te sturen. Hierbij hebben we ook een aantal economische aspecten erbij genomen om er iets nuttigs uit te halen.

Het was onze taak om data te analyseren van alle Wereldkampioenschappen sinds 1930. Dit omvatte informatie over het aantal matchen die werden gespeeld en het totale aantal bezoekers voor elk WK. We wilden begrijpen of er een verband bestond tussen het aantal matchen en het aantal bezoekers en hoe deze variabelen zich in de loop der tijd hebben ontwikkeld. Dit zou ons in staat stellen om beter te begrijpen hoe grote evenementen zoals het WK een economische impact kunnen hebben.

We hebben als taak gekozen om deze data van het WK sinds 1930 te analyseren en te ontdekken of er een verband bestaat tussen het aantal matchen en het aantal bezoekers. We wilden ook bepalen hoe deze variabelen zich in de loop der tijd hebben ontwikkeld en of er trends zijn die zich in de data voordoen.

Als eerste hebben we in Knime de data gezet in een CSV-reader, dan hebben we een statistiek node gekozen, verbonden met de reader en uitgevoerd voor een univariate analyse. Daarin staat er dat de gemiddelde bezoekers van alle jaren 1 997 124 is en het gemiddelde aantal matches is 44.  Daarin staat er ook dat Skewness -0,05 is. Dat betekent dat de waarde van de variabelen aan de rechterkant meer zal zijn op de grafiek dan links. Bij de matches is het -0,15 dus ook meer aan de rechterkant.

 

Daarna hebben we een linear correlation node gebruikt en verbonden met de csv-reader. Daaruit hebben we afgeleid dat de correlation value 0,9 is dus dat betekent dat de trend line een sterke correlatie aantoont. Nadien hebben we de scatter plot node uitgevoerd en verbonden, daarin zie je een grafiek waar puntjes op staan die de variabelen voorstellen. Aan de hand van de grafiek zie je als de hoeveelheid matchen verhoogt dat het aantal bezoekers ook verhoogt.

We hebben gebruik gemaakt van de node linear regression, dit wordt gebruikt om de data te voorspellen op basis van vooraf gekende statistieken. In dit geval hebben we de bezoekers als target genomen en de coëfficiënt is 58 569,081 dus het aantal bezoekers zal een stijging kennen volgens de voorspelling.

We hebben ook een histogram node verbonden en uitgevoerd met als binning kolom matches. Daarin zie je dat naarmate de matchen verhogen ook de aantal gemiddelde bezoekers sterk verhogen. Tenslotte hebben we gebruik gemaakt van de box plot node en bij het aantal bezoekers is het laagste getal 363.000, bij het eerste kwartiel 893.172, de mediaan is 1.987.738, het derde kwartiel 3.031.768 en het grootste getal is 3.587.538. Bij de matchen is het kleinste getal 17, het eerste kwartiel 32, de mediaan is 45, en het grootste getal is 64. Hieruit kun je waarnemen dat het aantal matchen naarmate tijd meer zijn gestegen, in de data hadden wel de laatste 7 Wereld Kampioenschappen 64 matchen.

Dat was mijn opdracht voor data-analyse en hieruit kon worden afgeleid dat het aantal matchen sterk is toegenomen in de loop der tijd, met de laatste 7 Wereld Kampioenschappen die 64 matchen telde. Deze analyse geeft ons ook een beeld van hoe grote evenementen zoals het WK een economische impact kunnen hebben. Dit kan nuttig zijn voor toekomstige organisatoren van WK’s en andere grote evenementen om een beter begrip te krijgen van de economische impact en om de juiste beslissingen te nemen in verband met de organisatie van het evenement. Ons gebruik van Discord was ook succesvol, het is een zeer eenvoudig en effectieve tool om bij samenwerkingen gebruik van te maken.

Laat een reactie achter

Uw e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *