Een histogram maken in Excel: VAN versus TOT

Een histogram is “de grafische weergave van de frequentieverdeling van in klassen gegroepeerde data” (Histogram – Wikipedia). Er zijn verschillende manieren om zo’n histogram te maken in Excel, en ik wil wijzen op een mogelijke valstrik.

  • Bij wat volgt wil ik het histogram uitsluiten dat deel uitmaakt van het Analysis Toolpak (Een histogram maken – Office-ondersteuning) omdat het resultaat statisch is. Je moet het histogram opnieuw maken om het aan te passen aan nieuwe of gewijzigde gegevens. Straks meer.
  • De functie AANTAL.ALS kan tellen hoe dikwijls een waarde voorkomt in een reeks waarden – maar alleen die exacte waarde.
  • Een eerste oplossing is de waarden af te ronden. Zie de fiche die ik daar aan gewijd heb. Nadeel is dat de afronding gelijkmatig is (dus alle categoriëen even breed). En dat de afronding verkeerd loopt als ze niet correct is gedaan. De rubrieken mogen bv. zijn 0-10, 10-20, 20-30, … maar niet 0-5, 5-15, 15-25 enz.
    Na de afronding kan men tellen met AANTAL.ALS.
  • Een tweede oplossing is de functie INTERVAL. Zie de fiche die ik daar aan gewijd heb.
  • Maar er is een probleem dat ik wil illustreren aan de hand van een voorbeeld: een lijst van examenresultaten, waarvan wij willen weten hoe dikwijls al die waarden voorkomen.
    scores
    10
    14
    15
    17
    13
    9
    6

    Als we die waarden tellen met INTERVAL krijgen we

    grenswaarden hoeveel
    0 0
    8 1
    10 2
    14 2
    16 1
    18 1
    20 0

    Echter: die aantallen kloppen niet. De zes wordt geteld bij de rubriek van de 8 – en wel omdat de berekening die gemaakt wordt, betekent
    tot … hebben we er …
    terwijl we gewoon zijn een histogram te begrijpen als
    van … hebben we er...

    grenswaarden hoeveel
    0 1
    8 1
    10 2
    14 2
    16 1
    18 0
    20 0
  • Dat heb ik uitgewerkt in dit werkblad. En het gaat zo:
    • een lijst maken met de opeenvolgende grenswaarden
    • een hulpkolom voorzien waarin we afronden naar de lager gelegen grenswaarde:
      =VERT.ZOEKEN(A2;$G$2:$G$8;1)
    • nadien tellen hoe dikwijls de afgeronde waarden voorkomen.
      =AANTAL.ALS(B:B;G2)
  • Een alternatieve benadering is werken met codes. Dat heb ik uitgewerkt in een voorbeeld met postcodes, die het voordeel hebben dat de mensen er zicht direct kunnen in herkennen – en dat het dus direct zichtbaar is dat het resultaat niet altijd is wat men verwacht.
  • De geïnteresseerde lezer vindt hier een Excel template die de telling doet.
jul 3, 2021 @ 8:42 pm