Diagram är ett verktyg för att visuellt visa egenskaper datamängder . Detta ger ett sätt att snabbt sammanfatta datamängder som kan innefatta tusentals enskilda poster. En sådan kurva förmedlar exakt hur ofta ett visst datavärde , exempelvis i åldrarna tillfrågade , inträffade i datamängden . Många kalkylprogram kommer med funktioner för att skapa den här typen av diagram , som kallas ett histogram , från data i ett kalkylblad . Syfte
histogramfunktionen i kalkylprogram skapar ett diagram som visar data i ett format som liknar ett stapeldiagram . Men varje stapel i ett histogram diagram hur många gånger en viss uppsättning siffror inträffade i en datamängd . Varje uppsättning av dessa nummer kallas " bin , " och kalkylblad användare kan bestämma storleken på varje fack . Till exempel kan den första baren visar förekomsten av siffrorna ett till tio , kan den andra bin vara 11 till 40 och den tredje bin kan vara 41 till 100 . Bin intervall , eller storlekar , visas under varje fack och helt upp till användaren att histogrammet . Göra ett histogram
kalkylblad histogram funktioner fungerar på ett liknande sätt
till andra funktioner kalkylprogram grafritande : användaren klickar och drar över en datamängd för att välja siffror han vill att histogrammet grafen . Användaren klickar sedan på lämpligt menyalternativ för att skapa ett histogram . Till exempel i Excel användaren skulle klicka på " Data " fliken , klicka sedan på " Data Analysis ", klicka sedan på " Histogram " i analysen verktygslådan .
Använder
en användare kan skapa histogram för att tjäna flera syften . För forskare som behöver deras data vara normalfördelad för att köra statistiska analysmetoder på datamängden , skapar ett histogram kan visa fördelningen av uppgifterna för att säkerställa att det inte är alltför skev . Användare finjustera storleken , eller intervall , i varje fack för att visa information av särskilt intresse , såsom åldersfördelning av de tillfrågade i en datamängd .
Begränsningar
En begränsning hos histogrammen är det så det visar data är beroende av det sätt på vilket användaren definierar bin storlekar. För att använda exemplet visa data om ålder demografi , en hög förekomst av " 18-24 " betyder bara att summan av 18 till 24 -åringar är hög . Även om detta kan visuellt föreslå stort antal varje grupp representerad i papperskorgen , kan det dolde det faktum att det finns ett mycket stort antal 20-24 åringar och endast några tonåringar .