Kategoriska variabla egenskaper och exempel
- 2743
- 244
- PhD. Emil Svensson
De kategorisk variabel Det är den som används i statistik för att tilldela en icke-numerisk eller kvalitativ egenskap eller egendom till ett objekt, individ, enhet, tillstånd eller förfarande. Det är möjligt att definiera alla typer av kategoriska variabler efter varje behov.
Exempel på kategoriska variabler är: färg, kön, blodgrupp, civilstånd, typ av material, betalningsform eller typ av bankkonto och används mycket dagligen.
Bild 1: Färg är en kategorisk variabel. Källa: PixabayOvanstående är variablerna, men deras möjliga värden är kvalitativa, det vill säga kvalitet eller karakteristiska och inte om en numerisk mätning. Till exempel de möjliga värdena för variabeln sex är: manlig , hTrängsel.
När denna variabel lagras i ett datorprogram kan den deklareras som en textvariabel och de enda accepterade värdena kommer att utses: Manlig , Kvinna.
Men samma variabel sex kan förklaras och lagras som ett heltal om Manlig tilldelas 1 redan Kvinna Värdet tilldelas 2. Det är av denna anledning som kategoriska variabler ibland kallas den listade typen.
Det huvudsakliga kännetecknet för kategoriska variabler är att till skillnad från andra variabler, till exempel kontinuerligt och diskret, är det inte möjligt att göra aritmetik med dem. Statistik kan dock göras med dem, vilket kommer att ses senare.
[TOC]
Exempel
Notera följande exempel på kategoriska variabler och deras möjliga värden:
-Blod typ, Värdenområde: A, B, AB eller
-Civilstatus, Kategoriska värden: Enda (TILL), Gift (B), Änkling (C) , Skild (D).
-Typ av material, Kategorier eller värden: 1 = trä, 2 = metall, 3 = plast
-Sätt att betala, Värden eller kategorier: (1) kontanter, (2) debet, (3) överföring, (4) kredit
Kan tjäna dig: Tesla spole: historia, hur det fungerar, vad är det förI de föregående exemplen har ett nummer associerats med varje kategori på ett helt godtyckligt sätt.
Det kan då tänkas att denna godtyckliga numeriska förening gör det motsvarande en diskret kvantitativ variabel, Men det är inte eftersom aritmetiska operationer inte kan göras med dessa siffror.
För att illustrera idén i variabeln Sätt att betala, SUM -operationen har ingen mening:
(1) effektiv + (2) debitering kommer aldrig att motsvara (3) överföring
Klassificering av kategoriska variabler
Klassificeringen är baserad på huruvida de har en implicit hierarki eller om antalet möjliga resultat är mer än två eller två.
En kategorisk variabel med ett enda möjligt resultat är inte en variabel, den är en kategorisk konstant.
Nominell kategorisk
När de inte kan representeras av ett nummer eller har någon beställning. Till exempel variabeln: Typ_de_material, tnominella värden (Trä, metall, plast), de har ingen hierarki eller ordning, även när ett godtyckligt nummer tilldelas varje svar eller kategori.
Ordinarie kategorisk
Variabel: Studieresultat
Nominella värden: Hög, medium, låg
Även om värdena på denna variabel inte är numerisk, har de en beställning eller hierarki implicit.
Binär kategorisk
Dessa är nominella variabler med två möjliga svar, till exempel:
-Variabel: Svar
-Nominella värden: SANN, Falsk
Observera att variabeln Svar Det innebär inte en hierarki och har bara två möjliga resultat, så det är en binär kategorisk variabel.
Vissa författare kallar den här typen binärvariabel, Och de anser inte att det tillhör kategoriska variabler som är begränsade till de med mer än tre möjliga kategorier.
Statistik med kategoriska variabler
Statistik kan göras med kategoriska variabler, trots att de inte är numeriska eller kvantitativa variabler. För att känna till den mest troliga trenden eller värdet på en kategorisk variabel tas den Mode.
Det kan tjäna dig: astroclymics: historia, vilka studier, grenarMode Det är i detta fall det mest upprepade resultatet eller värdet på en kategorisk variabel. I kategoriska variabler är det inte möjligt att beräkna varken medelvärdet eller medianen.
Genomsnittet kan inte beräknas eftersom det inte kan göras aritmetik med kategoriska variabler. Varken medianen, eftersom de kvantitativa eller kategoriska variablerna inte har en ordning eller hierarki, så det är inte möjligt att bestämma ett centralt värde.
Grafisk representation av kategoriska variabler
Med tanke på en viss kategorisk variabel kan du hitta frekvensen eller antalet gånger ett resultat av den variabeln upprepas. Om detta görs för varje resultat kan en frekvensgraf göras beroende på varje kategori eller resultat.
Här är några exempel på hur kategoriska variabler kan representeras grafiskt.
Löst övningar
Övning 1
Ett företag har data från 170 anställda. En av variablerna som finns i dessa poster är: Civilstatus. Denna variabel har fyra möjliga kategorier eller värden:
Enda (TILL), Gift (B), Änkling (C) , Skild (D).
Även om det är en variabel som inte är nummare är det möjligt att veta hur många av de totala posterna som finns i en viss kategori och representeras i form av ett stapeldiagram, som visas i följande figur:
figur 2. Representation av resultaten från en kategorisk variabel. Källa: SjälvgjordExempel 2
En skobutik har en rekord av sin försäljning. Bland variablerna som hanterar deras poster är skofärgen för varje modell. Variabeln:
Color_zapato_modelo_aw3
Det är kategoriskt och har fem möjliga kategorier eller värden. För varje kategori av den variabeln är antalet försäljning sammanställt och procentandelen av samma upprättas. Resultaten presenteras i grafen för följande figur:
Kan tjäna dig: elektriska egenskaper hos material Figur 3. Kategorisk variabel färg _ zapato. På detta variabla sätt är vitt. Källa: Självgjord.Det kan sägas då från AW3 -skosodellen som är av mode, Det mest sålda är Vit, följt noggrant av Svart.
Det kan också sägas att 70% sannolikhet nästa sko som säljs av denna modell kommer att vara Vit antingen Svart.
Denna information kan vara användbar för butiken när man gör nya beställningar, eller kan till och med tillämpa rabatter på de minst sålda färgerna för överskott av inventering.
Exempel 3
För en viss befolkning av blodgivare vill vi representera antalet personer som tillhör en viss blodgrupp. Ett grafiskt sätt att visualisera resultaten är genom ett piktogram, som är i bakgrunden en tabell.
I den första kolumnen är variabeln representerad Blod typ och dess möjliga resultat eller kategorier. Den andra kolumnen har representationen på ett ikoniskt eller bildligt sätt för antalet personer i varje kategori. I vårt exempel används en röd droppe som en ikon, som var och en representerar 10 personer.
Figur 4. Piktogram. Källa: SjälvgjordReferenser
- Khan akademin. Analysera kategoriska data. Återhämtat sig från: Khanacademy.org
- Universumsformler. Kvalvariabel. Hämtad från: Univesformulas.com
- Minitab. Som är kategoriska, diskreta och kontinuerliga variabler. Återhämtat sig från: stöd.Minitab.com
- Excel -handledning. Karakterisering av variabler. Återhämtat sig från: hjälp.Xlslat.com.
- Wikipedia. Statistisk variabel. Återhämtat sig från Wikipedia.com
- Wikipedia. Kategorisk variabel. Återhämtat sig från Wikipedia.com
- Wikipedia. Variabel kategorisk. Återhämtat sig från Wikipedia.com