1. félév

A próbafüggvények és típusai

0
Share

Statisztika, 16. tétel, pszichológia távoktatás

A próbafüggvények és típusai

(leírás, magyarázat)

Berei Kati által kidolgozva

Próbafüggvény

–   A hipotézisek vizsgálatára hasznájunk

–    mintáról mintára ingadozó jellemzők (vagyis a sokaságból vett minták megfelelő értékei nem véletlenszerűen, hanem függvényszerűen változnak)

–   A próbafüggvényt úgy kell megválasztani, hogy

–   a sokaságra tett bizonyos kikötések teljesüljenek

–   a mintavétel adott módja és nagysága szerint

–   feltételezzük a H0 helyességét

–   ismert kell legyen a függvény valószínűségeloszlása: ehhez a H0 egyszerű hipotézis kell legyen.

Próbák lehetnek:

–   egymintás próbák – olyan próbák, melyek elvégzéséhez elégséges egyetlen minta

–   egymástól független minták vagy ún. páros minták lehetnek – amikor két vagy több minta szükséges, melyekről feltételezzük fel, hogy különböző sokaságokból származnak.

A HIPOTÉZISVIZSGÁLAT SORÁN HASZNÁLT PRÓBAFÜGGVÉNYEK

  1. Standard normális eloszlás

–                a sokaságok egy jó része normális eloszlású – ezek próbafüggvényeit általában a standard (normális) eloszlás sűrűségfüggvényével írhatjuk le (ennek jellegzetes értékei táblázatban vannak, nincs szabad paraméter)

A leggyakoribb szignifikanciaszintekhez tartozó z-értékek:

szignifikanciaszint   α

%

0,10

10%

0,05

5%

0,01

1%

egyoldali próba jobb oldali -1,28 -1,6545 -2,33
baloldali 1,28 1,6545 2,33
kétoldali próba ± 1,6545 ± 1,96 ± 2,58

Azért, hogy ne kelljen állandóan behelyettesítgetni a normál eloszlás sűrűségfüggvényébe az értékeket – standardizálták, vagyis megfosztották a mértékegységtől:

Standard érték

Standard érték

z – standard érték

x – függő változó

μ – átlag

σ – szórás

–          a standard z érték egy egységnyi szórásnak felel meg

–          a várt érték 0,

–          egy adott z értékhez tartozó görbe alatti területek értékét táblázatba foglalták – ezeket megkapjuk vizsgán (ez a 3-as táblázat minden statisztikakönyv végén)

Standardizálás 1 példa

Egy diákcsoport IQ-átlaga 110, szórása pedig 15 pont volt. Határozza meg a 125, illetve a 90 pontú hallgató standard eredményét, s helyzetét!

standard-ertek zpelda50+34,13% Nálánál gyengébb vagy azonos eredményt 84,13% ért el.

zpleda-40,8 ~ 9% nálánál is gyengébb eredményt produkált.

Standardizálás 2 példa.

Egy diákcsoport tesztátlaga 50, szórása pedig 20 pont volt. Határozza meg a 70, illetve a 45 pontú hallgató standard eredményét, s helyzetét!

standard-ertek zpelda350+34,13% Nálánál gyengébb vagy azonos eredményt 84,13% ért el.

zpelda4-9,87%~ 40% nálánál is gyengébb eredményt produkált.

  1. Student féle t-eloszlás (sörgyári „megvilágosodás” ☺)

–         egy normális és egy c négyzet eloszlású változó transzformáltjának hányadosából származtatható

–         szimmetrikus a 0 pontra, a t-eloszlást egy paramétere, szabadságfok (ν) jellemzi.

–         A szabadságfok növekedésével, vagy nagy minták esetén (n >100) a t-eloszlás egyre közelít a standard normális eloszláshoz.

–          A Student-féle t-eloszlás táblázata a szabadságfok függvényében és a választott szignifikanciaszint szerint adja meg az elutasítási tartomány határát (értékeit megadják táblázatban vizsgán (a III. mellékletben vannak))

  1. Khi-négyzet eloszlás (más néven függetlenség ellenörzés)

Khi-négyzet-eloszlás

Khi-négyzet-eloszlás

–         a khi-négyzet eloszlás paramétere a szabadságfok

–          a görbe alatti területek egyaránt 1-gyel egyenlők, illetve a szabadságfok növekedésével az eloszlás mind jobban kezd hasonlítani a normális eloszláshoz

–          megadják táblázatban (IV melléklet) az eloszlás percentiliseit a szabadságfok függvényében.

–         ha a szabadságfok nagyobb mint 50, akkor a normális eloszlás táblázata is használható. (itt a tábla mérete a meghatározó!)

A c2 kétoldali 5%-os konfidenciahatárai tehát:

  1. Fisher féle F-eloszlás

–         A kétmintás próbák elemzésekor a két minta átlagainak különbsége mellett fontos a két minta varianciájának a vizsgálata is

–         Ha a sokaság (közel) normális eloszlású, akkor a belőle vett két-két minták varianciájának a hányadosa egy bonyolult újabb eloszlást eredményez.

–         Az V. Melléklet mutatja az F-eloszlás leggyakrabban használt, 95-ödik percentilis értékeit a minták szabadságfokának függvényében.

Meghatározás:

fischer-F-eloszlás,       ahol sa korrigált szórás, N a minták korrigált szórása

Amennyiben az F-eloszlást a statisztikai próbáknál a populációk varianciájának összehasonlítására kívánjuk felhasználni, az a nullhipotézisünk, hogy a két variancia megegyezik, azaz:

ilyenkor az F-eloszlás képlete tovább egyszerűsödik:

A tört képzésekor rendszeresen a nagyobb empirikus szórásnégyzetet jelöljük s12-el és azt osztjuk el az alacsonyabb értékű s22-vel.

A szabadságfok

–          Mind a t-, mind a c -négyzet kiszámításához a mintából kapott és bizonyos sokasági paraméterek szükségesek

–          szabadságfok (nű) kiszámításához: a mintanagyságból (N) levonjuk a mintából becsülni kívánt paraméterek (k) számát: ν = N–k.

–          A t-statisztika esetében az N számú elemből kiszámíthatjuk a mintaátlagot és -szórást.

–          c négyzetnél a mintából számítható annak szórása – a gyakorlatban a kontingenciatábla méretéből származtatjuk az eloszlás szabadságfokát.

(Kicsit sántító, de képszerű példa a szabadságfok fogalmára: 10 vendéget várunk, ezért kikészítünk 10 széket; az elsőként megérkező vendég választhat, melyik székre ül le. Még a kilencediknek érkező vendég is választhat a  szabadon levő két szék közül, de a tízedik vendégnek már nincs szabadság(fok)a a szék megválasztásában, hiszen már csak egyetlen egy üres.)

A mellékletekben kévő táblázatok az elektronikus konyvtárban a Statisztika ablak cím alatt vannak!

Megjegyzés: nem minden képet sikerült beszúrni… 🙁

Share

A hipotézisvizsgálatok során elkövethető hibák és a csökkentés lehetőségei

0
Share

Statisztika, 15. tétel, pszichológia távoktatás

A hipotézisvizsgálatok során elkövethető hibák és a csökkentés lehetőségei

(leírás, magyarázat)

Berei Kati által kidolgozva

–   Hipotézisvizsgálat – arra szolgál, hogy  mintavétel alapján megvizsgáljuk a sokaságra vonatkozó olyan feltevések helyességét

–    Döntési hiba – ha a hipotézisvizsgálat során igaznak fogadunk el egy valóságban nem igaz feltevést vagy elvetünk olyat, ami igaz – ez azért történhet meg, mert nem konkrét értékellel, hanem valószínűségekkel dolgozunk (ha valaminek kicsi a valószínűsége, attól még megtörténhet, s fordítva).

Az elsőfajú hiba

 

–   akkor fordul elő, ha a H0-hipotézist annak ellenére el utasítjuk, hogy az a valóságban helyes

–   oka: bár H0 null-hipotézis helyes, de az adott mintából számított próbafüggvény-érték mégis a kritikus tartományba esik.

–    Az első fajta hiba nagysága a szignifikanciaszinttel egyenlő.

A másodfajú hiba

–         H0-t elfogadjuk, pedig az valójában nem igaz

–         oka: H0 nem igaz, és a próbafüggvény mégis az elfogadási tartományba esik

–         a hiba elkövetésének valószínűsége β.

☻ Ha a két eloszlás várható értéke közt nagy a különbség, akkor a második fajta hiba egészen kicsi.

☻Ha a két eloszlás közel esik, akkor nagy a második típusú hiba.

☻Túl nagy minta esetén túlságosan kis különbségek is szignifikánssá válnak! (A szórások egyre szűkülnek – megszűnik a 2. típusú hiba)

Próba ereje: β = 1 – α

–         annak az eseménynek a valószínűsége, hogy nem követjük el a másodfajú hibát (nem fogadjuk el tévesen a null-hipotézist)

H0-t H0 a valóságban
igaz(H1 nem igaz) nem igaz(H1 igaz)
elvetjük elsőfajú hiba(α) helyes döntés(1-β)
nem vetjük el(elfogadjuk) helyes döntés(1-α) másodfajú hiba(β)

! Hogyan csökkenthetjük a hibalehetőségeket?

Az elsőfajú hibánál:

–   az elkövetési valószínűség α , ennek alkalmas megválasztásával a hiba tetszés szerint korlátozható.

A másodfajú hibánál

–   adott szignifikancia-szint és egyszerű alternatív hipotézis esetén a másodfajú hiba elkövetésének valószínűsége a mintanagyság növelésével vagy minél kisebb szórású próbafüggvény használatával mérsékelhető.

Share

Hipotézisvizsgálatok

0
Share

Statisztika, 14. tétel, pszichológia távoktatás

Hipotézisvizsgálatok

(leírás, magyarázat)

Berei Kati által kidolgozva

–    statisztikai döntés – amikor mintákból a sokaságra vonatkozó hipotéziseinket vizsgáljuk, s eldöntjük azok helyességét, vagy helytelenségét

–    A sokaságról gyakran nincs elégséges mennyiségű adatunk (a sokaság végtelen – a pszichológiai vizsgálatok egy része ugyan véges sokaságon történik, de túl nagy elemszámmal, ám következtetéseit általánossá, minden emberre vonatkozóvá igyekszik formálni). Ilyenkor ugyancsak mintából kell következtetnünk a sokasággal kapcsolatos sejtésünk, hipotézisünk igazságáról.

Hipotézisvizsgálat:

–   arra szolgál, hogy egy (több) sokaságra vonatkozó olyan feltevések helyességét ellenőrizzük egy (több) minta adatai alapján, melyek helyességéről nem vagyunk teljes mértékben meggyőződve.

–   eszközei a próbák

–   hipotézis – a sokaság állapotára vonatkozó feltételezésünk

–   a hipotézisvizsgálat lényege: a minta adataiból kiszámítjuk egy ún. próbafüggvény értékét, és megnézzük hogy az egy előre kijelölt elfogadási tartományba, vagy egy másik tartományba, az ún. kritikus tartományba esik-e. Előbbi esetben elfogadjuk, utóbbiban pedig elvetjük a hipotézist.

A hipotézis megfogalmazása

–   a hipotézisvizsgálat legelső lépése.

–   a hipotézisünket ún. null-hipotézis formájában fogalmazzuk meg

–   egyúttal rögzítjük az azzal szemben álló, ún. alternatív hipotézist (ellenhipotézist).

–   Ezek közül azt fogjuk elfogadni, amelyik a mintavétel eredménye alapján nagyobb valószínűséggel rendelkezik.

Hipotézisünk lehet:

  1. egyszerű – ha fennállásának feltételezése a sokaság eloszlását egyértelműen meghatározottá teszi. Azt fogalmazzuk meg, hogy az ismeretlen sokasági jellemző (Q) megegyezik egy feltételezett értékkel (Q0) Þ H: Q=Q0
  2. összetett – mindig visszavezethető több egyszerű hipotézisre. Az ellenhipotézis (alternatív hipotézis) általában összetett. Egyenlőtlenséget fogalmazunk meg, azaz tartomány(oka)t jelölünk ki a paraméter valószínű értékére Pl.: H: Q >= Q0 vagy H: Q ¹ Q0

A két hipotézist oly módon kell megfogalmazni, hogy azok:

–     egyszerre ne lehessenek igazak;

–     akármelyik is a nagyobb valószínűséggel rendelkező, megválaszolható legyen a bennünket érdeklő kérdés.

A null-hipotézis (H0)

–    Mindig a null-hipotézis helyességéről, vagy helytelenségéről döntünk

egyszerű – a kísérleti beavatkozás nem okoz változást, a változás várható értéke 0) – vele szemben: alternatív hipotézis (H1) összetett

ha a H0 és a H1 kölcsönösen kizárják egymást, akkor a H0 – re vonatkozó döntés közvetetten mindig döntést jelent H1-re vonatkozóan is:

  • · a H0 elfogadása egyúttal H1 elvetése
  • · H0 elvetése egyben H1 elfogadása

Pl.1. Ha egy gyártó berendezést kívánunk ellenőrizni, hogy az elhasználódás során pontatlanná vált-e, akkor a null-hipotézist úgy fogalmazzuk meg, hogy a berendezés pontosan működik. Ha a mintából végzett próba azt valószínűsíti, hogy igen, akkor elfogadjuk a H0-t, ellenkező esetben elvetjük.

Pl.2. Ha a diákok úgy gondolják, hogy a vizsgatesztek nem egyforma nehézségűek voltak, ennek vizsgálatára szolgáló H0 az lesz, hogy nincs különbség a tesztek nehézsége között, az vizsgapontokban megmutatkozó különbségek csak a véletlennek tulajdoníthatók. Ha annak van nagyobb valószínűsége, hogy az A-teszt nehezebben megoldható, mint a B-teszt, akkor elvetjük a H0-t, s helyébe lép a H1, azaz, hogy a tesztek között eltérés valószínűsíthető.

Szignifikanciaszint

(szignifikáns = jelentéssel bíró) – illik a kísérlet elvégzése előtt rögzíteni!

–         az az αvalószínűség, ami már elég kicsi a H0 elvetéséhez

–         az a valószínűség:, amely

–       a hipotézis megengedő voltát igazolja

–       a feltevés helyességét valószínűsíti

–       amely értéknél a H0 való eltérés jelentős.

szignifikancia-szint

nem szignifikáns             szignifikáns különbség

–         a szignifikanciaszint általában 5% vagyis akkor vetjük el a null-hipotézist, ha 5%-nál kisebb a valószínűsége annak, hogy a statisztika ilyen értéket vegyen fel, mint a konkrét esetben.

Szignifikáns az eredmény, ha a H0-tól való eltérés jelentős, nem a véletlen (a mintavételi ingadozás) hatására jött létre

–         próba megbízhatósági szintje:

–         a szignifikanciaszintet 1-re kiegészítő β= 1–α valószínűség

–         annak az eseménynek a valószínűsége, hogy nem vetjük el a helyes H0-t

A nem szignifikáns eredmény a véletlen hatására is létrejöhet!

A kritikus tartomány

–   a próbafüggvény lehetséges értékeinek tartományát osztópontok segítségével két (egymást át nem fedő) részre bontjuk:

–         elfogadási tartomány (E)

–         visszautasítási – kritikus – tartomány (K).

–   E két tartomány határait úgy választjuk meg, hogy a próbafüggvény a H0 fennállása esetén előre megadott nagy valószínűséggel az elfogadási tartományba essen. Lehet:

– egyoldali (bal, jobb) és

– kétoldali:

K                E                 K            E          K                     E           K

kritikus-tartomány

α 1- α α/2 1- α α/2 1- α α

baloldali                                        kétoldali                            jobboldali

–         Ha minta adataiból számított próbafüggvény α értéke az elfogadási tartományba esik, akkor elfogadjuk H0-t

–         ellenkező esetben pedig elvetjük a H0-t,  elfogadjuk a H1 alternatív hipotézist.

Az elfogadási tartomány határait mindig úgy jelöljük ki, hogy a próbafüggvény H0 helyességét feltételezve előre meghatározott nagy (1– α) valószínűséggel ebbe essen. A kritikus tartományba esésnek valószínűsége ennek megfelelően α és kicsi.

Az α értéket szignifikanciaszintnek nevezzük.

Összefoglalása hipotézisvizsgálat lépései:

1. A H0 null-hipotézis és egy vele szemben álló H1 alternatív hipotézis megfogalmazása.

2. olyan próbafüggvény konstruálása, illetve keresése, amelynek eloszlása H0 helyességét feltételezve és a próba alkalmazási feltételeinek fennállását adottnak véve egyértelműen meghatározható.

3. Egy 0-hoz közeli a szignifikanciaszint választása, és a próbafüggvény lehetséges értéktartományának ezzel és az alternatív hipotézissel összhangban lévő felosztása egy elfogadási és egy visszautasítási (kritikus) tartományra.

4. A mintavétel gyakorlati lebonyolítása, és a próbafüggvény számszerű értékének meghatározása a mintából.

5. Döntés a H0 és H1 hipotézisek helyességéről: ha a próbafüggvény értéke az előre kijelölt elfogadási tartományba esik, elfogadjuk H0-t, ellenkező esetben pedig visszautasítjuk, elvetjük azt. Ezzel együtt az alternatív hipotézis az előbbi esetben elvetésre, az utóbbiban pedig elfogadásra kerül.

Share

A mintavétel szabályai, reprezentatív minta, mintavételi hibák

1
Share

Statisztika, 12. tétel, pszichológia távoktatás

A mintavétel szabályai, reprezentatív minta, mintavételi hibák

(magyarázat)

Berei Kati által kidolgozva

Reprezentatív minta:

–    ha valami oknál fogva nem tudjuk a sokaságot megvizsgálni (elvileg lehetetlen mert végtelen), akkor a sokaságból vett minta alapján tudunk következtetéseket levonni a teljes sokaságra vonatkozóan.

–    ezt csak akkor tehetjük meg ha a minta összetételében hasonló a sokaság összetételéhez – a vizsgált szempontból is reprezentálja a sokaságot

–    Ha ez igaz, akkor:

–         megbecsülhetjük a sokaság egy jellemző értékét

–         ellenőrizhetjük a sokaságra vonatkozó hipotézist

A mintavétel szabályai:

–   alapelv: a véletlen (valószínűségi) mintavétel – a reprezentatív mintát úgy biztosíthatjuk, ha a populáció minden tagjának ismert, nem-nulla esélyt, egyforma esélyt adunk a mintába kerülésre

–   tehát reprezentatív minta = véletlenszerűen kiválasztott minta

–   A sokaságból vett egy (néhány) reprezentatív minta értékeiből következtetünk a sokasági jellemzőre.

 

  • Mintavételi hibák:

–   még a leggondosabb mintavételi eljárással sem kapunk szinte sohasem az eredeti sokaságot tökéletesen reprezentáló mintát. Bizonyos mértékű mintavételi hiba mindig marad.

–   a véletlenségből adódó hiba számszerűsíthető, figyelembe vehető

 

Standard hiba – a mintavételi eloszlás szórása

Standard hiba

Standard hiba

Belátható, hogy N növekedésével (vagyis nagyobb minta esetén) a standard hiba csökken.

 

Share

Korreláció, regresszió

0
Share

Statisztika, 11. tétel, pszichológia távoktatás

Korreláció, regresszió

Berei Kati által kidolgozva

Korrelációs kapcsolat (kölcsönösség, kölcsönös viszony):

–   két mennyiségi (arány és/vagy intervallum) ismérv szerinti kombinatív osztályozás esetén fordul elő

–   a kapcsolat monoton jellegű és nem függvényszerű: egyik független változó módosulásával a másik független változó is változik.

Korrelációs kapcsolat típusai:

  • nincs kapcsolat az ismérvek között, ha az egyik X -hez bármekkora Y tartozhat.
  • lineáris kapcsolat – ha X növekedésével Y is közel azonos arányban nő (csökken)
  • monoton vagy Spearman-féle korreláció – ha X változását Y valamilyen, többnyire exponenciális jelleggel követi
  • határozatlan jellegű kapcsolat – tartalmaz egy lineáris és egy vagy több kúpszelet-jellegű (parabola, hiperbola) részt (ez elég gyakori természeti változók esetében)

korrelációs kapcsolatok

független   lineáris      monoton  határozatlan

kapcsolathiány       (pozitív)            (negatív)             Spearman-féle

Lineáris kapcsolatban használjuk: a lineáris korrelációs együtthatót – r-

 

–         A korrelációs mutató értéke azt mutatja, hogy hány %-os valószínűséggel van lineáris kapcsolat a vizsgált ismérvek között.

 

–1< r <+1

 

–         ha mínusz előjelű az r – az egyik ismérvérték növekedésével a másik csökkenő:

(a –0,9-es érték is szoros kapcsolatot mutat).

–         Az r érték abszolút értékben annál nagyobb, minél szorosabban esnek a pontok egy képzeletbeli egyenes mentén.

–          A lineáris korrelációs együttható számításának matematikai alapja az ún. legkisebb négyzetek módszere: keressük azt az egyenest, amely átlagosan a lehető legközelebb esik valamennyi ponthoz – a behúzott egyenes esetében a pontok ugyan szóródnak az egyenes mentén, mégis „adják” azt. (a word-program diagramrajzolója nemcsak „megkeresi” azt az egyenest és az egyenes egyenletét is kiszámítja)

Regresszió – analízis

–         Két változó közötti korrelációs összefüggés esetén függvényszerűvé alakíthatjuk a kapcsolatot, hogy egy újabb egyed megjelenésekor az egyik ismérvértékéből következtetni tudjunk a másik ismérvértékére.

–         Az egyenes egyenlete y=mx+a, amelyben az m megadja az egyenes meredekségét, az a érték pedig, hogy milyen magasan metszi az y tengelyt.

Az m (regressziós együttható) és az a értéke a következőképpen határozható meg:

regresszió analízis

m ismeretében pedig az egyenlet átrendezésével:  a = y átlagx átlag:

–          word diagramszerkesztője is képes ábrázolni az adatokat és a regressziós egyenest, a korrelációs együtthatót (R2) is kiszámolni.

–          Ugyanezt az értéket adja az excel korrel (correl) nevű függvénye is

Share

Kapcsolatvizsgálatok (Yule-próba, khi-négyzet próba)

1
Share

Statisztika, 10. tétel, pszichológia távoktatás

Kapcsolatvizsgálatok (Yule-próba, khi-négyzet próba)

(számítás)

Berei Kati által kidolgozva

Asszociációs kapcsolatban használjuk:

  1. alternatív kapcsolat eseténkét-két ismérv van – Yule-mutatót
  2. kettőnél több ismérv-változat esetén – khi-négyzet próbát

Yule-féle asszociációs együttható

A kontingenciatábla:

Csoport B1 B2
A1 f11 f12
A2 f21 f22

A Yule Mutató

Yule mutató

Yule mutató

Tulajdonságok: 1 £ Y £ 1

–          függetlenség esetén Y = 0 (fordítva nem igaz! Előfordulhat ugyanis, hogy az noha különböző értékek vannak a cellákban Az f11×f22 szorzat értéke megegyezik az f21×f12-ével.)

–          függvényszerű kapcsolat esetén ïYï = 1 (fordítva nem igaz! Lehet ugyanis olyan táblázatunk, amelyben az egyik cella értéke nulla, azzal 0 lesz azon szorzatpár értéke is)

–          sztochasztikus kapcsolat esetén 0 < ïYï < 1

–          Y > 0 ha f11f22 > f21f21 vagyis az azonos indexek jobban vonzzák egymást.

A Yule-próba hibái:

–    ha az egyik cella értéke 0 megtévesztő, függvényszerű kapcsolatot is kimutathat (Y=1)

–    ha két szorzat értéke ugyanaz, nem alkalmas a szorosság kimutatására (Y=0)

 

 

Khi – négyzet próba c2

 

Akkor használjuk ha:

–          ha fenti okok miatt nem felel meg a Yule-mutató

–          ha ismérvenként több osztály van, vagyis nagyobb a kontingencia-táblázatunk

Khi négyzet próba

Khi négyzet próba

fij– várt érték, s cellánként a kiinduló értékekből számítható:

fij szamitas =>                         fij-szamitasok

Tulajdonságok:

→ 0 £ c2 £ N min(s-1, t-1)

→ c2 = 0 akkor és csak akkor, ha a két ismérv független

→ c2 = N (s-1) akkor és csak akkor, ha a két ismérv függvénykapcsolatban áll, ekkor s=t

Egyszerűbben:

–          ha c2 = 0, akkor nincs összefüggés a csoportképző ismérvek között

–          ha c2 ≠ 0, akkor feltételezhető a kapcsolat

A c2 mutató azonban csak áttételesen utal a kapcsolat szorosságára, mivel nem elégíti ki a valószínűségi mutatóval szemben állított azon követelményt, hogy értéke nulla és egy közé essen.

Két eljárás is van a c2 valószínűségi mutatóvá alakítására.

A Csuprov-féle asszociációs együttható (T)

–          a kontingenciatábla nagyságával és a teljes elemszámmal viszonyítja a khi-négyzet mutatót:

Csuprov féle asszociációs együttható

Csuprov féle asszociációs együttható

, ahol s – sorok száma, o – oszlopok száma

A Cramer-féle asszociációs együttható

–          hasonló módon alakítja át a khi-négyzet mutatót, de a táblanagyságból csak a kisebb osztályszámú sort vagy oszlopot veszi figyelembe:

Cramer féle asszociációs együttható

Cramer féle asszociációs együttható

Cramer-féle asszociációs együttható tulajdonságai:

0c1

→ ha s = o, akkor C = T

C = 0 akkor és csak akkor, ha a két ismérv független

C = 1 akkor és csak akkor, ha a két ismérv között függvénykapcsolat áll fenn.

35% -gyenge

35-70% közepes

70% fölött szoros kapcsolat

Share

Részsokaságok vizsgálatának alapjai

0
Share

Statisztika, 9. tétel, pszichológia távoktatás

Részsokaságok vizsgálatának alapjai

(kapcsolatvizsgálatok a változók típusa szerint, felsorolás és a próbák megnevezése, tan útmutató 1/11-12 old)

Berei Kati által kidolgozva

Heterogén a sokaság ha a vizsgált ismérvek szempontjából lényeges tulajdonságokkal bír, ilyenkor célszerű újabb ismérv(ek) szerint részsokaságokra bontani.

A részsokaságokra bontásnálfontos szempontok:

–    a sokaság bármely eleme besorolható legyen egy és csakis egy osztályba

–    a besorolás homogén csoportot eredményezzen.

Ha részsokaságokra bontjuk, más elemzéseket is végezhetünk – továbbvihetjük a vizsgálatot, kapcsolatokat vizsgálhatunk különböző szempontok szerint. A vizsgálat eszköze a kontignencia-tábla.

Milyen kapcsolataink lehetnek?

–          Nincs kapcsolat, ha az egyik csoportképző ismérv értéke semmilyen információt nem hordoz a másikéról

–          , ha az egyik ismérv értéke egyértelműen meghatározza a másikét, akkor függvényszerű a kapcsolat

–          Ha az egyik ismérv értékéből a másik ismérv értékeinek csak az eloszlása adódik, ha csak valamilyen valószínűséggel jellemezhetjük, akkor sztochasztikus kapcsolatról beszélhetünk.

Sztochasztikus (statisztikai) kapcsolat – valószínűségi kapcsolat:

–          van amikor az egyik ismérvcsoporthoz való tartozásból nagy valószínűséggel következtethetünk a másik ismérvcsoportra, s van amikor nagyon laza ez a kapcsolat.

–          mérőszámai 0 és 1 közötti értéket vehetnek fel:

0 a kapcsolathiányt jelzi

1 függvényszerű kapcsolatot jelent

. Ha a kapcsolati mutató plusz előjelű, akkor az egyik ismérvérték növekedésével a másik ismérvérték várhatóan szintén növekvő

mínusz előjel esetén pedig fordított: az egyik ismérvérték növekedésével a másik ismérvérték várhatóan csökkenő:

0 < K < ±1    →    0 < |K| < 1

A kapcsolat szorosságát mutató érték százzal megszorozva százalékos formában is kifejezhető.

0 < |K|< 0,35 – gyenge kapcsolat – 35%

0,4 < |K| < 0,65 – közepes kapcsolat – 35-70%

0,7 < |K| – szoros kapcsolat – 70% fölött

Az ismérvek közötti kapcsolat lehet:

  1. asszociációs kapcsolat:
  • minőségi (nominális) vagy területi ismérvek között
  • ha a csoportképző ismérvek minőségi skálával jellemezhetők: az egyik ismérv nominális (névleges), a másik nominális vagy ordinális (sorrendi)
  • használt próbák:

–         alternatív kapcsolat esetén (két-két ismérv van): Yule- mutató

–         kettőnél több ismérv-változat esetén : khi négyzet próba

–         a khi négyzet próbát valószínűségi értékké átalakítja a:

– Cramer–mutató

– Csuprov féle assziciációs együttható

  1. vegyes kapcsolat:
  • ha az egyik ismérv minőségi a másik pedig mennyiségi
  • ha a független változó (az ok) minőségi vagy területi ismérv, a függő változó (az okozat) pedig mennyiségi ismérv.
  • A mennyiségi ismérv lehetőséget ad arra, hogy felhasználjuk az adatok átlagát és a szórását a kapcsolatszorosság mérésére: belső variancia számítás, külső variancia számítása és ezek összege a teljes variancia

  1. korrelációs kapcsolat:

–        mindkét ismérv mennyiségi (intervallum vagy arányskálán mérhető)

–        A kapcsolat monoton jellegű és nem függvényszerű: egyik független változó módosulásával a másik független változó is változik

–        mérésre: a lineáris korrelációs együttható: –1< r <+1 értéket vehet fel.

  1. rangkorrelációs kapcsolat – ha mindkét változó sorrendi (ordinális) skálán mérhető, célszerű a Spearman-féle rangkorrelációs együtthatóval vizsgálni a kapcsolat szorosságát.

Share

Adatok összehasonlítása: viszonyszámok fajtái

0
Share

Statisztika, 8. tétel, pszichológia távoktatás

Adatok összehasonlítása: viszonyszámok fajtái

(számítás)

Berei Kati által kidolgozva

Viszonyszám:

–          két egymással kapcsolatban álló statisztikai adat hányadosa: tárgya /alapja

Pl. GDP/fő – tárgya: GDP; alapja: az ország lakossága.

–          osztással hozzuk létre, tehát a mértékegységeket le lehet egyszerűsíteni

  1. 1. Megoszlási viszonyszám:

–          azonos típusú adatok hányadosa

–          Megmutatja, hogy egy részadat hogyan viszonyul a részadatok összegéhez: részsokaság adata/teljes sokaság adata:

Megoszlási viszonyszám(×100%)

–          Pl. férfiak aránya a népességen belül: ha egy községben 512 nő és 489 férfi él, egy városban pedig 78.220 nő és 78056  férfi, akkor a megoszlási viszonyszámok:

Falu Város Összesen
megoszlás megoszlás
Férfi 489 48,85% 78056 49,95%
512 51,15 78220 50,05%
Összesen 1001 100% 156276 100%

Pl.: Megoszlási viszonyszám…stb.

–          a szövegszerkesztők diagramkészítői a megoszlási viszonyszámhoz illő kördiagramot készítenek (nekünk csak fel kell venni az adatokat, nem is kell kiszámolni az értékeket)

  1. 2. Intenzitási (koordinációs) viszonyszám

–          eltérő típusú adatok hányadosa: egyik részsokaság adata/másik részsokaság adata  pl. ezer nőre jutó férfiak száma; 1000 szülésre jutó élveszületések száma

–          jól használhatók a társadalmi-gazdasági jelenségek színvonalának jellemzésére és eltérő nagyságú de hasonló adatok összehasonlíthatóvá tételére

–          általában ezer főre adják meg a statisztikusok (ezer lakosra jutó televíziók száma, ezer háztartásra jutó gépkocsik száma).

Pl. Falu:

ha 512 nő aránylik a 483 férfihez, akkor 1000 nő hogyan aránylik X férfihez:

Intenzitási viszonyszám

Intenzitási viszonyszám

Az egyenlet átrendezésével:

Azaz az 1000 nőre jutó férfiak száma 955.

Ugyanez a városi megoszlásra:

Városi megoszlás

Az egyenlet átrendezésével:

Városi megoszlás átrendezve

Megállapítható tehát, hogy a városban kiegyensúlyozottabb a nemek aránya.

  1. 3. Dinamikus viszonyszámok

–          azonos típusú adatok hányadosa

–          jellegzetesen az idősorok elemzésére alkalmas.

–          kétféle lehet: bázisviszonyszám és láncviszonyszám

Bázisviszonyszám:

—       tárgyidő adata/bázisidő adata (általában az idősor első évét tekintjük bázisnak, ehhez viszonyítjuk a többi év adatát)

—       Megmutatja a változás arányát, 100-zal szorozva százalékos formában:

Bázisviszonyszám(×100%)

Láncviszonyszám:

–          idősoroknál minden egyes év adatát az azt megelőző időszak adatához viszonyítjuk, megmutatja a változás dinamikáját:

Láncviszonyszám(×100%)

Figyelem: megoszlási viszonyszámot értelemszerűen csak arányskálán

(valódi 0-pontú) mért adatokból lehet számítani!

Share

Statisztikai adatok elemzése grafikus ábrázolással

0
Share

Statisztika, 7. tétel, pszichológia távoktatás

Statisztikai adatok elemzése grafikus ábrázolással

(lehetőségek megnevezése)

Berei Kati által kidolgozva

–         A számszerű statisztikai adatokat célszerű diagramon ábrázolni

–         a szövegszerkesztő programok (pl. a word is) rendelkeznek ilyen alprogramokkal.

  1. 1. Vonal diagram

–          folytonosan változó adatokat célszerű ábrázolni, ezzel is sugalmazzuk az adatok folyamatosságát.

–          pl. egy édesanya naponta megméri csecsemője súlyát . A napi adatpontokat joggal kötheti össze, hiszen a csecsemő súlya folyamatosan változik. A függőleges tengely kezdőpontját hozzáigazíthatjuk a legkisebb adathoz (esetünkben 3,5 kg-nál kezdődik a tengely skálázása), ezzel „megnyújtjuk”, szemléletesebbé tesszük a változást:

Vonal diagram

Vonal diagram

  1. 2. Oszlop- (sáv-) diagram

–         célszerű a diszkrét adatok ábrázolására használni.

Oszlop- (sáv-) diagram

Oszlop- (sáv-) diagram

Hisztogramok, gyakorisági poligonok

–         ezek az eloszlások grafikus ábrázolásai:

  • hisztogram – olyan téglalapokból áll, amelynek alapjai a vízszintes tengelyen vannak, középpontjuk az osztályköz, szélességük megegyezik az osztályköz hosszával, magasságuk, s ezáltal területük arányos az  osztálygyakorisággal.
  • gyakorisági poligon – a gyakorisági sor osztályközepek alapján rajzolt vonaldiagramja, melynél a vonal alatti terület megegyezik a hisztogram területével.
Hisztogram

Hisztogram

Share

A statisztikai megfigyelés: sorok, táblák

0
Share

Statisztika, 6. tétel, pszichológia távoktatás

A statisztikai megfigyelés: sorok, táblák

(lehetőségek megnevezése, adatok rendezése, idősor, kontingenciatáblázat)

Berei Kati által kidolgozva

A statisztikai munka fázisai:

  1. megfigyelés – számbavétel, adatfelvétel
  2. feldolgozás – csoportosítás, összesítés
  3. elemzés – feltárni összefüggések feltárása, következtetések levonása
  4. jellemzés

– Sok adat esetén áttekinthetőbb ha csoportosítjuk, osztályba soroljuk őket.

Statisztikai sor

–        az adatok meghatározott ismérv szerinti, csoportosított felsorolása főképpen összehasonlítási célból

–        a csoportosítási ismérv szerint lehet:

  1. minőségi

–          fogalmilag meg van határozva, pl. férfi – nő

–         valamely minőségi (többnyire nominális) ismérv szerint csoportosítja az adatokat önmagában (egy adott időpontra vonatkoztatva), illetve idősorral vagy területi sorral kombináltan.

pl. befejezett iskolai tanulmányok 1950. és1999. között

  1. mennyiségi – tulajdonságokon alapoló mennyiség, két számsor alkotja

–         ezeket az adatokat rendezhetjük – rangsorolhatjuk nagyság szerint (pl. emelkedő sorba) vagy rendezhetjük gyakorisági sorba – osztályokba eloszlás szerint

  1. időbeli állapot – tartam, pl. álló – mozgó sokaság
  2. térbeli
  3. leíró – egy-egy eltérő ismérvű, de logikailag összefüggő adatokat tartalmaz

–              A statisztikai sorok legjellemzőbb vizsgálata a viszonyszámokkal történik.

Share
Go to Top