კვლევის მეთოდები განათლებაში
თავი 24
ნაწილი III

იქს-კვადრატი (χ2 )

      განსხვავების შემოწმება მნიშვნელოვანი ოპერაციაა მონაცემებში გარკვევისას და ამ საკითხს მოგვიანებით უფრო სრულად განვიხილავთ. ჩვენ განსხვავების გამოსავლენად სტატისტიკური ტესტის ჩატარება შეგვიძლია. ამ კრიტერიუმს იქს-კვადრატი (χ2) ეწოდება. ვიწყებთ ნულოვანი ჰიპოთეზით, რომელიც ამტკიცებს, რომ არ არსებობს სტატისტიკურად მნიშვნელოვანი განსხვავება, ვთქვათ, მამაკაცებსა და ქალებს შორის, თუ რამდენად მოსწონთ მათემატიკა და მონაცემების დანიშნულებაა, რომ ამ მტკიცებას არ დაუჭიროს მხარი. ვირჩევთ მნიშვნელოვნობის დონეს (α), რომელსაც გამოვიყენებთ ნულოვანი ჰიპოთეზის მხარდასაჭერად, ან მისთვის მხარის არ დასაჭერად. მაგალითად, შეგვიძლია, ვთქვათ, „დავუშვათ, α= 0.05“.

      იქს-კვადრატი ზომავს სტატისტიკურად გამოთვლილ მოსალოდნელ შედეგსა და რეალურ შედეგს შორის განსხვავებას იმის გასარკვევად, არსებობს თუ არა მათ შორის სტატისტიკურად მნიშვნელოვანი განსხვავება, ანუ, ვნახულობთ, მნიშვნელოვანია თუ არა მიღებული სიხშირეები. ეს არის მოსალოდნელი და რეალურად მიღებული შედეგების „შესატყვისობის სიკარგის“ საზომი. მოსალოდნელი შედეგი ქვემოთ განხლულ სტატისტიკურ პროცესს ეფუძნება. სტატისტიკური სიდიდე იქს-კვადრატი სტატისტიკური მნიშვნელოვნობის ცნების შესასწავლადაა მოწოდებული და ალბათობის ცნებას ემყარება. აქ არ არის მისი მათემატიკური მხარის განხილვის დრო და ადგილი და, ძირითადად, იმიტომ, რომ კომპიუტერული პროგრამები ავტომატურად ითვლიან შედეგებს. მიუხედავად ამისა, ვიტყვით, რომ იქს-კვადრატის გამოსათვლელი ფორმულა ასეთია:

      სადაც,

O = რეალურად დაკვირვებული სიხშირეები
E = მოსალოდნელი სიხშირეები
Σ = ჯამი

      ზემოთ განხილულ ჰიპოთეტურ მაგალითში, ვთქვათ, კომპიუტერული პროგრამით (SPSS-ით) მივიღეთ, რომ მნივნელოვნობის დონეა 0.016, ანუ, მონაცემების ასეთი განაწილება უბრალო შემთხვევითობის შედეგი არ არის. გავიხსენოთ, რომ, ტრადიციულად, მნიშვნელოვნობის მინიმალური მისაღები დონეა 0.05 და ჩვენი მონაცემების მნიშვნელოვნობის დონე ამ რიცხვზე ნაკლებია, ესე იგი, ის სტატისტიკურად მნიშვნელოვანია. ამრიგად, შეგვიძლია ვიფიქროთ, რომ მამაკაცებისა და ქალების მიერ მოცემული პასუხები სტატისტიკურად მნიშვნელოვნად განსხვავდება ერთმანეთისგან და ეს განსხვავება არ არის შემთხვევითი, ანუ, ორ ჯგუფს შორის არსებულ განხვავებას თავისი მნიშვნელობა/აზრი აქვს. ამგვარად, ნულოვანი ჰიპოთეზა არ არის მხარდაჭერილი და ალტერნატიული ჰიპოთეზაა მართებული, ანუ, ორი ჯგუფის პასუხებს შორის არსებობს სტატისტიკურად მნიშვნელოვანი განსხვავება.

      იქს-კვადრატით მიღებული შედეგები შემდეგნაირად შეგვიძლია გავაფორმოთ:

როდესაც გამოვთვალეთ იქს-კვადრატი მამაკაცებისა და ქალების განაწილებისთვის მათემატიკისადმი მათი დამოკიდებულების მიხედვით, ამ ორ ჯგუფს შორის სტატისტიკურად მნიშვნელოვანი განსხვავება მივიღეთ (χ2 = 14.51, df = 2, p = 0.01).

      იქს-კვადრატი, ჩვეულებრივ, სახელდების სკალის მონაცემებთან გამოიყენება და ჩვენი მაგალითიც ამას აჩვენებს. იქს-კვადრატის გამოთვლისთვის საჭირო მონაცემები ნიშანთა შეუღლების ცხრილშია მოცემული, რომლის მაგალითი 24.21 ჩანართში შეგიძლიათ ნახოთ. ესაა 2×3 ნიშანთა შეუღლების ცხრილი, ანუ, ორი ჰორიზონტალური სტრიქონი და სამი სვეტი (ნიშანთა შეუღლების ცხრილები ამაზე მეტ ცვლადსაც შეიძლება შეიცავდეს). ამ ჩანართში მოცემული ცხრილი შეიცავს 60 სტუდენტის კოლეჯში გადანაწილებას სქესისა (მდედრობითი და მამრობითი) და არჩეული მიმართულებების (სოციალური მეცნიერებები, ხელოვნება და ჰუმანიტარული მეცნიერებები) მიხედვით (Morrison 1993: 132 – 4). ყოველ უჯრაში ჩაწერილი ორი რიცხვიდან ქვედა რიცხვი იმ სტუდენტების რეალურ რაოდენობას ასახავს, რომელმაც შესაბამისი მიმართულება აირჩია (სოციალური მეცნიერებები, ხელოვნება და ჰუმანიტარული მეცნიერებები), ხოლო ზედა რიცხვი სტუდენტების იმ რაოდენობის მაჩვენებელია, რომელსაც სრულიად შემთხვევით უნდა ველოდოთ ამ მიმართულებებზე. ეს რიცხვები სტატისტიკური გამოთვლითაა მიღებული და ამიტომ გვაქვს ათწილადები. მკვლევარს აინტერესებს, სქესის მიხედვით მიმართულების არჩევის რეალურად მიღებული განაწილება მნიშვნელოვნად განსხვავდება თუ არა იმ განაწილებისგან, რომელიც შეიძლებოდა კოლეჯში შემსვლელთა პოპულაციის შემთხვევითი ცვალებადობის შედეგად მიგვეღო (ჩანართი 24.21).

-------------------------
ჩანართი 24.21.
2×3 ნიშანთა შეუღლების ცხრილი იქს-კვადრატისთვის


-------------------------

      მკვლევარი ნულოვანი ჰიპოთეზით იწყებს, რომლის მიხედვითაც რეალურად მიღებული შედეგები და ის შედეგები, რომლებიც შეიძლებოდა პოპულაციაში შემთხვევით მიგვეღო ერთმანეთისგან მნიშვნელოვნად არ განსხვავდება. ხიკვადრატის გამოთვლის შემდეგ თუ დაკვირვებული, რეალურად მიღებული განაწილება განსხვავებული იქნება იმისგან, რასაც მხოლოდ შემთხვევით უნდა ველოდოთ, მაშინ მკვლევარმა უნდა განსაზღვროს, ეს განსხვავება სტატისტიკურად მნიშვნელოვანია თუ არა (ანუ, არ უნდა დაუჭიროს მხარი ნულოვან ჰიპოთეზას).

      60 სტუდენტის არჩევანის შესახებ ჩვენს მაგალითში იქს-კვადრატის ფორმულით მივიღეთ 14.64. ამ მნიშვნელობას იქს-კვადრატის განაწილების ცხრილში ვნახულობთ (იხ. ცხრილი 4 სტატისტიკური ცხრილების დანართში), რათა გავარკვიოთ, იქს-კვადრატის მიღებული მნიშვნელობა მიგვითითებს თუ არა რეალურად მიღებული და შემთხვევითად მოსალოდნელი შედეგების ერთმანეთისგან სტატისტიკურად მნიშვნელოვან განსხვავებაზე. იქს-კვადრატის განაწილების ცხრილის ნაწილი ქვემოთ არის წარმოდგენილი.

      მკვლევარი ნახავს, რომ გამოსათვლელი აქვს „თავისუფლების ხარისხი“ (მათემატიკური კონსტრუქტი, რომელიც მონაცემებზე დაწესებული შეზღუდვების რაოდენობას უკავშირდება). ბევრ შემთხვევაში თავისუფლების ხარისხის დასადგენად, საკმარისია, რომ ნიშანთა შეუღლების ცხრილის სტრიქონების რაოდენობას გამოვაკლოთ ერთი, იგივე ცხრილის სვეტების რაოდენობას გამოვაკლოთ ერთი და მიღებული ორი რიცხვი შევკრიბოთ. ამ შემთხვევაში, თავისუფლების ხარისხი გვექნება: (2 - 1) + (2 - 1) = 3. თავისუფლების ხარიხს შემდეგ ქვეთავში განვიხილავთ. (თავისუფლების ხარისხის მისაღები სხვა ფორმულის მიხედვით, ნიშანთა შეუღლების ცხრილის უჯრების საერთო რაოდენობას უნდა გამოვაკლოთ ერთი. ამ მეთოდს მოგვიანებით განვიხილავთ.) იქს-კვადრატის განაწილების ცხრილის გარჩევას მკვლევარი თავისუფლების ხარისხის შემცველი სვეტიდან იწყებს, პოულობს 3-ის ტოლ თავისუფლების ხარისხს და ნახულობს, რომ იქს-კვადრატის გამოთვლილი მნიშვნელობა (14.64) სტატისტიკურად მნიშვნელოვანია 0.01 დონეზე, ანუ უფრო მეტია, ვიდრე მოთხოვნილი მინიმალური 11. 34. ეს შედეგი მიუთითებს, რომ რეალურად მიღებული მონაცემების განაწილება მხოლოდ შემთხვევითად ვერ იქნებოდა ასეთი. ნიშანთა შეუღლების ცხრილში (ჩანართი 24.21) გამოსახული კონკრეტული რიცხვების საგანმანათლებლო და არა - სტატისტიკური თვალსაზრისით ინტერპრეტაციისას საყურადღებოა ქალების მცირე რაოდენობა საბუნებისმეტყველო მეცნიერებების და დიდი რაოდენობა ხელოვნებისა და ჰუმანიტარულ მიმართულებებზე, ხოლო მამაკაცების დიდი რაოდენობა საბუნებისმეტყველო მეცნიერებების მიმართულებაზე და ნაკლები - ხელოვნებასა და ჰუმანიტარულზე. მკვლევარი იტყოდა, რომ განაწილება სტატისტიკურად მნიშვნელოვანია და ამით, სავარაუდოდ, აღნიშნავდა, რომ კოლეჯმა უნდა რაღაც მოიფიქროს, რათა ქალები უფრო მეტად დააინტერესოს საბუნებისმეტყველო მეცნიერებებით, ხოლო კაცები - ხელოვნებითა და ჰუმანიტარული მიმართულებით.

      იქს-კვადრატი ერთ-ერთი ფართოდ გამოყენებადი კრიტერიუმია და კონკრეტულად სახელდების სკალის მონაცემებისთვის გამოიყენება. რიგის, ინტერვალებისა და შეფარდების სკალების მონაცემებისთვის უფრო მძლავრი კრიტერიუმები არსებობს და მათ ცალკე განვიხილავთ. თუმცა, იქს-კვადრატის შეზღუდვებს ყურადღებით უნდა მოვეკიდოთ. იხ. 24.22 ჩანართში მოცემული მაგალითი.

-------------------------
ჩანართი 24.22
2×5 ნიშანთა შეუღლების ცხრილი იქს-კვადრატისთვის


-------------------------

      მოცემული ცხრილისთვის იქს-კვადრატი რომ გვქონოდა გამოსათვლელი, უაღრესად ფრთხილად უნდა ვყოფილიყავით, ვინაიდან იქს-კვადრატის დაშვების თანახმად, ცხრილის უჯრედების ოც პროცენტზე მეტი ხუთ შემთხვევაზე ნაკლებს არ უნდა მოიცავდეს. ამ მაგალითში მოცემული ცხრილის ერთ უჯრაში ხუთი შემთხვევაა, მეორეში - სამი, ხოლო მესამეში - მხოლოდ ერთი, ესე იგი, ხუთზე ნაკლები ოდენობის შემთხვევის ათი უჯრიდან (ორი სტრიქონი - ქალები და მამაკაცები და თითოში ხუთი კატეგორია) სამი უჯრა გვაქვს. ეს ნიშნავს, რომ უჯრების 30 პროცენტი შეიცავს ხუთზე ნაკლებ შემთხვევას, თუმცა კომპიუტერი ხი-კვადრატს მაინც გამოთვლის, რომელიც, ცხადია, არასანდო იქნება. აქ იკვეთება მეოთხე თავში გამოთქმული მოსაზრება შერჩევის შესახებ, რომლის თანახმადაც ქვეშერჩევა დიდი უნდა იყოს. მაგალითად, თითოეულ კატეგორიაში ხუთი შემთხვევა რომ ყოფილიყო, ეს მინიმუმ 50 წევრიან შერჩევას ნიშნავდა (10×5) იმ დაშვებით, რომ მონაცემები თანაბრადაა განაწილებული. მიუხედავად იმისა, რომ ამ მაგალითში მოცემული შერჩევა გაცილებიდ დიდია (191), ის მაინც არ იძლევა გარანტიას, რომ ხუთშემთხვევიანი უჯრების რაოდენობა 20 პროცენტს არ გადააჭარბებს, რადგან მონაცემები არათანაბრადაა განაწილებული.

      რადგან საჭიროა, რომ იქს-კვადრატის ნიშანთა შეუღლების ცხრილის უჯრების, სულ მცირე, 80 პროცენტში ხუთზე მეტი შემთხვევა იყოს სანდო მონაცემების მისაღებად იქს-კვადრატის გამოთვლა, მცირე მოცულობის შერჩევასთან მუშაობისას, შესაძლოა, უსარგებლო იყოს. ამგვარად, მკვლევარმა ეს კრიტერიუმი ფართომასშტაბიანი გამოკითხვებით მიღებული მონაცემებისთვის უნდა გამოიყენოს. თუ უჯრებში დაბალი სიხშირეების პრობლემა გვაქვს, მაშინ სხვა სტატისტიკური კრიტერიუმების გამოყენება შეგვიძლია, მაგალითად, ბინომიალური ტესტის და, უფრო ფართოდ გამოყენებადი, ფიშერის სიზუსტის კრიტერიუმი (Cohen and Holliday 1996: 218 – 20). შემთხვევათა მინიმალური რაოდენობა თითოეულ უჯრაში პრობლემურს ხდის იქს-კვადრატის გამოთვლას და, სახელდების სკალის მონაცემებთან ერთად, არსებობს ალტერნატიული სტატისტიკური სიდიდეები, რომელთა გამოთვლით აღნიშნული პრობლემის დაძლევა შეგვიძლია (მაგალითად, მან-უიტნის, უილკოქსონის, კრუსკალუოლისისა და ფრიდმანის კრიტერიუმები არაპარამეტრული - რიგის სკალის - მონაცემებისთვის და ტ კრიტერიუმი და დისპერსიული ანალიზი პარამეტრული - ინტერვალებისა და შეფარდების სკალის - მონაცემებისთვის).

      იქს-კვადრატის გამოყენებით 2×2 ნიშანთა შეუღლების ცხრილის სახით წარმოდგენილი მონაცემების ანალიზის მეთოდები, ზოგადად, კარგად არის განხილული კვლევის მეთოდების სახელმძღვანელოებში. თუმცა, განათლების სფეროში მიღებული მონაცემები უფრო და უფრო ხშირად თავსდება არა ორგანზომილებიანი, არამედ მრავალგანზომილებიანი ცხრილის ფორმატში. ევერიტი (1977) მრავალგანზომილებიანი ცხრილების ანალიზის მეთოდების სასარგებლო მიმოხილვას გვთავაზობს.

თავისუფლების ხარისხი

      იქს-კვადრატის განხილვისას შემოვიტანეთ ტერმინი თავისუფლების ხარისხი. გორარდი (2001: 233) ამბობს, რომ „თავისუფლების ხარისხი არის იმ ქულების რაოდენობა, რომელიც დანარჩენი ქულების გამოთვლამდე უნდა ვიცოდეთ“. კოენი და ჰოლიდეი (1996) ნათლად განმარტავენ ამ ტერმინს:

დავუშვათ, უნდა ავირჩიოთ ნებისმიერი ხუთი რიცხვი. რიცხვების აღებისას არჩევანის სრული თავისუფლება გვაქვს. ამრიგად, ხუთი თავისუფლების ხარისხი გვაქვს. თუმცა, დავუშვათ, შემდეგ გვითხრეს, რომ ჩვენ მიერ არჩეული ხუთი რიცხვის ჯამი 25-ის ტოლი უნდა იყოს. ჩვენ ოთხი რიცხვის არჩევის სრული თავისუფლება გვექნება, მაგრამ მეხუთე რიცხვი დანარჩენ ოთხზე იქნება დამოკიდებული. ვთქვათ, პირველი ოთხი არჩეული რიცხვია 7, 8, 9 და 10, რომელთა ჯამი 34-ია და თუ ხუთი რიცხვის შეკრებით 25 უნდა მივიღოთ, ამიტომ მეხუთე რიცხვი -9 უნდა იყოს.

7 + 8 + 9 + 10 - 9 = 25

შეიზღუდა ერთ-ერთი დაკვირვება, მხოლოდ ოთხს აქვს ცვალებადობის თავისუფლება, მეხუთემ დაკარგა თავისუფლება. შესაბამისად, ჩვენს მაგალითში თავისუფლების ხარისხი df = 4, რაც ასე მიიღება: N – 1 = 5 – 1 = 4.

ახლა დავუშვათ, ხუთი ნებისმიერი რიცხვის არჩევა გვთხოვეს, რომელთაგან პირველი ორის ჯამი 9-ის ტოლი უნდა იყოს და ხუთივეს ჯამი 25-ს შეადგენდეს. ერთი შეზღუდვა აშკარაა, როდესაც ვამბობთ, რომ პირველი ორი რიცხვის ჯამი 9-ის ტოლი უნდა იყოს. მეორე შეზღუდვა მაშინ ჩნდება, როდესაც ვითხოვთ, რომ ხუთივე რიცხვის ჯამი 25 იყოს. სხვა სიტყვებით, ორი თავისუფლების ხარისხი დავკარგეთ და გვრჩება df = 3 ანუ N – 2 = 5 – 2 = 3.
(Cohen and Holliday 1996: 113)

      ნიშანთა შეუღლების ცხრილისთვის თავისუფლების ხარისხი გულისხმობს განაპირა ჯამების პირობებში ცხრილის უჯრებში მნიშვნელობების ჩაწერის თავისუფლებას და ეს ხარისხი, ჩვეულბრივ, არის (სტრიქონების რაოდენობა - 1) + (სვეტების რაოდენობა - 1). თავისუფლების ხარისხის სხვადასხვა ვარიანტი არსებობს და ამ საკითხთან დაკავშირებით მკითხველს უფრო დეტალური ტექსტების გაცნობას ვურჩევდით. აქ არ ვაპირებთ თავისუფლების ხარისხის შესახებ უფრო ვრცლად საუბარს, ვინაიდან ის ავტომატურად ითვლება ისეთ სტატისტიკურ პროგრამებში, როგორიც SPSS-ია.

ურთიერთკავშირის გაზომვა

      განათლების სფეროს კვლევის დიდი ნაწილი ცვლადებს შორის მიმართებების დადგენას შეეხება. მაგალითად, შეიძლება გვსურდეს, ვიცოდეთ, თუ როგორ უკავშირდება დამნაშავეობა სოციალურ კლასს; არსებობს თუ არა კავშირი განათლებაზე დახარჯული წლების რაოდენობასა და შემდგომში წლიურ შემოსავალს შორის; არის თუ არა რაიმე კავშირი პიროვნებასა და მიღწევას შორის. მაგალითად, არსებობს თუ არა რაიმე მიმართება საჯარო ბიბლიოთეკის წევრობასა და სოციალური კლასს შორის და თუ არსებობს, როგორია ეს მიმართება? არის თუ არა კავშირი სოციალურ კლასსა და საშუალო სკოლის პროგრამის სხვადასხვა სტრატაში მოხვედრას შორის? არსებობს თუ არა რაიმე კავშირი სქესსა და მანქანის მართვის გამოცდის (პირველად გასვლა) შედეგებს შორის?

      ურთიერთკავშირის რამდენიმე მარტივი საზომი არსებობს, რომელიც ასეთი ურთიერთმიმართებების შემოწმების შესაძლებლობას იძლევა. ჩვენ ყველაზე ფართოდ გავრცელებული ასეთი საზომები შევარჩიეთ, რომლებიც შეჯამებული სახით წარმოდგენილია ჩანართში 24.23.

-------------------------
ჩანართი 24.23
კავშირის გავრცელებელი საზომები

წყარო: Mouly 1978
-------------------------

      ჩანართში 24.23 წარმოდგენილი საზომებიდან ყველაზე მეტად გამოიყენება სპირმენის რანგული კორელაციის კოეფიციენტი რიგის სკალის მონაცემებისთვის და პირსონის შერეული მომენტის კორელაცია ინტერვალებისა და შეფარდების სკალების მონაცემებისთვის. ახლა მართებულია, რომ ცვლადების ბუნების აღსაწერად 24.23 ჩანართში გამოყენებული ზოგიერთი ტერმინი აგიხსნათ. კოენისა და ჰოლიდეის (1982; 1996) ნაშრომში წარმოდგენილია ამ ჩანართში ჩამოთვლილი კორელაციური ტექნიკების გამოყენებით ამოხსნილი ამოცანების მაგალითები და, ასევე, ურთიერთკავშირის სხვა საზომები, როგორიცაა კრუსკალის გამა, სომერსის დ და გატმანის ლამბდა.

      დააკვირდით 24.13 ჩანართის პირველ სტრიქონში მოცემულ სიტყვებს პირსონის შერეული მომენტის საზომთან მიმართებაში. ვხედავთ, რომ ცვლადები არის „უწყვეტი“ და გაზომვის „ინტერვალებისა და შეფარდების“ სკალებს მიეკუთვნება.

      უწყვეტია ცვლადი, რომელსაც, თეორიულად მაინც, სკალის ორ წერტილს შორის ნებისმიერი მნიშვნელობის მიღება შეუძლია. მაგალითად, წონა უწყვეტი ცვლადია. იგივე შეიძლება ითქვას დროისა და სიმაღლის შესახებ. წონამ, დრომ და სიმაღლემ ნებისმიერი შესაძლო მნიშვნელობა შეიძლება მიიღოს ნულსა და უსასრულობას შორის. ამ დიაპაზონში მათ რეალურად გაზომვას მხოლოდ სათანადო საზომი ინსტრუმენტის ცვალებადობა ზღუდავს.

      ისევ მივუბრუნდეთ 24.23 ჩანართს და ვნახოთ, რა ხდება მეორე საზომთან (რანგული კორელაციის კოეფიციენტი ანუ კენდელის ტაუ) დაკავშირებით: აქ ნათქვამია, რომ ორი უწყვეტი ცვლადი გაზომვის რიგის სკალას მიეკუთვნება. ასოციაციის საზომი ფი კოეფიციენტის (24. 23 ჩანართის ცხრილის შუა ნაწილისკენ) გამოთვლაში ჩართული ცვლადები აღწერილია, როგორც „ჭეშმარიტად დიქოტომიური“ და გაზომვის სახელდების სკალაზე განთავსებული. ჭეშმარიტად დიქოტომიურ ცვლადებს (როგორიცაა სქესი ან მანქანის ტარების ტესტი) მხოლოდ ორი მნიშვნელობის მიღება შეუძლიათ (მამაკაცი და ქალი, გამოცდის ჩაბარება და გამოცდაზე ჩაჭრა).

      და ბოლოს, ყურადღება მიაქციეთ ტერმინს „წყვეტილი ანუ დისკრეტული ცვლადი“, რომელიც 24.23 ჩანართში მესამე სტრიქონში, კორეალციის წილის (ეტად) განსაზღვრისას გვხვდება. ადრე ვთქვით, რომ უწყვეტმა ცვლადმა სკალაზე ორ მნიშვნელობას შორის მოთავსებული ნებისმიერი მნიშვნელობა შეიძლება მიიღოს. ამის საპირისპიროდ, წყვეტილ, ანუ, დისკრეტულ ცვლადს მხოლოდ (სკალის კონკრეტული წერტილების შესატყვსი) მთელი რიცხვითი მნიშვნელობების მიღება შეუძლია. მაგალითად, უწყვეტი ცვლადია ფეხბურთის გუნდის წევრების რაოდენობა, რომელიც, ჩვეულებრივ, 11-ია, შეიძლება ნაკლებიც იყოს, მაგრამ ვერასოდეს იქნება, ვთქვათ, 7,5-ის ტოლი.

პროცენტული სხვაობა

      პროცენტული სხვაობა კავშირის მარტივი, ასიმეტრიული, საზომია. ასიმეტრიული საზომი ცალმხრივი კავშირის საზომია. შეგვიძლია ვთქვათ, რომ ესაა საზომი იმისა, თუ რამდენად მოიაზრებს ერთი ფენომენი მეორეს, მაგრამ არა - პირიქით. როგორც მალე ვნახავთ, სქესი შეიძლება მოიაზრებდეს მანქანის ტარების ტესტის წარმატებით ჩაბარებას ან გამოცდაზე ჩაჭრას, მაგრამ არა პირიქით. ასეთი კავშირი შებრუნებულად ვერასოდეს იქნება მართებული! საზომებს, რომლებიც ზომავს იმას, თუ რამდენად მოიაზრებს ორი ცვლადი ერთმანეთს, სიმეტრიული საზომები ეწოდებათ. ჩანართში 24.24 წარმოდგენილია საჯარო ბიბლიოთეკის წევრების პროცენტული განაწილება მათი სოციალური კლასისადმი მიკუთვნებულობის მიხედვით.

-------------------------
ჩანართი 24.24
საჯარო ბიბლიოთეკის წევრების პროცენტული განაწილება სოციალური კლასის მიხედვით


-------------------------

      რა შეგვიძლია გავიგოთ 24.24 ჩანართში წარმოდგენილი მონაცემებიდან? ერთი სტრიქონის სხვადასხვა სვეტში მოცემული პროცენტული მაჩვენებლების შედარებით შეგვიძლია ვნახოთ, რომ საჯარო ბიბლიოთეკის წევრთა შორის საშუალო კლასის წარმომადგენლები 49 პროცენტით მეტნი არიან, ვიდრე მუშათა კლასის წარმომადგენლები. ერთი და იგივე სვეტის სხვადასხვა სტრიქონში მოცემული რიცხვების შედარებით ვნახავთ, რომ 72 პროცენტით მეტი საშუალო კლასის წარმომადგენელი უფრო არის საჯარო ბიბლიოთეკის წევრი, ვიდრე - არ არის. მონაცემები ინდივიდების სოციალური კლასის სტატუსისა და საჯარო ბიბლიოთეკის წევრობის კავშირზე მიგვითითებენ.

      24.24 ჩანართში მოცემული მონაცემების წაკითხვის მეორე გზა პროცენტული თანაფარდობის (%R) გამოთვლაა. მაგალითად, 24.24 ჩანართის მეორე სტრიქონში წარმოდგენილ მონაცემებს შევხედოთ. თუ 63-ს 14-ზე გავყოფთ (%R=4.5), შეგვიძლია ვთქვათ, რომ საშუალო კლასის წარმომადგენლებზე ოთხნახევარჯერ მეტი მუშათა კლასის წარმომადგენელი არ არის საჯარო ბიბლიოთეკის წევრი. პროცენტული სხვაობის მნიშვნელობა 0-დან (ორი ფენომენის ერთმანეთისგან სრულიად დამოუკიდებლობიდან) 100 პროცენტამდე (საკვლევის მიმართულებით სრულ კავშირამდე) იცვლება. ის ძალიან მარტივია გამოსათვლელად და გასაგებად. თუმცა, საყურადღეობოა, რომ პროცენტული სხვაობა, როგორც აქ განვსაზღვრეთ, მხოლოდ მაშინ შეგვიძლია გამოვიყენოთ, როდესაც ცვლადის მხოლოდ ორი კატეგორია გვაქვს, რომლის პროცენტებსაც ვთვლით და, რომელსაც ვადარებთ. პროცენტების გამოთვლა SPSS-ში „ჩროსსტაბ“ ბრძანების გამოყენებით შეგვიძლია და ეს წიგნის წინამდებარე ნაწილის თანმხლებ ვებსახელმძღვანელოშიც არის მითითებული. ამ საკითხთან დაკავშირებით წიგნის თანმხლებ ვებ გვერდზე, ასევე, განხილულია ფი კოეფიციენტი, ტეტრაქრონიკული კორელაციის კოეფიციენტი r (rt), შეჭიდულობის კოეფიციენტი C და პარციალური კავშირების დამოუკიდებელი მნიშვნელოვნობის კრიტერიუმები.

კორელაციების ახსნა

      24.23 ჩანართში წარმოდგენილი კორელაციის ძირითადი ტექნიკებიდან სამი განსაკუთრებით საინტერესოა ჩვენთვის და სწორედ მათზე ვისაუბრებთ წინამდებარე თავის დარჩენილ ნაწილში. ესენია პირსონის შერეული მომენტის კორელაციის კოეფიციენტი, მრავალჯერადი კორელაცია და პარციალური, ანუ, ნაწილობრივი კორელაცია. ზოგადად, კორელაციური ტექნიკები ორი ცვლადის, ანუ, მონაცემთა ორი სიმრავლის შესახებ სამ კითხვაზე პასუხის გაცემას ემსახურება. პირველი კითხვაა: „არსებობს თუ არა კავშირი ორ ცვლადს (მონაცემთა სიმრავლეს) შორის?“ თუ ამ კითხვაზე პასუხია „დიახ“, მაშინ ჩნდება შემდეგი ორი კითხვა: „რა მიმართულება აქვს ამ კავშირს?“ და „რა სიდიდისაა ეს კავშირი?“ ამ კონტექსტში კავშირში ორი ცვლადის (ან მონაცემთა სიმრავლის) შეთანხმებულად/ერთად ცვლის ტენდენცია მოიაზრება. პირსონის შერეული მომენტის კორელაციის კოეფიციენტის, ასოციაციის ერთ-ერთი ყველაზე კარგად ცნობილი საზომის, მნიშვნელობა -1.0-დან +1.0-მდე იცვლება და ცვლადებს შორის კავშირს რაოდენობრივად გამოსახავს. კოეფიციენტის აღსანიშნად „r“ სიმბოლო გამოიყენება.

      როდესაც ორი ცვლადი (ან მონაცემთა სიმრავლე) ერთი მიმართულებით იცვლება, ანუ, ერთის მნიშვნელობის ზრდასთან ერთად მეორეს მნიშვნელობაც იზრდება, ან ერთის შემცირებას მეორეს კლება ახლავს თან, მაშინ ვამბობთ, რომ დადებითი (პოზიტიური) კავშირი არსებობს. ასეთი მიმართების ამსახველი კორელაციები „+“ ნიშნით აღინიშნება, რაც კავშირის დადებით ბუნებას გამოხატავს. ამრიგად, კოეფიციენტი +1.0 მიგვითითებს ორი ფაქტორს შორის იდეალურ, სრულ დადებით კორელაციაზე, როგორიც, მაგალითად, წრის რადიუსსა და დიამეტრს შორის არსებობს, ხოლო კოეფიციენტი +0.8 – მაღალ დადებით კორელაციაზე, როგორიც არსებობს, მაგალითად, აკადემიურ მიღწევასა და ინტელექტს შორის. სადაც კორელაციის კოეფიციენტის წინ არანაირი ნიშანი არ წერია, იქ დადებითი კორელაცია იგულისხმება. უარყოფითი (ნეგატიური) კორელაცია, ანუ, კავშირი მაშინ გვაქვს, როდესაც ერთი ცვლადის მნიშვნელობის მატებას მეორეს მნიშვნელობის კლება ახლავს თან და, პირიქით, როდესაც ერთი ცვლადის მნიშვნელობის კლებასთან ერთად, მეორე იმატებს. უარყოფითი კორელაციები „-“ ნიშნით აღინიშნება. ამგვარად, კოეფიციენტი -1.0 იდეალურ, სრულ უარყოფით კორელაციას ასახავს, როგორიც, მაგალითად, ბავშვის მიერ ტესტში დაშვებული შეცდომების რაოდენობასა და ამ ტესტში მიღებულ ქულას შორის არსებობს, ხოლო კოეფიციენტი -0.30 - სუსტ უარყოფით კორელაციას, როგორიცაა, მაგალითად, გაკვეთილების გაცდენასა და ინტელექტს შორის. კოეფიციენტის წინ მდგარი ნიშნები სხვას არაფერს გამოხატავენ, თუ არა - ორი ცვლადის (ან მონაცემთა სიმრავლის) კავშირის მიმართულებას.

      ზოგადად თუ ვიტყვით, მკვლევარს მიღებული კორელაციის ზომა, ანუ, სიდიდე უფრო მეტად აინტერესებს, ვიდრე მიმართულება. კორელაციის გამოთვლის პროცედურები ისეა აგებული, რომ ორ ნებისმიერ ცვლადს შორის არანაირი კავშირი გამოისახება ნულით (ანუ, 0.00), როგორც, ვთქვათ, სხეულის წონასა და ინტელექტს შორის. ეს ნიშნავს, რომ ერთი ცვლადის მნიშვნელობა აბსოლუტურად არ უკავშირდება მეორე ცვლადის მნიშვნელობას. თუ ერთი ცვლადის მნიშვნელობა მაღალია, მეორე შეიძლება ასევე მაღალი ან, პირიქით, დაბალი იყოს. იდეალური კორელაციები +1.00 და -1.00 იშვიათად გვხვდება და, როგორც ვნახავთ, სოციალურ კვლევაში კორელაციის კოეფიციენტები დაახლოებით +0.50-ის ტოლი ან უფრო ნაკლებია. კორელაციის კოეფიციენტი შეიძლება განვიხილოთ, როგორც მაჩვენებელი იმისა, თუ რამდენად არის შესაძლებელი ერთი მოცემული ცვლადით მეორეს წინასწარმეტყველება: ის კოვარიაციის ინდიკატორია. ორ ცვლადს შორის მიმართება შეგვიძლია ვიზუალურად გამოვსახოთ ორგანზომილებიან კოორდინატთა სისტემაში, სადაც თითო შეწყვილებული დაკვირვება ერთი წერტილით აღინიშნება. ამ გზით მიღებული წერტილების ერთობლიობას წერტილოვანი გაბნევის დიაგრამა ეწოდება და გაზომილ მახასიათებლებს შორის კავშირის ხარისხის გრაფიკულად შეფასების საშუალებას გვაძლევს. ჩანართში 24.25 მაგალითის სახით წარმოდგენილია განათლების სფეროს კვლევიდან აღებული ზოგიერთი წერტილოვანი გაბნევის დიაგრამა.

-------------------------
ჩანართი 24.25
კორელაციის წერტილოვანი გაბნევის დიაგრამები


-------------------------

      მიუხედავად იმისა, რომ კორელაციები კვლევაში ფართოდ გამოიყენება და მათი გამოთვლა და ინტერპრეტაცია საკმაოდ მარტივია, კორელაციური ანალიზის წარმოებისას მკვლევარმა ოთხი მომენტი უნდა გაითვალისწინოს:

  • არ დაუშვათ, რომ კორელაცია მიზეზ-შედეგობრივ კავშირს გულისხმობს (თუნდაც, იმიტომ, რომ, მაგალითად, დიდი ხელების ქონა, როგორც ჩანს, კორელირებს დიდი ფეხების ქონასთან, მაგრამ ეს არ ნიშნავს, რომ ინდივიდს იმიტომ აქვს დიდი ფეხები, რომ ხელებიც დიდი აქვს, ანუ, დიდი ფეხების ქონის მიზეზი არ არის დიდი ხელების ქონა).
  • ფრთხილად უნდა ვიყოთ, რომ არ დავუშვათ I გვარის შეცდომა - არ დავუჭიროთ მხარი ნულოვან ჰიპოთეზას, როდესაც ის სინამდვილეში მართალია.
  • ფრთხილად უნდა ვიყოთ, რომ არ დავუშვათ II გვარის შეცდომა - მხარი დავუჭიროთ ნულოვან ჰიპოთეზას, როდესაც ის სინამდვილეში არ არის მართალი.
  • სტატისტიკურ მნიშვნელოვნობაზე მითითებას ეფექტის ზომის მაჩვენებელიც უნდა ახლდეს თან.

      ჩანართში 24.26 წარმოდგენილია SPSS-ში კორელაციის კოეფიციენტის გამოთვლის ტიპური ფორმატი.

-------------------------
ჩანართი 24.26
პირსონის შერეული მომენტის კორელაციის კოეფიციენტი

      * კორელაცია მნიშვნელოვანია 0.05 დონეზე (ორმხრივი შემოწმება).
** კორელაცია მნიშვნელოვანია 0.01 დონეზე (ორმხრივი შემოწმება).
-------------------------

      ამ გამოგონილი მაგალითის შესახებ, რომელშიც 1,000 შემთხვევაა შეჯამებული, ოთხი რამ შეგვიძლია აღვნიშნოთ:

  • იმ უჯრების მარცხნივ და მარჯვნივ მდებარე უჯრებში, რომლებშიც რიცხვი „1“ წერია, ერთი და იგივე მონაცემებია წარმოდგენილი, ანუ, სარკისებურადაა ასახული და თუ ძალიან ბევრი ცვლადის კორელაცია გვექნება, უნდა გადავწყვიტოთ, 1-ის შემცველი უჯრების (იდეალური კორელაცია, რადგან აქ ცვლადი თავის თავთან კორელირებს) მარჯვნივ მოცემული კორელაციები განვიხილოთ თუ მარცხნივ მოცემული.
  • ყოველ უჯრაში, სადაც ორი განსხვავებული ცვლადი კორელირებს, სამი რიცხვია მოცემული: ზედა რიცხვი კორელაციის კოეფიციენტია, შუათანა - მნიშვნელოვნობის დონე, ხოლო ბოლო - შერჩევის მოცულობა.
  • SPSS-ში ვარსკვლავით („* “) აღინიშნება სტატისტიკურად მნიშვნელოვანი კორელაციები.
  • ყველა კორელაცია დადებითია, რადგან ცხრილში უარყოფითი კოეფიციენტი არსადაა მოცემული.

      ეს ცხრილი ინფორმაციას გვაწვდის კორელაციის სიძლიერის (კოეფიციენტის ზომის), მიმართულების (დადებითი და უარყოფითი) და მნიშვნელოვნობის დონის შესახებ. კორელაციის კოეფიციენტი შეგვიძლია ეფექტის ზომადაც მივიჩნიოთ. მნიშვნელოვნობის დონეს (როგორც ზემოთ ითქვა), SPSS კოეფიციენტისა და შერჩევის მოცულობის საფუძველზე, ავტომატურად ითვლის, ამიტომ, რაც უფრო დიდია შერჩევის მოცულობა, მით მცირე კორელაციის კოეფიციენტია საკმარისი, რომ კავშირი სტატისტიკურად მნიშვნელოვანი იყოს და, პირიქით, რაც უფრო მცირე ზომისაა შერჩევა, მით მაღალი კოეფიციენტია საჭირო, რომ კავშირი სტატისტიკურად მნიშვნელოვნი იყოს.

      კორელაციის აღნიშვნისას აუციელებელია ითქვას, თუ რომელი კრიტერიუმით იქნა იგი გამოთვლილი, რა მიმართულება აქვს (დადებითია თუ უარყოფითი) და მნიშვნელოვნების რა დონეზეა სტატისტიკურად სანდო (საჭიროებისამებრ). მაგალითად, ასე შეგვიძლია დავწეროთ:

პირსონის შერეული მომენტის კორელაციის გამოყენებით დადგინდა სტატისტიკურად მნიშვნელოვანი კორელაცია სკოლაში სიარულსა და გამოცდაზე მოსწავლეების მიერ ნაჩვენებ შედეგს შორის (r = 0.87, p = 0.035). მოსწავლეებმა, რომლებიც ყველაზე ხშირად ესწრებოდნენ მეცადინეობებს, უფრო მაღალი შეფასება მიიღეს გამოცდაზე, ხოლო ვინც ყველაზე ნაკლებად ესწრებოდა - ყველაზე დაბალი.

      გარდა ამისა, შეიძლება ზოგჯერ, პირიქით, მნიშვნელოვანია იმის აღნიშვნა, რომ კორელაცია არ იქნა დადგენილი, მაგალითად:

არ აღმოჩნდა სტატისტიკურად მნიშვნელოვანი კორელაცია საშინაო დავალების მომზადებისთვის დათმობილ დროსა და გამოცდის შედეგს შორის (r = 0.37, p = 0.43).

      კორელაციის წერილობით გაფორმების ორ მაგალითში მოცემულია ზუსტი მნიშვნელოვნობის დონეები, რომელსაც SPSS ავტომატურად ითვლის. ნაშრომში მნიშვნელოვნობის დონეების (საჭიროების შემთხვევაში) მითითების ალტერნატიული გზაც არსებობს: p < 0.05; p < 0.01; p = 0.05; p = 0.01. თუ სტატისტიკურად მნიშვნელოვანი კორელაცია ვერ მივიღეთ, მაშინ ვწერთ: p > 0.05 ან p = NS.

არაწრფივი დამოკიდებულება

      აქამდე განხილული კორელაციები წრფივ დამოკიდებულებას უშვებდა, ანუ, რაც უფრო მეტია ერთი თვისება, მით მეტია (ან ნაკლებია) მეორე, იქნება ეს დადებითი თუ უარყოფითი კავშირი. წერტილოვანი გაბნევის დიაგრამაზე შესაძლებელია წრფის (რეგრესიის წრფე) გავლება. თუმცა, წრფივი კავშირის არსებობას ყოველთვის ვერ დავუშვებთ. მაგალითად, განვიხილოთ სტრესის შემთხვევა: მცირეოდენმა სტრესმა შეიძლება გააუმჯობესოს შედეგი („ადრენალინის გამოყოფას შეუწყოს ხელი“), თუმცა, ძალიან ჭარბმა სტრესმა შეიძლება შედეგის გაუარესება გამოიწვიოს. სანამ სტრესი აუმჯობესებს შედეგს, დადებითი კორელაცია გვაქვს, ხოლო როდესაც ის შედეგის გაუარესებას იწყებს - უარყოფითი. შედეგად ვიღებთ არა წრფეს (რომელიც კავშირის წრფივობაზე მიგვითითებს), არამედ - მრუდს (რომელიც არაწრფივ დამოკიდებულებას ასახავს). ეს ყველაფერი გრაფიკულად შეგვიძლია გამოვსახოთ (ჩანართი 24.27). 24.27 ჩანართში წარმოდგენილ მაგალითში დაშვებულია, რომ კუნთური ძალის გაზომვა ერთ სკალაზეა შესაძლებელი. გრაფიკიდან ჩანს, რომ კუნთური ძალა მატულობს დაბადებიდან 50 წლის ასაკამდე და შემდეგ, კუნთების მოდუნებასთან ერთად, ისევ კლებულობს. გრაფიკის მარცხენა მხარე კუნთურ ძალასა და ასაკს შორის დადებით კორელაციას ასახავს, მარჯვენა კი - უარყოფითს, ანუ, არაწრფივი დამოკიდებულების შემთხვევასთან გვაქვს საქმე.

-------------------------
ჩანართი 24.27
არაწრფივი დამოკიდებულების ამსახველი მრუდი


-------------------------

      ჰოპკინსი და მისი კოლეგები (1996: 92) არაწრფივი დამოკიდებულების სხვა მაგალითს გვთავაზობენ: ოთახის ტემპერატურა და კომფორტი. ტემპერატურის ოდნავ მომატებით შეიძლება მეტი კომფორტი შევიქმნათ - დადებითი კორელაცია, თუმცა, კიდევ უფრო მომატებით უკვე დისკომფორტი გვექმნება - უარყოფითი კორელაცია. ბევრი კორელაციური სტატისტიკური სიდიდე უშვებს წრფივი დამოკიდებულების არსებობას (მაგალითად, პირსონის შერეული მომენტის კოეფიციენტი). თუმცა, კორელაციური სტატისტიკის გაუაზრებლად ან ბრმად გამოყენების ნაცვლად, უმჯობესია, მკვლევარი დაფიქრდეს, სინამდვილეში, მიზანშეწონილია თუ არა წრფივი კავშირის არსებობის დაშვება და იქნებ უფრო მართებული იყოს არაწრიფივი დამოკიდებულება (ამ შემთხვევაში, მას უფრო რთული სტატისტიკა დასჭირდება, მაგალითად, η („ეტა“)) (Cohen and Holliday 1996: 84; Glass and Hopkins 1996, ნაწილი 8.7; Fowler et al. 2000: 81 – 89). არის კიდევ ერთი გზა: მათემატიკური პროცედურების გამოყენებით შესაძლებელია არაწრფივი დამოკიდებულების წრფივ დამოკიდებულებად გარდაქმნა. არაწრფივი დამოკიდებულების მაგალითებია:

  • დირექტორის ზეწოლა და მასწავლებლის მუშაობის შედეგი;
  • მასწავლებლის ზეწოლა და მოსწვლის აკადემიური მოსწრება;
  • სასწავლო მასალის სირთულე და მოსწავლის აკადემიური მოსწრება;
  • თავდაჯერებულობა და წარმატება;
  • ასაკი და კუნთური ძალა;
  • ასაკი და ფიზიკური კონტროლი;
  • ასაკი და ყურადღების კონცენტრაცია;
  • ასაკი და სოციაბილურობა;
  • ასაკი და კოგნიტური უნარები.

      ჰოპკინსი და მისი კოლეგები (1996) თვლიან, რომ ცვლადი „ასაკი“ ხშირად არაწრფივად უკავშირდება სხვა ცვლადებს და ასევე, მიუთითებენ, რომ ცუდად აგებულმა ტესტმა შეიძლება არაწრფივი დამოკიდებულების შთაბეჭდილება შექმნას, თუ ტესტი ძალიან მარტივია („ჭერის ეფექტი“, როდესაც მოსწავლეთა უმრავლესობა მაღალ ქულას იღებს) ან ძალიან რთულია, თუმცა, სინამდვილეში, ეს არაწრფივობა მოჩვენებითია, რადგან ტესტის დებულებები არასაკმარისად რთულია ან არასაკმარისი დისკრიმინაციულობით ხასიათდებიან (Hopkins et al. 1996: 92). ამრიგად, კორელაციური კვლევის დაგეგმვისას ყურადღება უნდა მივაქციოთ, ცვლადებს შორის რა ტიპის დამოკიდებულების არსებობას ვუშვებთ - წრფივის თუ არაწრფივის.

კორელაციის კოეფიციენტები

      კორელაციის კოეფიციენტი ორ ცვლადს შორის კავშირის შესახებ გვაწვდის ინფორმაციას; თუმცა, არსებობს სხვა საზომები, რომლებიც ისეთი კავშირების დაზუსტების საშუალებას იძლევა, რომელშიც ორზე მეტი ცვლადია ჩართული. ისინი „მრავალჯერადი კორელაციის“ და „პარციალური კორელაციის“ საზომების სახელითაა ცნობილი.

      მრავალჯერადი კორელაციის საზომები ერთდროულად სამ ან მეტ ცვლადს შორის კავშირის ხარისხზე მიუთითებენ. მაგალითად, შესაძლოა, დანაშაულს, სოციალურ კლასსა და დასვენების საშუალებებს შორის კავშირის სიძლიერის ცოდნა გვსურდეს. ან შეიძლება აკადემიურ მოსწრებას, ინტელექტსა და ნეიროტიციზმს შორის კავშირის დადგენით ვიყოთ დაინტერესებული. მრავალჯერადი კორელაცია, ანუ, „რეგრესია“, როგორც ზოგჯერ უწოდებენ, ნ ცვლადს შორის კავშირის ხარისხს გვიჩვენებს. ის არა მარტო დამოუკიდებელი და დამოკიდებული ცვლადების კორელაციას, არამედ - დამოკიდებული ცვლადების ურთიერთკორელაციებსაც უკავშირდება.

      პარციალური (ანუ, ნაწილობრივი) კორელაცია მიზნად ისახავს ორ ცვლადს შორის კავშირის ხარისხის დადგენას მესამე ცვლადის გავლენის გაკონტროლების ან ნაწილობრივ ჩამოშორების პირობებში. გილფორდი და ფრაჩერი (Gუილფორდ and Fრუცჰტერ 1973) ორი ცვლადის პარციალურ კორელაციას განმარტავენ, როგორც კორელაციას, რომელიც ანულებს კორელირებულ ორ ცვლადზე მესამე ცვლადის (ან რამდენიმე ცვლადის) ეფექტს. მათ მაგალითის სახით მოაქვთ სხვადასხვა ასაკის ვაჟებისგან შემდგარი ჯგუფის წევრების სიმაღლისა და წონის კორელაცია, სადაც კორელაცია უფრო მაღალი იქნება წონასა და სიმაღლეს შორის, ვიდრე ჯგუფში, რომელიც მხოლოდ ერთი ასაკის ვაჟებისგან შედგება. ამის მიზეზი ნათელია: რადგან პირველ ჯგუფში ზოგი ვაჟი უფროსი იქნება და, შესაბამისად, უფრო მაღალი და მძიმე წონის. მაშასადამე, ასაკი ის ფაქტორია, რომელიც სიმაღლესა და წონას შორის კორელაციას ზრდის. რა თქვა უნდა, ასაკის გაკონტროლების (მუდმივად შენარჩუნების) შემთხვევაშიც კი, განურჩევლად ასაკისა, მაინც დადებითი და მნიშვნელოვანი კორელაცია გვექნება, რადგან მოსალოდნელია, რომ უფრო მაღალი ვაჟები წონით უფრო მძიმეებიც იქნებიან. განვიხილოთ კალათბურთში მიღწეულ წარმატებასა და კალათბურთის თამაშის გამოცდილებას შორის კავშირი. დავუშვათ, მესამე ფაქტორიც არსებობს. ცნობილია, რომ მოთამაშეების სიმაღლე მნიშვნელოვნად მოქმედებს დანარჩენ ორ ფაქტორზე. პარციალური კორელაციის ტექნიკების გამოყენებით შესაძლებელია ძირითადი ცვლადის კავშირის გაზომვა და, ამასთან, მეორადი ცვლადის ზემოქმედების გამორიცხვა. კორელაციური ანალიზი მარტივია - ცდის პირთა ერთი და იგივე ჯგუფისთვის ორი ან მეტი ქულის მოგროვებასა და კორელაციის კოეფიციენტის გამოთვლას გულისხმობს. ამ მარტივ დიზაინზე ბევრი სასარგებლო კვლევაა აგებული. თუმცა, ის კვლევები, სადაც უფრო რთულ, კომპლექსურ ურთიერთობებს შეისწავლიან, საკვლევი მიმართებების უფრო ზუსტი სურათის მისაღებად მრავალჯერად და პარციალურ კორელაციებს იყენებენ. და ერთი ბოლო შენიშვნა: აუცილებლად უნდა აღვნიშნოთ, რომ კორელაცია კავშირის საზომია და აუცილებლობით არ მიუთითებს ცვლადებს შორის მიზეზშედეგობრვი კავშირის არსებობაზე. კორელაცია მიზეზს არ გულისხმობს.

კორელაციის კოეფიციენტის ინტერპრეტაცია

      კორელაციის კოეფიციენტის გამოთვლის შემდეგ მისი ინტერპრეტაციის პრობლემა დგება. ამასთან დაკავშირებით ხშირად ისმის კითხვა, თუ რა სიდიდის უნდა იყოს კორელაციის კოეფიციენტი, რომ მნიშვნელობის მქონედ ჩავთვალოთ. ამ კითხვაზე პასუხის გაცემის სამი გზა არსებობს: კავშირის სიძლიერის, კავშირის სტატისტიკური მნიშვნელოვნობისა და კორელაციის კოეფიციენტის კვადრატის შესწავლა. კორელაციის კოეფიციენტის რიცხვობრივი მნიშვნელობის სიდიდე ზუსტად მიგვითითებს საკვლევ ცვლადებს შორის კავშირის სიძლიერეზე. დაბალი ან ნულთან მიახლოებული მნიშვნელობები სუსტ კავშირზე მიუთითებს, ხოლო თითქმის +1-ის ან -1-ის ტოლი - უფრო ძლიერ კავშირებზე. მაგალითისთვის, დავუშვათ, ხუთწლიანი სამუშაო გამოცდილების მქონე მასწავლებლის კლასში წარმატებულობა კორელაციაშია უნივერსიტეტის დამამთავრებელ ჯამურ ქულასთან და კორელაციის კოეფიციენტი r =+0.19. ახლა დავუშვათ, მასწავლებლის კლასში წარმატებულობის საზომზე მიღებული ქულა კორელაციაშია პროფესიული მიღწევის მოთხოვნილების საზომზე მიღებულ ქულასთან და ამ კორელაციის კოეფიციენტი 0.65-ის ტოლია. შეგვიძლია დავასკვნათ, რომ წარმატებულობისა და პროფესიული მიღწევის მოთხოვნილების ქულებს შორის უფრო ძლიერი კავშირია, ვიდრე - წარმატებულობასა და უნივერსიტეტის საბოლოო ქულას შორის.

      როდესაც კორელაციის კოეფიციენტს შერჩევიდან ვიღებთ და გვინდა, რომ ის მთლიანი პოპულაციის შესახებ დასკვნის გასაკეთებლად გამოვიყენოთ, მაშინ მიღებული კორელაციის სტატისტიკურ მნიშვნელოვნობა უნდა განვიხილოთ. კორელაციის კოეფიციენტის მნიშვნელოვნობის დონე აჩვენებს განსხვავებულია თუ არა ნულისგან მიღებული კორელაცია, სანდოობის მოცემულ დონეზე. როგორც უკვე ვნახეთ, სტატისტიკურად მნიშვნელოვანი კორელაცია რეალურად არსებულ კავშირზე მიგვითითებს და არა - სრულიად შემთხვევითზე. კორელაციის სტატისტიკური მნიშვნელოვნობის დონეს მეტწილად იმ შემთხვევათა რაოდენობა განაპირობებს, რომლისთვისაც და რომელზე დაყრდნობითაც გამოითვლება კორელაციის კოეფიციენტი. ამგვარად, რაც უფრო მეტია შემთხვევათა რაოდენობა, კორელაციის კოეფიციენტის მით უფრო დაბალი მნიშვნელობაა საკმარისი, რომ კავშირი სტატისტიკურად მნიშვნელოვნად ჩაითვალოს სანდოობის მოცემულ დონეზე.

      კვლევების ინტერპრეტაცია, რომლებშიც მიზნად ისახავენ კავშირის შესწავლას, ზოგადად, მათ სტატისტიკურ მნიშვნელოვნობაზე მითითებით ხდება, ხოლო კვლევები, რომელთა უმთავრესი მიზანი წინასწარმეტყველებაა, კორელაციის კოეფიციენტის სიძლიერეზეა დამოკიდებული. Aამიტომ, ამ უკანასკნელში კოეფიციენტი გაცილებით მაღალი უნდა იყოს, ვიდრე მიმართებების შემსწავლელ კვლევებში და ამიდენად, მნიშვნელოვნობის ცნებას იშვიათად ეხებიან.

      კოეფიციენტის ინტერპრეტაციისადმი მესამე მიდგომა კორელაციის კოეფიციენტის კვადრატში აყვანას (r2) წარმოადგენს. კოეფიციენტის კვადრატი გვიჩვენებს ერთი ცვლადის დისპერსიის იმ წილს, რომელიც მეორე ცვლადთან მის წრფივ კავშირს შეგვიძლია მივაწეროთ. სხვა სიტყვებით, ის ორი ცვლადისთვის საერთო ნაწილის ოდენობაზე მიგვითითებს. თუ, მაგალითად, A და B ცვლადებს შორის კორელაცია 0.50-ია, მაშინ B ცვლადის ქულების ცვალებადობის 0.25 (0.502) წილი შეგვიძლია მივაწეროთ B ცვლადის ტენდენციას, წრფივად შეიცვალოს A ცვლადის ქულების ცვლასთან ერთად. ჩანართში 24.28 გრაფიკულადაა მოცემული კითხვისა და მათემატიკის ქულების საერთო დისპერსია იმ შემთხვევისთვის, როდესაც მათ შორის კორელაციის კოეფიციენტი 0.65-ის ტოლია.

-------------------------
ჩანართი 24.28
კითხვისა და მათემატიკის ქულებს შორის 0.65-ის ტოლი კორელაციის კოეფიციენტის ვიზუალური გამოსახულება

      წყარო: Fox 1969
-------------------------

      კორელაციის კოეფიციენტის ინტერპრეტაციისას სამი რამ უნდა გვახსოვდეს: პირველი, კოეფიციენტი მარტივი რიცხვია და არ უნდა იქნეს ინტერპრეტირებული, როგორც პროცენტი. კორელაცია, რომელიც 0.50-ის ტოლია, არ ნიშნავს ცვლადებს შორის 50 პროცენტიან კავშირს. ასევე, 0.50-ის ტოლი კორელაციის კოეფიციენტი არ გვიჩვენებს ორჯერ მეტ კორელაციას, ვიდრე კოეფიციენტი 0.25. 0.50-ის ტოლი კორელაციის კოეფიციენტი, სინამდვილეში გვიჩვენებს, რომ 0.25-ის ტოლი კოეფიციენტის მქონე კორელაციასთან შედარებით, ცვლადებს შორის კიდევ უფრო ძლიერი კავშირია, ვიდრე - ორჯერ მეტი. ფაქტობრივად, რაც უფრო უახლოვდება კოეფიციენტის მნიშვნელობა +1 ან -1-ს, კოეფიციენტის აბსოლუტურ მნიშვნელობებს შორის უფრო მნიშვნელოვანი ხდება, ვიდრე იგივე ზომის განსხვავება დაბალი კორელაციების შემთხვევაში.

      მეორე, კორელაცია, როგორც უკვე აღვნიშნეთ, აუცილებლობით არ გულისხმობს ორ ცვლადს შორის მიზეზ-შედეგობრივ კავშირს. მაშასადამე, არ უნდა ვიფიქროთ, რომ ერთი ფაქტორი იწვევს მეორე ფაქტორის ქულების სწორედ ამგვარ და არა სხვა მნიშვნელობებს. ყოველთვის არსებობს მესამე ფაქტორი, რომელიც ზემოქმედებს ორივე საკვლევ ცვლადზე. სავარაუდო მიზეზშედეგობრივი კავშირები შემდგომი ექსპერიმენტული კვლევით უნდა დადასტურდეს.

      მესამე, კორელაციის კოეფიციენტის ინტერპრეტაცია არ უნდა მოხდეს არანაირი აბსოლუტური მნიშვნელობით. პოპულაციის მოცემული შერჩევის კორელაციის მნიშვნელობა აუცილებლობით არ იქნება იგივე, რასაც იმავე პოპულაციიდან აღებულ სხვა შერჩევაში მივიღებთ. კორელაციის მოცემული კოეფიციენტის მნიშვნელობაზე ბევრი ფაქტორი ზემოქმედებს და შერჩევებში მიღებული კორელაციის თუ იმ პოპულაციაზე განზოგადება გსურს, საიდანაც ავიღეთ ეს შერჩევები, მაშინ კორელაციის მნიშვნელოვნობა უნდა შევამოწმოთ.

      ქვემოთ კორელაციის კოეფიციენტების ინტერპრეტაციისთვის ზოგად მითითებებს გთავაზობთ. ეს მითითებები ბორგისეულ (1963) ანალიზს ეფუძნება და უშვებს, რომ კორელაცია 100 ან მეტ ცდის პირისთვისაა გამოთვლილი.

კორელაციის კოეფიციენტი 0.20 - 0.35

      კორელაციები, რომლებიც ხვდება 0.20 - 0.35 შუალედში, ცვლადებს შორის მხოლოდ სუსტ კავშირზე მიგვითითებს, თუმცა, შეიძლება სტატისტიკურად მნიშვნელოვანი იყოს. კორელაციის კოეფიციენტი 0.20 გვიჩვენებს, რომ ორი საზომისთვის დისპერსიის მხოლოდ 4 პროცენტია ({0.20×0.20}×100) საერთო. ამ დონის კორელაციებს შეიძლება შეზღუდული მნიშვნელობა ჰქონდეთ ურთიერთობების, კავშირების შემსწავლელი კვლევებისთვის, თუმცა, ინდივიდუალური თუ ჯგუფური წინასწარმეტყველების კვლევებისთვის სრულიად უმნიშვნელო და უსარგებლოა.

კორელაციის კოეფიციენტი 0.35 - 0.65

      ამ დიაპაზონში კორელაციები სტატისტიკურად მნიშვნელოვანია ერთ პროცენტიანი დონის მიღმა. როდესაც კოეფიციენტი დაახლოებით 0.40-ის ტოლია, შესაძლებელია უხეში ჯგუფური წინასწარმეტყველება. როგორც ბორგი (1963) აღნიშნავს, ამ შუალედში მოხვედრილი კორელაციები გამოსადეგია, თუმცა, მხოლოდ მრავალჯერადი რეგრესიის განტოლებაში სხვა კორელაციებთან კომბინაციაში. ამ დიაპაზონის რამდენიმე კორელაციის კომბინირებით, ზოგ შემთხვევაში, შესაძლებელია ცალკეული წინასწარმეტყველება, რომელიც, შეცდომის მისაღებ ფარგლებში, სწორი იქნება. ამ დონის ცალკე, დამოუკიდებლად გამოყენებული კორელაციები ბევრს არაფერს მატებს ინდივიდუალურ წინასწარმეტყველებას, ვინაიდან ისინი სულ ოდნავ მეტი სიზუსტით წინასწარმეტყველებენ, ვიდრე ვარაუდით ან შემთხვევითად შერჩევის ზოგიერთი პროცედურის გამოყენებითაა შესაძლებელი.

კორელაციის კოეფიციენტი 0.65 - 0.85

      ამ შუალედში მოხვედრილი კორელაციები შესაძლებელს ხდიან საკმარისად ზუსტ ჯგუფურ წინასწარმეტყვლებას დიაპაზონის ზედა ზღვართან მიახლოებული კორელაციებით ძალიან ზუსტად შეიძლება წინასწარმეტყველება: ჩვეულებრივ, შერჩევის ამოცანის გადაწყვეტისას, შეცდომის ძალიან მცირე ფარგლებში, საკმარისი სიზუსტით წინასწარმეტყველებენ წარმატებული კანდიდატების ფარდობითი წილის შესახებ. კორელაციების ამ დიაპაზონის ზედა ზღვართან მიახლოებული კოეფიციენტების მიხედვით გაცილებით მეტი სიზუსტით შეგვიძლია ინდივიდუალური წინასწარმეტყველება, ვიდრე შერჩევის ასეთი პროცედურების გამოყენების გარეშე შევძლებდით.

0.85-ზე მეტი კორელაციის კოეფიციენტი

      ასეთი მაღალი კორელაცია ორ ცვლადს შორის მჭიდრო კავშირზე მიუთითებს. 0.85-ის ტოლი კორელაციის კოეფიციენტი გვიჩვენებს, რომ წინასწარმეტყველებისთვის გამოყენებულ საზომსა (ანუ ცვლადს) და ნაწინასწარმეტყველებ მეორე საზომს (ანუ ცვლადს) დისპერსიის დაახლოებით 72 პროცენტი საერთო აქვთ. განათლების სფეროში წარმოებულ კვლევებში, რომელთა უპირველესი მიზანი წინასწარმეტყველებაა, იშვიათად იღებენ ასეთ მაღალ კორელაციებს, თუმცა, როცა მაინც იღებენ, მათ როგორც ინდივიდუალური, ისე - ჯგუფური წინასწარმეტყველებისთვის იყენებენ.

რეგრესიული ანალიზი

      რეგრესიული ანალიზი მკვლევარს საშუალებას აძლევს, იწინასწარმეტყველოს „ერთი ცვლადის კონკრეტული მნიშვნელობა, როდესაც ვიცით (ან ვუშვებთ) მეორე ცვლადის (ცვლადების) მნიშვნელობა“ (Cohen and Holliday 1996: 88). ეს ცვლადების კავშირის მოდელირების საშუალებაა. წინამდებარე თავში მარტივ წრფივ რეგრესიასა და მრავალჯერად რეგრესიას განვიხილავთ.

მარტივი წრფივი რეგრესია

      მარტივი წრფივი რეგრესიის მოდელი მოიცავს ერთ ამხსნელ (დამოუკიდებელი ცვლადი) და ერთ ახსნილ ცვლადს (დამოკიდებული ცვლადი). მაგალითად, შეიძლება მეცადინეობაზე დახარჯული დროის (საათების) გამოცდაზე მიღებულ შეფასებაზე გავლენის ნახვა გვინდოდეს, რათა შეგვეძლოს იმის დანახვა, თუ რამდენად გაუმჯობესდება გამოცდის ნიშანი, თუ მოსწავლე მოცემული დროის (საათებს) განმავლობაში იმეცადინებს. მეცადინეობისთვის დათმობილი დრო (საათები) დამოუკიდებელი ცვლადია, ხოლო გამოცდაზე მიღწეული შედეგი - დამოკიდებული. კოორდინატთა სისტემაში, ტრადიციულად, როგორც 24.29 ჩანართში მოცემულ მაგალითში, დამოუკიდებელი ცვლადი ვერტიკალურ ღერძზე აღინიშნება, დამოკიდებული კი - ჰორიზონტალურზე. ჩანართში 24.29 წარმოდგენილ მაგალითში შეჯამებულია 50 მოსწავლის შემთხვევა მეცადინეობისთვის დათმობილი დროისა და გამოცდაზე მიღებული ნიშნის მიხედვით და ამ ორი ცვლადის განაწილების საჩვენებლად აგებულია წერტილთა გაბნევის დიაგრამა (SPSS ამ მოქმედებას ორ-სამ ღილაკზე დაჭერით ასრულებს). გრაფიკზე ორ ცვლადს შორის კავშირის საჩვენებლად საუკეთესოდ მორგებული წრფეც გავლებულია (SPSS ამასაც იოლად აკეთებს). საუკეთესოდ მორგებული წრფე არის უახლოესი წრფე, რომელიც შეიძლება აიგოს ქულების დისპერსიის გათვალისწინებით და ისე, რომ მონაცემთა ნახევარი მის ზემოთ აღმოჩნდეს, ნახევარი კი - მის ქვემოთ და ყოველი წერტილიდან მინიმალური შესაძლებელი მანძილით იყოს დაშორებული. მაგალითად, შეგვიძლია ვნახოთ, რომ ზოგი ქულა ძალიან ახლოსაა წრფესთან, ზოგი - შორის. არსებობს ამ წრფის განტოლება, რომლითაც შესაძლებელია მისი გამოთვლა, თუმცა ახლა აქ ამაზე არ შევჩერდებით.

-------------------------
ჩანართი 24.29
წერტილთა გაბნევის დიაგრამა რეგრესიის წრფით


-------------------------

      გრაფიკიდან ჩანს, რომ, ზოგადად, რაც უფრო მეტია მეცადინეობისთვის დათმობილი დრო, მით მაღალია მიღწევის დონე. ეს კორელაციას ჰგავს. საუკეთესოდ მორგებული წრფე აქ არა მარტო დადებით კავშირს გამოხატავს, არამედ იმასაც, რომ ეს კავშირი ძლიერია (წრფის დახრილობა საკმაოდ დიდია, ანუ, წრფე საკმაოდ ციცაბოა). თუმცა, რეგრესია კორელაციისგან იმით განსხვავდება, რომ ის ერთი ცვლადის მნიშვნელობის ზუსტ წინასწარმეტყველებას იძლევა, როდესაც ვიცით მეორე ცვლადის მნიშვნელობა. მაგალითად, შეგვიძლია გამოვიცნოთ მიღწევის დონის მაჩენებელი, თუ მოსწავლემ იმეცადინა, ვთქვათ, ორი საათი (43 ქულა 80-დან), ოთხი საათი (72 ქულა 80-დან), ცხადია, დისპერსიის გათვალისწინების გარეშე. წერტილთა გაბნევის დიაგრამის გაგების გასამარტივებლად (მაგალითად, SPSS-ში) მასზე, მაგალითად, ბადის დამატება შეგვიძლია (ჩანართი 24.30).

-------------------------
ჩანართი 24.30
წერტილთა გაბნევის დიაგრამა რეგრესიის წრფით


-------------------------

      წრფის ფარგლებს გარეთ წინასწარმეტყველება სარისკოა. მარტივი რეგრესია მხოლოდ რეალური წრფის ფარგლებში მოხვედრილი მნიშვნელობების გამოსათვლელად გამოიყენება და არა - ამ ფარგლების მიღმა. ასევე, შეგვიძლია დავინახოთ, რომ, მართალია შესაძლებელია საუკეთესოდ მორგებული წრფის აგება (SPSS ამას ავტომატურად აკეთებს), მონაცემების შესატყვისი წერტილები მეტ-ნაკლებად დაშორებული იქნება მისგან, ანუ, ზოგი უფრო ახლოს იქნება, ზოგი - უფრო შორს. წრფესა და მონაცემების აღმნიშვნელ წერტილებს შორის მანძილს ნაშთი ეწოდება და ნებისმიერ ანალიზში ეს მანძილებიც უნდა აღინიშნოს (მათი გამოთვლა სტატისტიკური ფორმულით ხდება, თუმცა, ახლა ამაზე აქ არ შევჩერდებით).

      რეგრესიის წრფისა და კოორდინატთა სისტემის ვერტიკალური ღერძის გადაკვეთის წერტილს თანაკვეთა ეწოდება. ამ თემას მოგვიანებით კიდევ მივუბრუნდებით, თუმცა ახლა ვიტყვით, რომ რეგრესიის წრფე არასოდეს იწყება ნულოვანი წერტილიდან იგი ვერტიკალურ ღერძზე ოდნავ ზემოდან იწყება.

      ფაქტობრივად, რეგრესიის წრფის ასაგებად ყველა საჭირო გამოთვლა ავტომატურად კეთდება SPSS-ში.

      ჩანართში 24.31 წარმოდგენილია SPSS-ის გამოთვლების ტიპური შედეგი.

-------------------------
ჩანართი 24.31
რეგრესიული ანალიზი: SPSS-ში წარმოებული გამოთვლის ტიპური შედეგი


-------------------------

      ცხრილში მოცემულია R კვადრატი (r square), რომელიც გვიჩვენებს, თუ დამოკიდებული ცვლადის დისპერსიის რა ნაწილი აიხსნება გამოთვლაში მონაწილე დამოუკიდებელი ცვლადით. პირველ რიგში, ყურადღება მიაქციეთ, რომ ცხრილში ჯერ მოცემულია R კვადრატი, რომელიც 0.632-ის ტოლია და გვიჩვენებს, რომ რეგრესიის მოდელში დისპერსიის 63.2 პროცენტია გათვალისწინებული, რაც მაღალი მაჩვენებელია. მორგებული R კვადრატი (Adjusted R square) უფრო ზუსტია და მის გამოყენებას გირჩევთ, ვინაიდან მასში ავტომატურად არის გათვალისწინებული დამოუკიდებელი ცვლადების რაოდენობა. მორგებული R კვადრატის მნიშვნელობა, ჩვეულებისამებრ, უფრო მცირეა ხოლმე, ვიდრე R კვადრატის, რადგან მასში ის ფაქტიც გათვალისწინებულია, რომ ჩვენ შერჩევის მონაცემების მიხედვით ვაწარმოებთ გამოთვლებს და არა - პოპულაციის. ამ მაგალითში მორგებული R კვადრატის მნიშვნელობა 0.625-ია და, ისევ და ისევ, გვიჩვენებს, რომ ჩვენს მიერ აგებულ რეგრესიის მოდელში დამოუკიდებელი ცვლადი დამოკიდებული ცვლადის დისპერსიის 62.5 პროცენტს ხსნის, რაც მაღალი მაჩვენებელია, ესე იგი, ჩვენი რეგრესიის მოდელი ძლიერია. მუიჯსი (2004: 165) თვლის, რომ მორგებული R კვადრატის შემთხვევაში, შესატყვისობის სიკარგე შემდეგი ნიშნულებით განისაზღვრება:

      <0.1 / სუსტი
0.11 - 0.3 / ზომიერი
0.31 - 0.5 / საშუალო
>0.5 / ძლიერი

      მეორე, ამის შემდეგ SPSS დისპერსიულ ანალიზსაც აკეთებს (ANOVA) (ჩანართი 24.32). SPSS იმაზე მეტ ინფორმაციას იძლევა, ვიდრე მკვლევარს სჭირდება. df-ის (თავისუფლების ხარისხის) განხილვა ზემოთ შეგიძლიათ ნახოთ. აქ მხოლოდ 24.32 ჩანართში მოცემული ცხრილის ბოლო სვეტს გავარჩევთ, რომელსაც სახელად „შიგ.“ ჰქვია. ეს მნიშვნელოვნობის დონეა და, ვინაიდან მნიშვნელოვნობა აქ 0.000-ია, დამოუკიდებელი (მეცადინეობისთვის დათმობილი დრო) და დამოკიდებული (მიღწევის დონე) ცვლადების სტატისტიკურად ძალიან მნიშვნელოვანი კავშირი გვაქვს (უფრო მჭიდრო, ვიდრე 0.001) (ჩანართი 24.32).

-------------------------
ჩანართი 24.32
მნიშვნელობის დონე რეგრესიულ ანალიზში


-------------------------

      ვინაიდან ეს მნიშვნელობა მნიშვნელოვან შედეგს შეიცავს, იგი მიგვითითებს, რომ აზრი აქვს ანალიზის გაგრძელებას. ამის შემდეგ SPSS სტანდარტიზებული და არასტანდარტიზებული კოეფიციენტების ცხრილს გვაძლევს. გირჩევთ, იხელმძღვანელოთ სტანდარტიზებული კოეფიციენტებით, სადაც ბეტა კოეფიციენტიც გათვალისწინებულია. ბეტა (β) კოეფიციენტი დამოკიდებული ცვლადის ცვლილების სტანდარტული გადახრის ერთეულის ზომაა, რომელიც შეესაბამება დამოუკიდებელი ცვლადის ერთი სტანდარტული გადახრის ერთეულით ცვლილებას. 24.33 ჩანართში მოცემულ მაგალითში ბეტა კოეფიციენტი 0.795-ის ტოლია, რაც გვეუბნება, რომ დამოუკიდებელი ცვლადის (მეცადინეობისთვის დათმობილი დროის) სტანდარტული გადახრის ერთეულით ყოველ ცვლილებას დამოკიდებული ცვლადის (მიღწევის დონე) 0.795-ით (ანუ 79.5 პროცენტით) შეცვლა ახლავს თან, ანუ, დამოუკიდებელი ცვლადის ერთი ერთეულით შეცვლას დამოკიდებული ცვლადის სამი-მეოთხედი ერთეულით შეცვლა შეესაბამება. ეს საუკეთესოდ მორგებული წრფის ციცაბო 226 განათლების სფეროში კვლევის კონტექსტი დახრილობასაც ხსნის, თუმცა ეს არ არის მთლად 45 გრადუსის ტოლი: ერთი ცვლადის ყოველი ერთეული მეორე ცვლადის მხოლოდ 79.5 პროცენტს შეესაბამება (ჩანართი 24.33).

      ჩანართი 24.33 იმაზეც მიგვითითებს, რომ მიღებული შედეგები სტატისტიკურად ძალზე მნიშვნელოვანია („შიგ.“ სვეტი (0.000) 0.001-ზე ძლიერ მნიშვნელოვნობის დონეს გვიჩვენებს). საყურადღებოა ისიც, რომ 24.33 ჩანართის ცხრილში არის სტრიქონი „ჩონსტანტ“ (კონსტანტა, მუდმივა). ის ვერტიკალური ღერძისა და რეგრესიის წრფის კვეთის წერტილს, ანუ, თანაკვეთას გვიჩვენებს. ზოგჯერ მუდმივა (კონსტანტა) გამოირიცხება ხოლმე შემდგომი ანალიზიდან.

-------------------------
ჩანართი 24.33
ბეტა კოეფიციენტი რეგრესიულ ანალიზში


-------------------------

      წერილობით ანგარიშში რეგრესია შემდეგნაირად შეგვიძლია წარმოვადგინოთ:

      მეცადინეობისთვის დათმობილი დროისა და მიღწევის დონის წერტილთა გაბნევის დიაგრამა ორ ცვლადს შორის წრფივ დადებით კავშირზე მიუთითებს, სადაც მორგებული R კვადრატი = 0.625. ცვლადისთვის „მეცადინეობისთვის დათმობილი დრო“ დადგენილ იქნა სტანდარტიზებული ბეტა კოეფიციენტი 0.795, რომელიც სტატისტიკურად მნიშვნელოვანი აღმოჩნდა (p < 0.001).

მრავალჯერადი რეგრესია

      წრფივ რეგრესიაში ერთ დამოკიდებულ ცვლადზე ერთი დამოუკიდებელი ცვლადის გავლენის გამოთვლა შეგვიძლია. თუმცა, უფრო სასარგებლო იქნებოდა, რომ ერთ დამოკიდებულ ცვლადზე ორი ან მეტი დამოუკიდებელი ცვლადის გავლენის გამოთვლა შეგვეძლოს. მრავალჯერადი რეგრესია ორ ან მეტ - ამხსნელ ანუ დამოუკიდებელ ცვლადებსა და ახსნილ, ანუ, დამოკიდებულ ცვლადს შორის კავშირის პროგნოზირებისა და ამ მიმართების წონის განსაზღვრის საშუალებას გვაძლევს. წინა მაგალითიდან ვიცით, რომ ბეტა კოეფიციენტი (β) გვიჩვენებს, თუ სტანდარტული გადახრის რამდენი ერთეულით შეიცვლება დამოკიდებული ცვლადი თითოეული დამოუკიდებელი ცვლადის ერთი სტანდარტული გადახრის ერთეულით ყოველი ცვლილებისას. გამოცდაზე მიღებული ნიშანი შეიძლება მეცადინეობისთვის დათმობილი დროისა და ინტელექტის შედეგი იყოს, ესე იგი, ასეთი ფორმულა გვექნება:

გამოცდაზე მიღებული ნიშანი = β მეცადინეობისთვის დათმობილი დრო + β ინტელექტი

      ვთქვათ, SPSS-ით გამოვთვალეთ მეცადინეობისთვის დათმობილი დროისა და ინტელექტის β კოეფიციენტები და, შესაბამისად, მივიღეთ 0.65 და 0.30. ეს ორი დამოუკიდებელი ცვლადის ფარდობითი წონებია. ვთქვათ, გვინდა გავარკვიოთ, თუ რა ნიშანი მიიღო გამოცდაზე იმ მოსწავლემ, რომელსაც ინტელექტის კოეფიციენტი 110 აქვს და კვირაში 30 საათს მეცადინეობდა. ჩვენი ფორმულა შემდეგნაირ სახეს მიიღებს:

გამოცდაზე მიღებული ნიშანი = (0.65 × 30) + (0.30 × 110) = 19.5 + 33 = 52.5

      თუ იგივე მოსწავლე კვირაში 40 საათს იმეცადინებს, მაშინ შეგვიძლია ვიწინასწარმეტყველოთ, რომ გამოცდაზე მისი ნიშანი იქნება: გამოცდაზე მიღებული ნიშანი = (0.65 × 40) + (0.30 × 110) = 26 + 33 = 59 ამით მკვლევარს დამოკიდებულ ცვლადზე, სხვა დამოუკიდებელი ცვლადების არსებობის პირობებში, კონკრეტული მოცემული დამოუკიდებელი ცვლადის ნაწინასწარმეტყველები ეფექტის ზუსტად ნახვის საშუალება ეძლევა. SPSS-ში ეფექტის ზომა მუდმივად გამოითვლება და ეს გამოთვლა ანალიზშიც შეგვიძლია ჩავრთოთ, მაგალითად, ასე:

გამოცდაზე მიღებული ნიშანი = მუდმივა + βმეცადინეობისთვის დათმობილი დრო + βინტელექტი

      განვიხილოთ SPSS-ში გამოთვლის მაგალითი ორზე მეტი დამოუკიდებელი ცვლადით. ვთქვათ, გვინდა ვნახოთ, თუ რამდენად გააუმჯობესებს გამოცდაზე მიღებულ ნიშანს მოცემული დროის (საათების) დათმობა მეცადინეობისთვის ინტელექტისა (მაგალითად, ინტელექტის კოეფიციენტის - IQ) და საგნით დაინტერესების დონის ცოდნის პირობებში. წინა მაგალითიდან ვიცით, რომ ბეტა კოეფიციენტი (β) გვიჩვენებს, თუ სტანდარტული გადახრის რამდენი ერთეულით შეიცვლება დამოკიდებული ცვლადი დამოუკიდებელი ცვლადის სტანდარტული გადახრის ერთეულით ყოველი ცვლილების შესაბამისად. გვექნება შემდეგი ტოლობა:

გამოცდაზე მიღწეული დონე = მუდმივა + βმეცადინეობისთვის დათმობილი საათების რაოდენობა + β IQ + βსაგნით დაინტერესების დონე.

      მუდმივას SPSS ავტომატურად თვლის. თითოეულ დამოუკიდებელ ცვლადს - მეცადინეობისთვის დათმობილ დროს (საათები), IQ-სა და საგნით დაინტერესების დონეს - დამოკიდებულ ცვლადთან, მიღწევის დონესთან, მიმართებაში თავისი ბეტა (β) კოეფიციენტი აქვს.

      თუ SPSS-ით ვთვლით მრავალჯერად რეგრესიას (50 მოსწავლის მოგონილი მონაცემებით), 24.34 ჩანართში მოცემულ შედეგებს მივიღებთ.

-------------------------
ჩანართი 24.34
მრავალჯერადი რეგრესიის გამოთვლის შემაჯამებელი ცხრილი


-------------------------

      მორგებული R კვადრატი ძალიან მაღალია (0.975) და მიუთითებს, რომ დამოკიდებული ცვლადის დისპერსიის 97.5 პროცენტი დამოუკიდებელი ცვლადებით აიხსნება (ჩანართი 24.34). ანალოგიურად, დისპერსიული ანალიზიც სტატისტიკურად უაღრესად მნიშვნლოვან შედეგს იძლევა (0.000) და გვიჩვენებს, რომ დამოუკიდებელი და დამოკიდებული ცვლადების ურთიერთკავშირი ძალიან ძლიერია (ჩანართი 24.35).

-------------------------
ჩანართი 24.35
მნიშვნელოვნობის დონე მრავალჯერად რეგრესიულ ანალიზში


-------------------------

      სამივე დამოუკიდებელი ცვლადის ბეტა (β) კოეფიციენტები მოცემულია 24.36 ჩანართში წარმოდგენილი ცხრილის სვეტში „სტანდარტიზებული კოეფიციენტები“. მუდივა 1.996-ის ტოლია.

-------------------------
ჩანართი 24.36
ბეტა კოეფიციენტები მრავალჯერად რეგრესიულ ანალიზში


-------------------------

      უნდა აღინიშნოს, რომ აქ სამი დამოუკიდებელი ცვლადისთვის ბეტა კოეფიციენტები ერთმანეთთან მიმართებაშია გამოთვლილი და არა - დამოუკიდებლად. ამგვარად, შეგვიძლია ვთქვათ, რომ ერთმანეთთან მიმართებით:

  • დამოუკიდებელი ცვლადი „მეცადინეობისთვის დათმობილი დრო (საათები) “ ყველაზე მეტად დადებითად უკავშირდება მიღწევის დონეს (β = 0.920) და ეს კავშირი სტატისტიკურად მნიშვნელოვანია (სვეტი „შიგ.“ გვიჩვენებს, რომ მნიშვნელოვნობის დონე 0.000-ია, რაც 0.001-ზე ძლიერი მაჩვენებელია).
  • დამოუკიდებელი ცვლადი „ინტელექტი“ უარყოფითად მოქმედებს მიღწევის დონეზე (β = -0.062), მაგრამ ეს სტატისტიკურად უმნიშვნელოა (0.644-ის პირობებში p > 0.05).
  • დამოუკიდებელი ცვლადი „საგნით დაინტერესებულობის დონე“ დადებითად მოქმედებს მიღწევის დონეზე (β = 0.131), მაგრამ ეს სტატისტიკურად უმნიშვნელოა (0.395-ის პირობებში p > 0.05).
  • ერთადერთი დამოუკიდებელი ცვლადი, რომელიც მოქმედებს მიღწევის დონეზე „მეცადინეობისთვის დათმობილი დრო (საათები)“.

      ამრიგად, თუ ვიცით, რამდენი საათი დაუთმო მოსწავლემ მეცადინეობას, მისი IQ და საგნით დაინტერესებულობის დონე, შეგვიძლია გამოცდაზე მისი მოსალოდნელი შედეგის წინასწარმეტყველება.

      მრავალჯერადი რეგრესია იმით არის სასარგებლო, რომ მისი საშუალებით რამდენიმე ცვლადის აღება და დამოკიდებულ ცვლადზე გავლენაში მათი ფარდობითი წონების გამოთვლაა შეიძლება. თუმცა, სიფრთხილეც გვმართებს: ცვლადები შეიძლება ურთიერთქმედებდნენ და ერთმანეთთან კორელირებდნენ (მრავალჯერადი წრფივი დამოკიდებულების საკითხი). მაგალითად, გორარდი (2001) წერს, რომ:

      სიღარიბე და ეთნიკური წარმომავლობა, როგორც, ჩანს, გარკვეულად კორელირებენ ერთმანეთთან, ასე რომ, მათი ერთად გამოყენება საერთო ცვალებადობის ორჯერ გამოყენებას ნიშნავს. თუ ცვლადების მრავალჯერადი წრფივი დამოკიდებულება დავადგინეთ (მაგალითად, თუ ცვლადებს შორის კორელაციის კოეფიციენტები 0.80-ზე მაღალია), მაშინ ან ერთ-ერთი ცვლადი უნდა ამოვიღოთ გამოთვლებიდან, ან ახალი ცვლადი უნდა შევქმნათ, რომელიც ამ მჭიდროდ ურთიერთდაკავშირებულ ორ ცვლადს გააერთიანებს.
(Gorard 2001: 172)

      SPSS, ფაქტობრივად, ავტომატურად ამოაკლებს ცვლადებს იმ გამოთვლებიდან, სადაც მათ შორის ძლიერი კოვარიაციაა (მრავალჯერადი წრფივი დამოკიდებულებაა).2

      მრავალჯერადი რეგრესიის წერილობით გაფორმებისას (ხშირად, SPSS-ში მიღებულ) ცხრილებთან ერთად, მაგალითის სახით, შემდეგი ფორმულირება შეგვიძლია გამოვიყენოთ:

      გამოყენებულ იქნა მრავალჯერადი რეგრესია. მიღებული შედეგები თითოეულ ცვლადისთვის მოიცავს მორგებულ R კვადრატს (0.975), დისპერსიულ ანალიზსა (p < 0.001) და სტანდარტიზებულ β კოეფიციენტს (β = 0.920, p < 0.001; β = -0.062, p = 0.644; β = 0.131, p = 0.395). შესამჩნევია, რომ, ერთმანეთთან მიმართებაში, მიღწევის დონეზე „მეცადინეობისთვის დათმობილი დრო“ ყველაზე მეტ გავლენას ახდენს, „საგნით დაინტერესებულობის დონე“ მცირედ და სტატისტიკურად უმნიშვნელოდ მოქმედებს, ხოლო „ინტელექტი“ - უარყოფითად, მაგრამ, ასევე, სტატისტიკურად უმნიშვნელოდ.

      რეგრესიული ტექნიკების გამოყენებისას მათ საფუძვლად მდებარე დაშვებები უნდა გავითვალიწინოთ. გორარდი (2001: 213) ამ დაშვებებს შემდეგნაირად აღწერს:

  • გაზომვა შემთხვევით შერჩევაზე (უკიდურეს შემთხვევაში, ალბათურ შერჩევაზე მაინც) წარმოებს;
  • ყველა გამოყენებული ცვლადის მნიშვნელობას ნამდვილი რიცხვი უნდა წარმოადგენდეს (ან, უკიდურეს შემთხვევაში, დამოკიდებულ ცვლადს მაინც);
  • აქ უკიდურესი ქულები არ არსებობს;
  • ყველა ცვლადი შეცდომის გარეშეა გაზომილი;
  • დამოკიდებულ და დამოუკიდებელ ცვლადებს (სათითაოდ და ერთად აღებულს) შორის დაახლოებით წრფივი კავშირია;
  • დამოკიდებული ცვლადი დაახლოებით ნორმალურადაა განაწილებული (ან, უკიდურეს შემთხვევაში, შემდეგი დაშვებაა მართალი);
  • დამოკიდებული ცვლადის ნაშთები (გამოთვლილ და რეალურად მიღებულ ქულებს შორის სხვაობა) დაახლოებით ნორმალურადაა განაწილებული;
  • თითოეული ცვლადის დისპერსია უცვლელია სხვა დანარჩენი ცვლადების მნიშვნელობათა დიაპაზონისთვის (ან, უკიდურეს შემთხვევაში, შემდეგი დაშვებაა მართალი);
  • დამოკიდებული ცვლადის ნაშთები თანაბარი და უცვლელი დისპერსიით ხარიათდება დამოუკიდებელი ცვლადების ყოველი მნიშვნელობისთვის;
  • ნაშთები არ კორელირებენ დამოუკიდებელ ცვლადებთან;
  • დამოკიდებული ცვლადის ნაშთების საშუალო ნულის ტოლია დამოუკიდებელი ცვლადების ყოველი მნიშვნელობისთვის (ან დაახლოებით წრფივად უკავშირდებიან დამოკიდებულ ცვლადს);
  • არცერთ დამოუკიდებელ ცვლადს არ აქვს სრული/იდეალური წრფივი კავშირი სხვა დამოუკიდებელ ცვლადთან (არ გვაქვს იდეალური „მულტიკოლინეარობა“. Aანუ, მრავალჯერადი წრფივი დამოკიდებულება);
  • ნებისმიერი ორი შემთხვევისთვის ნაშთებს შორის კორელაცია ნულის ტოლი უნდა იყოს (თითოეული შემთხვევა დამოუკიდებელია დანარჩენებისგან).

      მიუხედავად იმისა, რომ რეგრესია და მრავალჯერადი რეგრესია ყველაზე ხშირად ინტერვალებისა და შეფარდების სკალის მონაცემებთან გამოიყენება, ბოლო დროს შემუშავდა პროცედურები, რომლებიც რიგის სკალის მონაცემებზე რეგრესიული ანალიზის წარმოების შესაძლებლობას იძლევა (SPSS Inc 2002). ეს უაღრესად მნიშვნელოვანია რეიტინგის სკალებიდან რეგრესიის გამოთვლისთვის.

      პალანტის (Pallant 2001: 136) აზრით, მრავალჯერადი რეგრესიის გამოყენებისას ყურადღება უნდა მიექცეს შერჩევის მოცულობას. იგი ამბობს, რომ თითოეული დამოუკიდებელი ცვლადისთვის 15 შემთხვევა მაინცაა საჭირო და შერჩევის მინიმალური მოცულობის განსასაზღვრად შესაძლებელია შემდეგი ფორმულის გამოყენება: შერჩევის მოცულობა ≥ 50 + (8 × დამოუკიდებელი ცვლადების რაოდენობა), ესე იგი, ათი დამოუკიდებელი ცვლადისთვის მინიმუმ 130 (ანუ 50 + 80) ადამიანისგან შემდგარი შერჩევაა საჭირო.

     

ტეგები: Qwelly, კვლევის_მეთოდები, კორელაცია, სოციოლოგია, უკუკავშირი

ნახვა: 1056

გამოხმაურებები!

განტოლებები ოდითგან ))

RSS

ღონისძიებები

ბლოგ პოსტები

ფაუნა და კულინარია

გამოაქვეყნა Tamila Moshiashvili_მ.
თარიღი: ნოემბერი 16, 2019.
საათი: 11:08pm 1 კომენტარი

      ფოტომანიპულაციებმა შეიძლება ზებრაც კი შოკოლადივით გემრიელი გახადოს, მელიისგან ტოსტი მოგამზადებინოს და თაგვები ბაბუაწვერასავით გაგაფურცლინოს. ყოველშემთხვევაში, ყველა ეს იდეა რონალდ ონგს (Ronald…

გაგრძელება

უცხო ღიმილი

გამოაქვეყნა nunu qadagidze_მ.
თარიღი: ნოემბერი 16, 2019.
საათი: 2:00pm 0 კომენტარი

გაცოცხლებული ქარაგმა (გაგრძელება)

      ჩემს პაწია მზეს ძალიან სიამოვნებს, როდესაც ჰამაკში ვარწევ ხოლმე, მაშინვე თვალებს მილულავს და ტკბილად…

გაგრძელება

გერმანული მოდელით შეთავაზებული აქციები და ისევ გატაცებული ექიმი

გამოაქვეყნა Giorgi_მ.
თარიღი: ნოემბერი 15, 2019.
საათი: 11:03pm 1 კომენტარი

      ნოემბერი და რუსთაველზე აქციები მგონი ისეთ ტრადიციად დამკვიდრდება, მომავალ თაობებს რომ უნდა უთხრან - არ დავივიწყოთ ჩვენი ძირ-ძველი ტრადიციებიო და პერფორმანსებად შეიძლება შემოინახოს ისტორიამ. ფაქტია…

გაგრძელება

პროპორციული სისტემის კანონპროექტი ჩავარდა

გამოაქვეყნა Giorgi_მ.
თარიღი: ნოემბერი 14, 2019.
საათი: 11:00pm 0 კომენტარი

      ერთ მნიშვნელოვნად დღის ყველა თემა ჯერ კიდევ ნიუსების მეინსტრიმია და ჯერ კიდევ აქციების მთავარი მიზეზია - პროპორციული სისტემის კანონპროექტი ჩავარდა. ახლა პროტესტების დრო დადგა და ისევ კარვები, ისევ…

გაგრძელება

Qwelly World

free counters