ოპერაციების თვისებები შემთხვევითი ცვლადების რაოდენობრივი მახასიათებლების გამოსათვლელად. შემთხვევითი ცვლადების ძირითადი მახასიათებლები დისპერსია და სტანდარტული გადახრა

კორელაციის ანალიზის მიზანიარის შემთხვევით ცვლადებს (მახასიათებლებს) შორის კავშირის სიძლიერის განსაზღვრა, რომელიც ახასიათებს ზოგიერთ რეალურ პროცესს.
კორელაციური ანალიზის პრობლემები:
ა) ორი ან მეტი ფენომენის შეერთების ხარისხის (შებოჭილობა, სიძლიერე, სიმძიმე, ინტენსივობა) გაზომვა.
ბ) ფაქტორების შერჩევა, რომლებიც ყველაზე მნიშვნელოვან გავლენას ახდენენ მიღებულ ატრიბუტზე, ფენომენებს შორის კავშირის ხარისხის გაზომვის საფუძველზე. ამ ასპექტში მნიშვნელოვანი ფაქტორები შემდგომში გამოიყენება რეგრესიის ანალიზში.
გ) უცნობი მიზეზობრივი კავშირის გამოვლენა.

ურთიერთდამოკიდებულების გამოვლენის ფორმები ძალიან მრავალფეროვანია. როგორც მათი ყველაზე გავრცელებული ტიპები, ფუნქციური (სრული) და კორელაციური (არასრული) კავშირი.
კორელაციავლინდება საშუალოდ, მასობრივი დაკვირვებისთვის, როდესაც დამოკიდებული ცვლადის მოცემული მნიშვნელობები შეესაბამება დამოუკიდებელი ცვლადის სავარაუდო მნიშვნელობების გარკვეულ რაოდენობას. კავშირს კორელაცია ეწოდება, თუ ფაქტორის ატრიბუტის თითოეული მნიშვნელობა შეესაბამება შედეგიანი ატრიბუტის კარგად განსაზღვრულ არა შემთხვევით მნიშვნელობას.
კორელაციის ველი ემსახურება როგორც კორელაციის ცხრილის ვიზუალურ წარმოდგენას. ეს არის გრაფიკი, სადაც X მნიშვნელობები გამოსახულია აბსცისის ღერძზე, Y მნიშვნელობები გამოსახულია ორდინატთა ღერძის გასწვრივ და X და Y კომბინაციები ნაჩვენებია წერტილებით. კავშირის არსებობა შეიძლება შეფასდეს მდებარეობის მიხედვით. წერტილები.
შებოჭილობის მაჩვენებლებიშესაძლებელს ხდის დახასიათდეს მიღებული ნიშან-თვისების ცვალებადობის დამოკიდებულების თვისება-ფაქტორის ცვალებადობაზე.
შებოჭილობის ხარისხის უკეთესი მაჩვენებელი კორელაციაარის წრფივი კორელაციის კოეფიციენტი. ამ ინდიკატორის გაანგარიშებისას მხედველობაში მიიღება არა მხოლოდ ატრიბუტის ინდივიდუალური მნიშვნელობების გადახრები საშუალოდან, არამედ ამ გადახრების სიდიდე.

ამ თემის ძირითადი საკითხებია მიღებულ მახასიათებელსა და ახსნა-განმარტებით ცვლადს შორის რეგრესიული ურთიერთობის განტოლებები, რეგრესიის მოდელის პარამეტრების შეფასების უმცირესი კვადრატების მეთოდი, მიღებული რეგრესიის განტოლების ხარისხის ანალიზი, ნდობის ინტერვალების აშენება პროგნოზირებისთვის. მიღებული მახასიათებლის მნიშვნელობები რეგრესიის განტოლების გამოყენებით.

მაგალითი 2


ნორმალური განტოლებათა სისტემა.
a n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
ჩვენი მონაცემებისთვის განტოლებათა სისტემას აქვს ფორმა
30a + 5763 b = 21460
5763 a + 1200261 b = 3800360
პირველი განტოლებიდან გამოვხატავთ და ჩაანაცვლეთ მეორე განტოლებაში:
ვიღებთ b = -3.46, a = 1379.33
რეგრესიის განტოლება:
y = -3,46 x + 1379,33

2. რეგრესიის განტოლების პარამეტრების გამოთვლა.
ნიმუში ნიშნავს.



ნიმუშის განსხვავებები:


სტანდარტული გადახრა


1.1. Კორელაციის კოეფიციენტი
კოვარიანტობა.

ჩვენ ვიანგარიშებთ კომუნიკაციის სიახლოვის ინდიკატორს. ასეთი მაჩვენებელი არის შერჩევითი ხაზოვანი კორელაციის კოეფიციენტი, რომელიც გამოითვლება ფორმულით:

ხაზოვანი კორელაციის კოეფიციენტი იღებს მნიშვნელობებს -1-დან +1-მდე.
მახასიათებლებს შორის ურთიერთობა შეიძლება იყოს სუსტი ან ძლიერი (ახლო). მათი კრიტერიუმები ფასდება ჩადოკის მასშტაბით:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
ჩვენს მაგალითში, კავშირი თვისებასა და X ფაქტორს შორის არის მაღალი და ინვერსიული.
გარდა ამისა, ხაზოვანი წყვილის კორელაციის კოეფიციენტი შეიძლება განისაზღვროს რეგრესიის კოეფიციენტის b მიხედვით:

1.2. რეგრესიის განტოლება(რეგრესიის განტოლების შეფასება).

წრფივი რეგრესიის განტოლება არის y = -3.46 x + 1379.33

კოეფიციენტი b = -3,46 გვიჩვენებს ეფექტური ინდიკატორის საშუალო ცვლილებას (y-ის ერთეულებში) x ფაქტორის მნიშვნელობის მატებით ან შემცირებით მისი გაზომვის ერთეულზე. ამ მაგალითში 1 ერთეულით გაზრდით y მცირდება საშუალოდ -3,46-ით.
კოეფიციენტი a = 1379.33 ფორმალურად აჩვენებს y-ის პროგნოზირებულ დონეს, მაგრამ მხოლოდ იმ შემთხვევაში, თუ x=0 ახლოსაა ნიმუშის მნიშვნელობებთან.
მაგრამ თუ x=0 შორს არის ნიმუში x მნიშვნელობებისგან, მაშინ პირდაპირი ინტერპრეტაცია შეიძლება გამოიწვიოს არასწორ შედეგებამდე, და მაშინაც კი, თუ რეგრესიის ხაზი ზუსტად აღწერს დაკვირვებული ნიმუშის მნიშვნელობებს, არ არსებობს გარანტია, რომ ეს ასევე იქნება შემთხვევა, როდესაც ექსტრაპოლაცია ხდება მარცხნივ ან მარჯვნივ.
x-ის შესაბამისი მნიშვნელობების რეგრესიის განტოლებაში ჩანაცვლებით, შესაძლებელია თითოეული დაკვირვებისთვის ეფექტური ინდიკატორის y(x) გასწორებული (პროგნოზირებადი) მნიშვნელობების დადგენა.
y-სა და x-ს შორის კავშირი განსაზღვრავს რეგრესიის კოეფიციენტის b ნიშანს (თუ > 0 - პირდაპირი კავშირი, წინააღმდეგ შემთხვევაში - შებრუნებული). ჩვენს მაგალითში ურთიერთობა საპირისპიროა.
1.3. ელასტიურობის კოეფიციენტი.
არასასურველია რეგრესიის კოეფიციენტების გამოყენება (მაგალითად ბ) ეფექტურ ატრიბუტზე ფაქტორების გავლენის პირდაპირი შეფასებისთვის იმ შემთხვევაში, თუ არსებობს განსხვავება ეფექტური ინდიკატორის y და ფაქტორული ატრიბუტის საზომ ერთეულებში.
ამ მიზნებისათვის გამოითვლება ელასტიურობის კოეფიციენტები და ბეტა კოეფიციენტები.
ელასტიურობის E საშუალო კოეფიციენტი გვიჩვენებს, რამდენი პროცენტით შეიცვლება შედეგი საშუალოდ აგრეგატში ზემისი საშუალო მნიშვნელობიდან ფაქტორის შეცვლისას xმისი საშუალო ღირებულების 1%.
ელასტიურობის კოეფიციენტი გამოითვლება ფორმულით:


ელასტიურობის კოეფიციენტი 1-ზე ნაკლებია. ამიტომ, თუ X იცვლება 1%-ით, Y შეიცვლება 1%-ზე ნაკლებით. სხვა სიტყვებით რომ ვთქვათ, X-ის გავლენა Y-ზე არ არის მნიშვნელოვანი.
ბეტა კოეფიციენტიგვიჩვენებს მისი სტანდარტული გადახრის მნიშვნელობის რა ნაწილით შეიცვლება ეფექტური ატრიბუტის მნიშვნელობა საშუალოდ, როდესაც ფაქტორის ატრიბუტი იცვლება მისი სტანდარტული გადახრის მნიშვნელობით დარჩენილი დამოუკიდებელი ცვლადების მნიშვნელობით დაფიქსირებული მუდმივ დონეზე:

იმათ. x-ის ზრდა S x სტანდარტული გადახრის მნიშვნელობით გამოიწვევს Y-ის საშუალო მნიშვნელობის შემცირებას 0,74 სტანდარტული გადახრის S y-ით.
1.4. მიახლოების შეცდომა.
მოდით შევაფასოთ რეგრესიის განტოლების ხარისხი აბსოლუტური მიახლოების შეცდომის გამოყენებით. საშუალო მიახლოების შეცდომა არის გამოთვლილი მნიშვნელობების საშუალო გადახრა რეალურიდან:


ვინაიდან შეცდომა 15%-ზე ნაკლებია, ეს განტოლება შეიძლება გამოყენებულ იქნას როგორც რეგრესია.
დისპერსიული ანალიზი.
დისპერსიის ანალიზის ამოცანაა დამოკიდებული ცვლადის დისპერსიის ანალიზი:
∑(y i - y cp) 2 = ∑(y(x) - y cp) 2 + ∑(y - y(x)) 2
სად
∑(y i - y cp) 2 - გადახრების კვადრატული ჯამი;
∑(y(x) - y cp) 2 - რეგრესიის გამო კვადრატული გადახრების ჯამი („ახსნილი“ ან „ფაქტორული“);
∑(y - y(x)) 2 - კვადრატული გადახრების ნარჩენი ჯამი.
თეორიული კორელაციის თანაფარდობარადგან წრფივი ურთიერთობა უდრის კორელაციის კოეფიციენტს r xy.
დამოკიდებულების ნებისმიერი ფორმისთვის, კავშირის სიმჭიდროვე განისაზღვრება გამოყენებით მრავალჯერადი კორელაციის კოეფიციენტი:

ეს კოეფიციენტი უნივერსალურია, რადგან ის ასახავს კავშირის სიმკაცრეს და მოდელის სიზუსტეს და ასევე შეიძლება გამოყენებულ იქნას ცვლადებს შორის კავშირის ნებისმიერი ფორმისთვის. ერთფაქტორიანი კორელაციის მოდელის აგებისას, მრავალჯერადი კორელაციის კოეფიციენტი უდრის წყვილის კორელაციის კოეფიციენტს r xy.
1.6. განსაზღვრის კოეფიციენტი.
(მრავალჯერადი) კორელაციის კოეფიციენტის კვადრატს ეწოდება დეტერმინაციის კოეფიციენტი, რომელიც აჩვენებს შედეგიანი ატრიბუტის ვარიაციის პროპორციას, რომელიც აიხსნება ფაქტორის ატრიბუტის ვარიაციით.
ყველაზე ხშირად, განსაზღვრის კოეფიციენტის ინტერპრეტაციით, იგი გამოხატულია პროცენტულად.
R 2 \u003d -0.74 2 \u003d 0.5413
იმათ. შემთხვევების 54,13%-ში x-ის ცვლილება იწვევს y-ის ცვლილებას. სხვა სიტყვებით რომ ვთქვათ, რეგრესიის განტოლების შერჩევის სიზუსტე საშუალოა. Y-ის ცვლილების დარჩენილი 45.87% განპირობებულია მოდელში გაუთვალისწინებელი ფაქტორებით.

ბიბლიოგრაფია

  1. ეკონომიკა: სახელმძღვანელო / რედ. ი.ი. ელისეევა. - მ.: ფინანსები და სტატისტიკა, 2001, გვ. 34..89.
  2. მაგნუს ია.რ., კატიშევი პ.კ., პერესეცკი ა.ა. ეკონომიკა. საწყისი კურსი. სახელმძღვანელო. - მე-2 გამოცემა, რევ. – მ.: დელო, 1998, გვ. 17..42.
  3. სემინარი ეკონომიკაზე: პროკ. შემწეობა / I.I. ელისეევა, ს.ვ. კურიშევა, ნ.მ. გორდეენკო და სხვები; რედ. ი.ი. ელისეევა. - მ.: ფინანსები და სტატისტიკა, 2001, გვ. 5..48.

კომპანიაში 10 ადამიანია დასაქმებული. მე-2 ცხრილში მოცემულია მონაცემები მათი სამუშაო გამოცდილების შესახებ და

თვიური ხელფასი.

გამოთვალეთ ამ მონაცემებიდან

  • - ნიმუშის კოვარიანტული შეფასების მნიშვნელობა;
  • - პირსონის კორელაციის კოეფიციენტის ნიმუშის მნიშვნელობა;
  • - მიღებული მნიშვნელობების მიხედვით შეაფასეთ კავშირის მიმართულება და სიმტკიცე;
  • - დაადგინეთ რამდენად ლეგიტიმურია განცხადება იმის შესახებ, რომ ეს კომპანია იყენებს იაპონური მართვის მოდელს, რომელიც მდგომარეობს იმაში, რომ რაც უფრო მეტ დროს ატარებს თანამშრომელი ამ კომპანიაში, მით უფრო მაღალი უნდა იყოს მისი ხელფასი.

კორელაციის ველზე დაყრდნობით, შეიძლება ვივარაუდოთ (ზოგადი პოპულაციისთვის), რომ კავშირი X და Y ყველა შესაძლო მნიშვნელობას შორის არის წრფივი.

რეგრესიის პარამეტრების გამოსათვლელად, ჩვენ ავაშენებთ გაანგარიშების ცხრილს.

ნიმუში ნიშნავს.

ნიმუშის განსხვავებები:

რეგრესიის სავარაუდო განტოლება ასე გამოიყურება

y = bx + a + e,

სადაც ei არის ei, a და b შეცდომების დაკვირვებული მნიშვნელობები (შეფასებები), შესაბამისად, b პარამეტრების შეფასებები და რეგრესიულ მოდელში, რომელიც უნდა მოიძებნოს.

b და c პარამეტრების შესაფასებლად გამოიყენეთ LSM (უმცირესი კვადრატები).

ნორმალური განტოლებათა სისტემა.

a?x + b?x2 = ?y*x

ჩვენი მონაცემებისთვის განტოლებათა სისტემას აქვს ფორმა

  • 10a + 307b = 33300
  • 307 a + 10857 b = 1127700

სისტემის (1) განტოლებას ვამრავლებთ (-30.7-ზე), ვიღებთ სისტემას, რომელსაც ვხსნით ალგებრული შეკრების მეთოდით.

  • -307a -9424.9 b = -1022310
  • 307 a + 10857 b = 1127700

ჩვენ ვიღებთ:

1432.1b = 105390

სადაც b = 73.5912

ახლა ჩვენ ვპოულობთ კოეფიციენტს "a" განტოლებიდან (1):

  • 10a + 307b = 33300
  • 10a + 307 * 73.5912 = 33300
  • 10a = 10707.49

ვიღებთ ემპირიულ რეგრესიის კოეფიციენტებს: b = 73.5912, a = 1070.7492

რეგრესიის განტოლება (ემპირიული რეგრესიის განტოლება):

y = 73,5912 x + 1070,7492

კოვარიანტობა.

ჩვენს მაგალითში ურთიერთობა Y მახასიათებელსა და X ფაქტორს შორის არის მაღალი და პირდაპირი.

აქედან გამომდინარე, თამამად შეგვიძლია ვთქვათ, რომ რაც უფრო მეტ დროს მუშაობს თანამშრომელი მოცემულ კომპანიაში, მით უფრო მაღალია მისი ხელფასი.

4. სტატისტიკური ჰიპოთეზების ტესტირება. ამ პრობლემის გადაჭრისას პირველი ნაბიჯი არის ტესტირებადი ჰიპოთეზის და ალტერნატიული ჰიპოთეზის ჩამოყალიბება.

საერთო წილების თანასწორობის შემოწმება.

ორ ფაკულტეტზე ჩატარდა კვლევა სტუდენტთა მოსწრებაზე. ვარიანტების შედეგები ნაჩვენებია ცხრილში 3. შეიძლება თუ არა იმის მტკიცება, რომ ორივე ფაკულტეტს წარჩინებული სტუდენტების ერთნაირი პროცენტი ჰყავს?

მარტივი არითმეტიკული საშუალო

ჩვენ ვამოწმებთ ჰიპოთეზას ზოგადი წილების თანასწორობის შესახებ:

ვიპოვოთ Student-ის კრიტერიუმის ექსპერიმენტული მნიშვნელობა:

თავისუფლების ხარისხების რაოდენობა

f \u003d nx + ny - 2 \u003d 2 + 2 - 2 \u003d 2

განსაზღვრეთ tkp-ის მნიშვნელობა Student-ის განაწილების ცხრილის მიხედვით

სტუდენტის ცხრილის მიხედვით ვხვდებით:

Ttabl(f;b/2) = Ttabl(2;0.025) = 4.303

სტუდენტის განაწილების კრიტიკული წერტილების ცხრილის მიხედვით b = 0.05 მნიშვნელოვნების დონეზე და თავისუფლების ხარისხების მოცემულ რაოდენობაზე ვპოულობთ tcr = 4.303.

იმიტომ რომ tobs > tcr, მაშინ ნულოვანი ჰიპოთეზა უარყოფილია, ორი ნიმუშის საერთო წილი არ არის თანაბარი.

ზოგადი განაწილების ერთგვაროვნების შემოწმება.

უნივერსიტეტის ხელმძღვანელობას სურს გაარკვიოს, როგორ შეიცვალა ჰუმანიტარულ მეცნიერებათა ფაკულტეტის პოპულარობა დროთა განმავლობაში. ამ ფაკულტეტზე მსურველთა რაოდენობა გაანალიზდა შესაბამის წელს მსურველთა საერთო რაოდენობასთან მიმართებაში. (მონაცემები მოცემულია ცხრილში 4). თუ აბიტურიენტთა რაოდენობას განვიხილავთ, როგორც წლის კურსდამთავრებულთა საერთო რაოდენობის წარმომადგენლობით ნიმუშს, შეიძლება თუ არა იმის მტკიცება, რომ სკოლის მოსწავლეების ინტერესი ამ ფაკულტეტის სპეციალობებით დროთა განმავლობაში არ იცვლება?

ვარიანტი 4

გამოსავალი: ცხრილი ინდიკატორების გამოსათვლელად.

ინტერვალის შუა წერტილი, xi

კუმულაციური სიხშირე, ს

სიხშირე, fi/n

განაწილების სერიის შესაფასებლად, ჩვენ ვპოულობთ შემდეგ ინდიკატორებს:

საშუალო შეწონილი

ვარიაციის დიაპაზონი არის განსხვავება პირველადი სერიის ატრიბუტის მაქსიმალურ და მინიმალურ მნიშვნელობებს შორის.

R = 2008 - 1988 = 20 დისპერსია - ახასიათებს გავრცელების ზომას მისი საშუალო მნიშვნელობის ირგვლივ (დისპერსიის საზომი, ე.ი. გადახრა საშუალოდან).

სტანდარტული გადახრა (საშუალო შერჩევის შეცდომა).

სერიის თითოეული მნიშვნელობა განსხვავდება 2002.66 წლის საშუალო მნიშვნელობიდან საშუალოდ 6.32-ით.

ზოგადი პოპულაციის ერთიანი განაწილების შესახებ ჰიპოთეზის ტესტირება.

X-ის ერთგვაროვანი განაწილების შესახებ ჰიპოთეზის შესამოწმებლად, ე.ი. კანონის მიხედვით: f(x) = 1/(b-a) ინტერვალში (a,b) აუცილებელია:

შეაფასეთ პარამეტრები a და b - ინტერვალის ბოლოები, რომელშიც დაფიქსირდა X-ის შესაძლო მნიშვნელობები, ფორმულების მიხედვით (* აღნიშნავს პარამეტრების შეფასებას):

იპოვეთ სავარაუდო განაწილების ალბათობის სიმკვრივე f(x) = 1/(b* - a*)

იპოვნეთ თეორიული სიხშირეები:

n1 = nP1 = n = n*1/(b* - a*)*(x1 - a*)

n2 = n3 = ... = ns-1 = n*1/(b* - a*)*(xi - xi-1)

ns = n*1/(b* - a*)*(b* - xs-1)

შეადარეთ ემპირიული და თეორიული სიხშირეები პირსონის ტესტის გამოყენებით, თავისუფლების ხარისხების რაოდენობის გათვალისწინებით k = s-3, სადაც s არის საწყისი შერჩევის ინტერვალების რაოდენობა; თუმცა, თუ გაკეთდა მცირე სიხშირეების და, შესაბამისად, თავად ინტერვალების კომბინაცია, მაშინ s არის კომბინაციის შემდეგ დარჩენილი ინტერვალების რაოდენობა. ვიპოვოთ ერთიანი განაწილების a* და b* პარამეტრების შეფასება ფორმულებით:

ვიპოვოთ სავარაუდო ერთგვაროვანი განაწილების სიმკვრივე:

f(x) = 1/(b* - a*) = 1/(2013.62 - 1991.71) = 0.0456

მოდი ვიპოვოთ თეორიული სიხშირეები:

n1 = n*f(x)(x1 - a*) = 0.77 * 0.0456(1992-1991.71) = 0.0102

n5 = n*f(x)(b* - x4) = 0.77 * 0.0456(2013.62-2008) = 0.2

ns = n*f(x)(xi - xi-1)

ვინაიდან პირსონის სტატისტიკა ზომავს განსხვავებას ემპირიულ და თეორიულ განაწილებებს შორის, რაც უფრო დიდია მისი დაკვირვების მნიშვნელობა კობსი, მით უფრო ძლიერია არგუმენტი მთავარი ჰიპოთეზის წინააღმდეგ.

ამიტომ, ამ სტატისტიკისთვის კრიტიკული რეგიონი ყოველთვის მარჯვნივ არის: ) შეიძლება მნიშვნელოვნად განსხვავდებოდეს ორიგინალური (დაუმახინჯებელი) სქემის შესაბამისი მახასიათებლებისგან (, n). ნორმალური სქემა (, m) ყოველთვის ამცირებს რეგრესიის კოეფიციენტის Ql აბსოლუტურ მნიშვნელობას. მიმართებაში (B. 15) და ასევე ასუსტებს um-ს შორის ურთიერთობის სიახლოვის ხარისხს (ანუ ამცირებს კორელაციის კოეფიციენტის აბსოლუტურ მნიშვნელობას r).

გაზომვის შეცდომების გავლენა კორელაციის კოეფიციენტის მნიშვნელობაზე. მოდით შევაფასოთ ორგანზომილებიანი ნორმალური შემთხვევითი ცვლადის (, TJ) კომპონენტებს შორის კორელაციის სიახლოვის ხარისხი, მაგრამ ჩვენ შეგვიძლია დავაკვირდეთ მათ მხოლოდ გაზომვის შემთხვევითი შეცდომით, შესაბამისად, es და e (იხ. D2 დამოკიდებულება დიაგრამა შესავალში). აქედან გამომდინარე, ექსპერიმენტული მონაცემები არის (xit i/i), i = 1, 2,. .., n, არის დამახინჯებული ორგანზომილებიანი შემთხვევითი ცვლადის (, r)) პრაქტიკულად ნიმუშის მნიშვნელობები, სადაც =

მეთოდი R.a. შედგება რეგრესიის განტოლების (მათ შორის, მისი პარამეტრების შეფასების) გამოყვანაში, რომლის დახმარებით იპოვება შემთხვევითი ცვლადის საშუალო მნიშვნელობა, თუ ცნობილია სხვა (ან სხვათა მნიშვნელობა მრავალჯერადი ან მრავალვარიანტული რეგრესიის შემთხვევაში). (საპირისპიროდ, კორელაციური ანალიზი გამოიყენება შემთხვევით ცვლადებს შორის კავშირის სიმტკიცის საპოვნელად და გამოსახატავად71.)

ნიშნების კორელაციის შესწავლისას, რომლებიც არ არის დაკავშირებული დროის თანმიმდევრული ცვლილებით, თითოეული ნიშანი იცვლება მრავალი მიზეზის გავლენის ქვეშ, შემთხვევით აღებული. დინამიკის სერიაში მათ ემატება ცვლილება ყოველი სერიის დროს. ეს ცვლილება იწვევს ეგრეთ წოდებულ ავტოკორელაციას - წინა სერიების დონეების ცვლილებების გავლენას მომდევნო სერიებზე. მაშასადამე, დროის სერიების დონეებს შორის კორელაცია სწორად აჩვენებს დროის სერიაში ასახულ ფენომენებს შორის ურთიერთობის სიმკაცრეს, მხოლოდ იმ შემთხვევაში, თუ თითოეულ მათგანში არ არის ავტოკორელაცია. გარდა ამისა, ავტოკორელაცია იწვევს რეგრესიის კოეფიციენტების საშუალო კვადრატული ცდომილების დამახინჯებას, რაც ართულებს რეგრესიის კოეფიციენტებისთვის ნდობის ინტერვალების შექმნას, ასევე მათი მნიშვნელობის შემოწმებას.

(1.8) და (1.8) მიმართებით განსაზღვრული თეორიული და ნიმუშის კორელაციის კოეფიციენტები შეიძლება ოფიციალურად გამოითვალოს ნებისმიერი ორგანზომილებიანი დაკვირვების სისტემისთვის, ისინი გაანალიზებულ მახასიათებლებს შორის წრფივი სტატისტიკური კავშირის სიმჭიდროვის ხარისხის საზომებია. თუმცა, მხოლოდ შესასწავლი შემთხვევითი ცვლადების და u-ის ერთობლივი ნორმალური განაწილების შემთხვევაში, კორელაციის კოეფიციენტს r აქვს მკაფიო მნიშვნელობა, როგორც მათ შორის კავშირის სიახლოვის ხარისხის მახასიათებელი. კერძოდ, ამ შემთხვევაში, თანაფარდობა r - 1 ადასტურებს წმინდა ფუნქციონალურ წრფივ დამოკიდებულებას შესასწავლ სიდიდეებს შორის და განტოლება r = 0 მიუთითებს მათ სრულ ურთიერთდამოუკიდებლობაზე. გარდა ამისა, კორელაციის კოეფიციენტი, შემთხვევითი ცვლადების საშუალებებთან და დისპერსიებთან ერთად, წარმოადგენს იმ ხუთ პარამეტრს, რომელიც უზრუნველყოფს ამომწურავ ინფორმაციას.

თეორიული რეგრესიის ხაზის განტოლების დადგენის შემდეგ აუცილებელია დაკვირვების ორ სერიას შორის ურთიერთობის სიახლოვის რაოდენობრივი განსაზღვრა. ნახ. 4.1, b, c, იგივეა, მაგრამ ნახ. 4.1, b, წერტილები ბევრად უფრო ახლოსაა (უფრო ახლოს) რეგრესიის ხაზთან, ვიდრე ნახ. 4.1, გ.

კორელაციური ანალიზი ვარაუდობს, რომ ფაქტორები და პასუხები შემთხვევითია და ემორჩილება ნორმალურ განაწილების კანონს.

შემთხვევით ცვლადებს შორის ურთიერთობის სიახლოვე ხასიათდება კორელაციის კოეფიციენტით pxy. მოდით უფრო დეტალურად ვისაუბროთ ამ ინდიკატორის ფიზიკურ მნიშვნელობაზე. ამისათვის ჩვენ შემოგთავაზებთ ახალ კონცეფციებს.

ნარჩენი დისპერსია

დაკვირვებული წერტილები რეგრესიის ხაზთან მიმართებაში და წარმოადგენს შეცდომის ინდიკატორს y პარამეტრის პროგნოზირებისას რეგრესიის განტოლების მიხედვით (ნახ. 4.6):



s2=f)