უმცირესი კვადრატების მეთოდის არსი არის. სად გამოიყენება უმცირესი კვადრატების მეთოდი? უმცირესი კვადრატების მეთოდით ამოცანების ამოხსნის მაგალითები

მას აქვს მრავალი პროგრამა, რადგან ის იძლევა მოცემული ფუნქციის მიახლოებით წარმოდგენას სხვა უფრო მარტივი ფუნქციებით. LSM შეიძლება იყოს ძალიან სასარგებლო დაკვირვებების დამუშავებისას და ის აქტიურად გამოიყენება ზოგიერთი სიდიდის შესაფასებლად სხვათა გაზომვის შედეგებიდან, რომლებიც შეიცავს შემთხვევით შეცდომებს. ამ სტატიაში თქვენ შეისწავლით თუ როგორ უნდა განახორციელოთ მინიმალური კვადრატების გამოთვლები Excel-ში.

პრობლემის განცხადება კონკრეტულ მაგალითზე

დავუშვათ, რომ არსებობს ორი ინდიკატორი X და Y. უფრო მეტიც, Y დამოკიდებულია X-ზე. ვინაიდან OLS ჩვენთვის საინტერესოა რეგრესიული ანალიზის თვალსაზრისით (ექსელში მისი მეთოდები დანერგილია ჩაშენებული ფუნქციების გამოყენებით), დაუყოვნებლივ უნდა გავაგრძელოთ განიხილოს კონკრეტული პრობლემა.

ასე რომ, მოდით X იყოს სასურსათო მაღაზიის გასაყიდი ფართობი, რომელიც იზომება კვადრატულ მეტრებში, ხოლო Y იყოს წლიური ბრუნვა, რომელიც განისაზღვრება მილიონ რუბლში.

საჭიროა პროგნოზის გაკეთება, თუ რა ბრუნვა (Y) ექნება მაღაზიას, თუ მას აქვს ამა თუ იმ საცალო ფართი. ცხადია, ფუნქცია Y = f (X) იზრდება, ვინაიდან ჰიპერმარკეტი უფრო მეტ საქონელს ყიდის, ვიდრე სადგომი.

რამდენიმე სიტყვა წინასწარმეტყველებისთვის გამოყენებული საწყისი მონაცემების სისწორის შესახებ

ვთქვათ, გვაქვს n მაღაზიის მონაცემებით აგებული ცხრილი.

მათემატიკური სტატისტიკის მიხედვით, შედეგები მეტ-ნაკლებად სწორი იქნება, თუკი მინიმუმ 5-6 ობიექტის მონაცემები შეისწავლება. ასევე, „ანომალიური“ შედეგების გამოყენება შეუძლებელია. კერძოდ, ელიტარულ პატარა ბუტიკს შეიძლება ჰქონდეს მრავალჯერ მეტი ბრუნვა, ვიდრე "მასმარკეტის" კლასის მსხვილი მაღაზიების ბრუნვა.

მეთოდის არსი

ცხრილის მონაცემები შეიძლება გამოისახოს დეკარტის სიბრტყეზე, როგორც წერტილები M 1 (x 1, y 1), ... M n (x n, y n). ახლა ამოცანის ამოხსნა დაიყვანება y = f (x) მიახლოებითი ფუნქციის არჩევით, რომელსაც აქვს გრაფიკი რაც შეიძლება ახლოს გადის M 1, M 2, .. M n წერტილებთან.

რა თქმა უნდა, შეგიძლიათ გამოიყენოთ მაღალი ხარისხის პოლინომი, მაგრამ ეს ვარიანტი არა მხოლოდ რთული განსახორციელებელია, არამედ უბრალოდ არასწორია, რადგან ის არ ასახავს მთავარ ტენდენციას, რომელიც უნდა გამოვლინდეს. ყველაზე გონივრული გამოსავალი არის სწორი ხაზის ძიება y = ax + b, რომელიც საუკეთესოდ აახლოებს ექსპერიმენტულ მონაცემებს და უფრო ზუსტად, კოეფიციენტებს - a და b.

სიზუსტის ქულა

ნებისმიერი მიახლოებისთვის განსაკუთრებული მნიშვნელობა აქვს მისი სიზუსტის შეფასებას. e i-ით აღნიშნეთ განსხვავება (გადახრა) x i წერტილის ფუნქციურ და ექსპერიმენტულ მნიშვნელობებს შორის, ანუ e i = y i - f (x i).

ცხადია, მიახლოების სიზუსტის შესაფასებლად შეგიძლიათ გამოიყენოთ გადახრების ჯამი, ანუ სწორი ხაზის არჩევისას X-ის დამოკიდებულების მიახლოებითი წარმოდგენისთვის Y-ზე უპირატესობა უნდა მიენიჭოს მას, რომელსაც აქვს ყველაზე მცირე მნიშვნელობა. ჯამი e i ყველა განხილულ პუნქტში. თუმცა, ყველაფერი ასე მარტივი არ არის, რადგან დადებით გადახრებთან ერთად, პრაქტიკულად იქნება უარყოფითიც.

პრობლემის გადაჭრა შეგიძლიათ გადახრის მოდულების ან მათი კვადრატების გამოყენებით. ეს უკანასკნელი მეთოდი ყველაზე ფართოდ გამოიყენება. იგი გამოიყენება ბევრ სფეროში, მათ შორის რეგრესიული ანალიზის ჩათვლით (Excel-ში მისი განხორციელება ხორციელდება ორი ჩაშენებული ფუნქციის გამოყენებით) და დიდი ხანია დადასტურებულია, რომ ეფექტურია.

მინიმალური კვადრატის მეთოდი

Excel-ში, როგორც მოგეხსენებათ, არის ჩაშენებული autosum ფუნქცია, რომელიც საშუალებას გაძლევთ გამოთვალოთ არჩეულ დიაპაზონში მდებარე ყველა მნიშვნელობის მნიშვნელობები. ამგვარად, არაფერი შეგვიშლის ხელს გამოთვალოს გამოხატვის მნიშვნელობა (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

მათემატიკური აღნიშვნით, ეს ასე გამოიყურება:

მას შემდეგ, რაც თავდაპირველად გადაწყვეტილება მიიღეს მიახლოებით სწორი ხაზის გამოყენებით, ჩვენ გვაქვს:

ამრიგად, სწორი ხაზის პოვნის ამოცანა, რომელიც საუკეთესოდ აღწერს კონკრეტულ ურთიერთობას X-სა და Y-ს შორის, შეადგენს ორი ცვლადის ფუნქციის მინიმუმის გამოთვლას:

ეს მოითხოვს ნულოვანი ნაწილობრივი წარმოებულების გათანაბრებას ახალ a და b ცვლადებთან მიმართებაში და პრიმიტიული სისტემის ამოხსნას, რომელიც შედგება ორი განტოლებისგან, ფორმის 2 უცნობით:

მარტივი გარდაქმნების შემდეგ, მათ შორის 2-ზე გაყოფა და ჯამებით მანიპულირება, მივიღებთ:

მისი ამოხსნით, მაგალითად, კრამერის მეთოდით, ვიღებთ სტაციონარულ წერტილს გარკვეული კოეფიციენტებით a * და b * . ეს არის მინიმალური, ანუ იმის პროგნოზირებისთვის, თუ რა ბრუნვა ექნება მაღაზიას გარკვეულ ფართობზე, შესაფერისია სწორი ხაზი y = a * x + b *, რომელიც არის რეგრესიის მოდელი მოცემული მაგალითისთვის. რა თქმა უნდა, ეს არ მოგცემთ საშუალებას იპოვოთ ზუსტი შედეგი, მაგრამ ეს დაგეხმარებათ გაიგოთ, ანაზღაურდება თუ არა მაღაზიის კრედიტით ყიდვა კონკრეტული ზონისთვის.

როგორ განვახორციელოთ ყველაზე მცირე კვადრატების მეთოდი Excel-ში

Excel-ს აქვს ფუნქცია უმცირესი კვადრატების მნიშვნელობის გამოსათვლელად. მას აქვს შემდეგი ფორმა: TREND (ცნობილი Y მნიშვნელობები; ცნობილი X მნიშვნელობები; ახალი X მნიშვნელობები; მუდმივი). მოდით გამოვიყენოთ Excel-ში OLS-ის გამოთვლის ფორმულა ჩვენს ცხრილში.

ამისათვის, იმ უჯრედში, რომელშიც უნდა იყოს ნაჩვენები Excel-ში უმცირესი კვადრატების მეთოდის გამოყენებით გაანგარიშების შედეგი, შეიყვანეთ ნიშანი "=" და აირჩიეთ "TREND" ფუნქცია. ფანჯარაში, რომელიც იხსნება, შეავსეთ შესაბამისი ველები, მონიშნეთ:

  • ცნობილი მნიშვნელობების დიაპაზონი Y-სთვის (ამ შემთხვევაში მონაცემები ბრუნვისთვის);
  • დიაპაზონი x 1, …x n, ანუ საცალო ფართის ზომა;
  • და x-ის ცნობილი და უცნობი მნიშვნელობები, რისთვისაც თქვენ უნდა გაარკვიოთ ბრუნვის ზომა (სამუშაო ფურცელზე მათი მდებარეობის შესახებ ინფორმაციისთვის იხილეთ ქვემოთ).

გარდა ამისა, ფორმულაში არის ლოგიკური ცვლადი "Const". თუ მის შესაბამის ველში შეიყვანთ 1, მაშინ ეს ნიშნავს, რომ გამოთვლები უნდა განხორციელდეს, თუ ვივარაუდებთ, რომ b \u003d 0.

თუ საჭიროა იცოდეთ პროგნოზი ერთზე მეტი x მნიშვნელობისთვის, მაშინ ფორმულის შეყვანის შემდეგ არ უნდა დააჭიროთ "Enter", არამედ უნდა აკრიფოთ კომბინაცია "Shift" + "Control" + "Enter" ("Enter" ) კლავიატურაზე.

ზოგიერთი მახასიათებელი

რეგრესიის ანალიზი შეიძლება ხელმისაწვდომი იყოს დუმებისთვისაც კი. Excel-ის ფორმულა უცნობი ცვლადების მასივის მნიშვნელობის პროგნოზირებისთვის - "TREND" - შეიძლება გამოიყენონ მათაც, ვისაც არასოდეს სმენია უმცირესი კვადრატების მეთოდის შესახებ. საკმარისია მხოლოდ მისი მუშაობის ზოგიერთი მახასიათებლის ცოდნა. Კერძოდ:

  • თუ თქვენ განათავსებთ y ცვლადის ცნობილი მნიშვნელობების დიაპაზონს ერთ მწკრივში ან სვეტში, მაშინ თითოეული მწკრივი (სვეტი) x-ის ცნობილი მნიშვნელობებით აღიქმება პროგრამის მიერ, როგორც ცალკე ცვლადი.
  • თუ დიაპაზონი ცნობილი x-ით არ არის მითითებული TREND ფანჯარაში, მაშინ Excel-ში ფუნქციის გამოყენების შემთხვევაში, პროგრამა განიხილავს მას, როგორც მთელი რიცხვებისგან შემდგარ მასივს, რომელთა რაოდენობა შეესაბამება დიაპაზონს მოცემული მნიშვნელობებით. ცვლადის y.
  • "პროგნოზირებადი" მნიშვნელობების მასივის გამოსატანად, ტენდენციის გამოხატულება უნდა იყოს შეყვანილი მასივის ფორმულის სახით.
  • თუ არ არის მითითებული ახალი x მნიშვნელობები, მაშინ TREND ფუნქცია მათ ცნობილთა ტოლად მიიჩნევს. თუ ისინი არ არის მითითებული, მაშინ მასივი 1 მიიღება არგუმენტად; 2; 3; 4;…, რომელიც შეესაბამება დიაპაზონს უკვე მოცემული პარამეტრებით y.
  • დიაპაზონი, რომელიც შეიცავს ახალ x მნიშვნელობებს, უნდა ჰქონდეს იგივე ან მეტი მწკრივი ან სვეტი, როგორც დიაპაზონი მოცემული y მნიშვნელობებით. სხვა სიტყვებით რომ ვთქვათ, ის უნდა იყოს პროპორციული დამოუკიდებელი ცვლადების მიმართ.
  • მასივი ცნობილი x მნიშვნელობებით შეიძლება შეიცავდეს მრავალ ცვლადს. თუმცა, თუ ჩვენ ვსაუბრობთ მხოლოდ ერთზე, მაშინ საჭიროა, რომ დიაპაზონი x და y მოცემული მნიშვნელობებით იყოს თანაზომიერი. რამდენიმე ცვლადის შემთხვევაში, აუცილებელია, რომ დიაპაზონი მოცემული y მნიშვნელობებით მოთავსდეს ერთ სვეტში ან ერთ რიგში.

FORECAST ფუნქცია

იგი ხორციელდება რამდენიმე ფუნქციის გამოყენებით. ერთ-ერთ მათგანს "პროგნოზირება" ჰქვია. ის TREND-ის მსგავსია, ანუ იძლევა გამოთვლების შედეგს უმცირესი კვადრატების მეთოდით. თუმცა, მხოლოდ ერთი X-ისთვის, რომლისთვისაც Y-ის მნიშვნელობა უცნობია.

ახლა თქვენ იცით ექსელის ფორმულები დუმებისთვის, რომლებიც საშუალებას გაძლევთ იწინასწარმეტყველოთ ინდიკატორის მომავალი მნიშვნელობის მნიშვნელობა ხაზოვანი ტენდენციის მიხედვით.

პრობლემა არის წრფივი დამოკიდებულების კოეფიციენტების პოვნა, რომლებისთვისაც ორი ცვლადის ფუნქციაა და იღებს უმცირეს მნიშვნელობას. ანუ მონაცემების გათვალისწინებით და ნაპოვნი სწორი ხაზიდან ექსპერიმენტული მონაცემების კვადრატული გადახრების ჯამი ყველაზე მცირე იქნება. ეს არის უმცირესი კვადრატების მეთოდის მთელი აზრი.

ამრიგად, მაგალითის ამოხსნა მცირდება ორი ცვლადის ფუნქციის უკიდურესობის პოვნამდე.

კოეფიციენტების მოძიების ფორმულების გამოყვანა.შედგენილია და ამოხსნილია ორი განტოლების სისტემა ორი უცნობით. ფუნქციების ნაწილობრივი წარმოებულების მოძიება ცვლადების მიხედვით და , ამ წარმოებულებს ვატოლებთ ნულს.

ჩვენ ვხსნით განტოლებათა სისტემას ნებისმიერი მეთოდით (მაგალითად, ჩანაცვლების მეთოდით ან კრამერის მეთოდით) და ვიღებთ ფორმულებს კოეფიციენტების საპოვნელად უმცირესი კვადრატების მეთოდით (LSM).

მონაცემებით და ფუნქცია იღებს უმცირეს მნიშვნელობას.

ეს არის უმცირესი კვადრატების მთელი მეთოდი. პარამეტრის პოვნის ფორმულა შეიცავს ჯამებს , , და პარამეტრს - ექსპერიმენტული მონაცემების რაოდენობა. ამ თანხების მნიშვნელობები რეკომენდებულია ცალკე გამოითვალოს. კოეფიციენტი ნაპოვნია გაანგარიშების შემდეგ .

ასეთი მრავალწევრების გამოყენების ძირითადი სფეროა ექსპერიმენტული მონაცემების დამუშავება (ემპირიული ფორმულების აგება). ფაქტია, რომ ექსპერიმენტის დახმარებით მიღებული ფუნქციის მნიშვნელობებიდან აგებულ ინტერპოლაციის პოლინომზე ძლიერ გავლენას მოახდენს „ექსპერიმენტული ხმაური“, უფრო მეტიც, ინტერპოლაციის დროს, ინტერპოლაციის კვანძები ვერ განმეორდება, ე.ი. თქვენ არ შეგიძლიათ გამოიყენოთ განმეორებითი ექსპერიმენტების შედეგები იმავე პირობებში. ფესვი-საშუალო კვადრატული პოლინომი არბილებს ხმაურს და შესაძლებელს ხდის მრავალჯერადი ექსპერიმენტის შედეგების გამოყენებას.

რიცხვითი ინტეგრაცია და დიფერენციაცია. მაგალითი.

რიცხვითი ინტეგრაცია- განსაზღვრული ინტეგრალის მნიშვნელობის გაანგარიშება (როგორც წესი, მიახლოებითი). რიცხვითი ინტეგრაცია გაგებულია, როგორც რიცხვითი მეთოდების ერთობლიობა გარკვეული ინტეგრალის მნიშვნელობის საპოვნელად.

რიცხვითი დიფერენციაცია– დისკრეტულად მოცემული ფუნქციის წარმოებულის მნიშვნელობის გამოსათვლელი მეთოდების ნაკრები.

ინტეგრაცია

პრობლემის ფორმულირება.პრობლემის მათემატიკური განცხადება: აუცილებელია გარკვეული ინტეგრალის მნიშვნელობის პოვნა

სადაც a, b სასრულია, f(x) უწყვეტია [а, b]-ზე.

პრაქტიკული ამოცანების გადაჭრისას ხშირად ხდება, რომ ინტეგრალი მოუხერხებელია ან შეუძლებელია ანალიზურად აღება: ის შეიძლება არ იყოს გამოხატული ელემენტარულ ფუნქციებში, ინტეგრანტი შეიძლება იყოს ცხრილის სახით და ა.შ. ასეთ შემთხვევებში, რიცხვითი ინტეგრაციის მეთოდებია. გამოყენებული. რიცხვითი ინტეგრაციის მეთოდები იყენებს მრუდი ტრაპეციის ფართობის ჩანაცვლებას უფრო მარტივი გეომეტრიული ფორმების არეების სასრული ჯამით, რომელიც შეიძლება ზუსტად გამოითვალოს. ამ თვალსაზრისით, საუბარია კვადრატული ფორმულების გამოყენებაზე.

მეთოდების უმეტესობა იყენებს ინტეგრალის წარმოდგენას სასრული ჯამის სახით (კვადრატული ფორმულა):

კვადრატული ფორმულები ემყარება ინტეგრაციის ინტერვალზე ინტეგრაციის გრაფიკის ჩანაცვლების იდეას უფრო მარტივი ფორმის ფუნქციებით, რომლებიც ადვილად შეიძლება ინტეგრირებული იყოს ანალიტიკურად და, ამრიგად, ადვილად გამოითვალოს. კვადრატული ფორმულების აგების უმარტივესი ამოცანა რეალიზებულია პოლინომიური მათემატიკური მოდელებისთვის.

მეთოდების სამი ჯგუფი შეიძლება გამოიყოს:

1. ინტეგრაციის სეგმენტის თანაბარ ინტერვალებად დაყოფის მეთოდი. ინტერვალებად დაყოფა ხდება წინასწარ, როგორც წესი, ინტერვალებს ირჩევენ თანაბარი (რათა გაადვილდეს ფუნქციის გამოთვლა ინტერვალების ბოლოებში). გამოთვალეთ ფართობები და შეაჯამეთ ისინი (მართკუთხედების მეთოდები, ტრაპეცია, სიმფსონი).

2. ინტეგრაციის სეგმენტის დაყოფის მეთოდები სპეციალური წერტილების გამოყენებით (გაუსის მეთოდი).

3. ინტეგრალების გამოთვლა შემთხვევითი რიცხვების გამოყენებით (მონტე კარლოს მეთოდი).

მართკუთხედის მეთოდი.დაე, ფუნქცია (ნახაზი) ​​იყოს რიცხობრივად ინტეგრირებული სეგმენტზე. სეგმენტს ვყოფთ N თანაბარ ინტერვალებად. თითოეული N მრუდი ტრაპეციის ფართობი შეიძლება შეიცვალოს მართკუთხედის ფართობით.

ყველა მართკუთხედის სიგანე იგივეა და ტოლია:

მართკუთხედების სიმაღლის არჩევისას შეგიძლიათ აირჩიოთ ფუნქციის მნიშვნელობა მარცხენა საზღვარზე. ამ შემთხვევაში, პირველი მართკუთხედის სიმაღლე იქნება f(a), მეორე იქნება f(x 1),…, N-f(N-1).

თუ ავიღებთ ფუნქციის მნიშვნელობას მარჯვენა საზღვარზე, როგორც მართკუთხედის სიმაღლის არჩევანს, მაშინ ამ შემთხვევაში პირველი მართკუთხედის სიმაღლე იქნება f (x 1), მეორე - f (x 2), . .., N - f (x N).

როგორც ხედავთ, ამ შემთხვევაში ერთ-ერთი ფორმულა ინტეგრალს მიახლოებას აძლევს ჭარბით, მეორე კი დეფიციტით. არსებობს კიდევ ერთი გზა - ფუნქციის მნიშვნელობის გამოყენება ინტეგრაციის სეგმენტის შუაში მიახლოებისთვის:

მართკუთხედების მეთოდის აბსოლუტური ცდომილების შეფასება (შუა)

მარცხენა და მარჯვენა მართკუთხედების მეთოდების აბსოლუტური ცდომილების შეფასება.

მაგალითი.გამოთვალეთ მთელი ინტერვალი და დაყავით ინტერვალი ოთხ ნაწილად

გამოსავალი.ამ ინტეგრალის ანალიტიკური გამოთვლა იძლევა I=arctg(1)–arctg(0)=0,7853981634. ჩვენს შემთხვევაში:

1) სთ = 1; xo = 0; x1 = 1;

2) სთ = 0,25 (1/4); x0 = 0; x1 = 0,25; x2 = 0,5; x3 = 0,75; x4 = 1;

ჩვენ ვიანგარიშებთ მარცხენა მართკუთხედების მეთოდით:

ჩვენ ვიანგარიშებთ მართკუთხა მართკუთხედების მეთოდით:

გამოთვალეთ საშუალო მართკუთხედების მეთოდით:

ტრაპეციული მეთოდი.ინტერპოლაციისთვის პირველი ხარისხის პოლინომის გამოყენება (სწორი ხაზი, რომელიც გავლებულია ორ წერტილზე) მივყავართ ტრაპეციის ფორმულამდე. ინტეგრაციის სეგმენტის ბოლოები აღებულია როგორც ინტერპოლაციის კვანძები. ამრიგად, მრუდი ტრაპეცია ჩანაცვლებულია ჩვეულებრივი ტრაპეციით, რომლის ფართობი შეიძლება მოიძებნოს ფუძეების ჯამის ნახევარისა და სიმაღლის ნამრავლად.

ყველა კვანძისთვის ინტეგრაციის N სეგმენტების შემთხვევაში, გარდა სეგმენტის უკიდურესი წერტილებისა, ფუნქციის მნიშვნელობა ორჯერ ჩაირთვება ჯამურ ჯამში (რადგან მეზობელ ტრაპეციას ერთი საერთო მხარე აქვს)

ტრაპეციის ფორმულა შეიძლება მივიღოთ სეგმენტის მარჯვენა და მარცხენა კიდეების გასწვრივ ოთხკუთხედის ფორმულების ჯამის ნახევარის აღებით:

ხსნარის სტაბილურობის შემოწმება.როგორც წესი, რაც უფრო მოკლეა თითოეული ინტერვალის სიგრძე, ე.ი. რაც უფრო მეტია ამ ინტერვალების რაოდენობა, მით ნაკლებია განსხვავება ინტეგრალის სავარაუდო და ზუსტ მნიშვნელობებს შორის. ეს ასეა ფუნქციების უმეტესობისთვის. ტრაპეციის მეთოდში ϭ ინტეგრალის გამოთვლაში შეცდომა დაახლოებით პროპორციულია ინტეგრაციის საფეხურის კვადრატის (ϭ ~ h 2) ამდენად, a, b საზღვრებში გარკვეული ფუნქციის ინტეგრალის გამოსათვლელად საჭიროა. დაყავით სეგმენტი N 0 ინტერვალებად და იპოვეთ ტრაპეციის ფართობების ჯამი. შემდეგ თქვენ უნდა გაზარდოთ N 1 ინტერვალების რაოდენობა, კვლავ გამოთვალოთ ტრაპეციის ჯამი და შეადაროთ მიღებული მნიშვნელობა წინა შედეგთან. ეს უნდა განმეორდეს (N i) მანამ, სანამ არ მიიღწევა შედეგის მითითებული სიზუსტე (კონვერგენციის კრიტერიუმი).

მართკუთხედისა და ტრაპეციის მეთოდებისთვის, როგორც წესი, ყოველი გამეორების საფეხურზე, ინტერვალების რაოდენობა იზრდება 2-ჯერ (N i +1 =2N i).

კონვერგენციის კრიტერიუმი:

ტრაპეციის წესის მთავარი უპირატესობა მისი სიმარტივეა. თუმცა, თუ ინტეგრაცია მოითხოვს მაღალ სიზუსტეს, ამ მეთოდს შეიძლება დასჭირდეს ძალიან ბევრი გამეორება.

ტრაპეციული მეთოდის აბსოლუტური შეცდომაშეფასებულია როგორც
.

მაგალითი.გამოთვალეთ დაახლოებით გარკვეული ინტეგრალი ტრაპეციის ფორმულის გამოყენებით.

ა) ინტეგრაციის სეგმენტის 3 ნაწილად დაყოფა.
ბ) ინტეგრაციის სეგმენტის 5 ნაწილად დაყოფა.

გამოსავალი:
ა) პირობით, ინტეგრაციის სეგმენტი უნდა დაიყოს 3 ნაწილად, ანუ.
გამოთვალეთ დანაყოფის თითოეული სეგმენტის სიგრძე: .

ამრიგად, ტრაპეციის ზოგადი ფორმულა მცირდება სასიამოვნო ზომამდე:

საბოლოოდ:

შეგახსენებთ, რომ მიღებული მნიშვნელობა არის ფართობის სავარაუდო მნიშვნელობა.

ბ) ინტეგრაციის სეგმენტს ვყოფთ 5 ტოლ ნაწილად, ანუ . სეგმენტების რაოდენობის გაზრდით ჩვენ ვზრდით გამოთვლების სიზუსტეს.

თუ , მაშინ ტრაპეციის ფორმულა იღებს შემდეგ ფორმას:

მოდი ვიპოვოთ დანაყოფის ნაბიჯი:
, ანუ თითოეული შუალედური სეგმენტის სიგრძეა 0,6.

დავალების დასრულებისას მოსახერხებელია ყველა გაანგარიშების შედგენა საანგარიშო ცხრილით:

პირველ სტრიქონში ვწერთ "მრიცხველს"

Როგორც შედეგი:

კარგი, ნამდვილად არის განმარტება, თანაც სერიოზული!
თუ დანაყოფის 3 სეგმენტისთვის, მაშინ 5 სეგმენტისთვის. თუ კიდევ უფრო მეტ სეგმენტს აიღებ => კიდევ უფრო ზუსტი იქნება.

სიმფსონის ფორმულა.ტრაპეციის ფორმულა იძლევა შედეგს, რომელიც ძლიერ არის დამოკიდებული ნაბიჯის ზომაზე h, რაც გავლენას ახდენს განსაზღვრული ინტეგრალის გამოთვლის სიზუსტეზე, განსაკუთრებით იმ შემთხვევებში, როდესაც ფუნქცია არამონოტონურია. შეიძლება ვივარაუდოთ გამოთვლების სიზუსტის ზრდა, თუ სწორი ხაზების სეგმენტების ნაცვლად, რომლებიც ჩაანაცვლებენ f(x) ფუნქციის გრაფიკის მრუდი ფრაგმენტებს, ვიყენებთ, მაგალითად, პარაბოლების ფრაგმენტებს, რომლებიც მოცემულია გრაფიკის სამი მეზობელი წერტილით. . მსგავსი გეომეტრიული ინტერპრეტაცია საფუძვლად უდევს სიმპსონის მეთოდს განსაზღვრული ინტეგრალის გამოსათვლელად. მთელი ინტეგრაციის ინტერვალი a,b იყოფა N სეგმენტებად, სეგმენტის სიგრძეც h=(b-a)/N იქნება ტოლი.

სიმფსონის ფორმულა არის:

დარჩენილი ვადა

სეგმენტების სიგრძის მატებასთან ერთად, ფორმულის სიზუსტე მცირდება, შესაბამისად, სიზუსტის გასაზრდელად გამოიყენება სიმპსონის კომპოზიციური ფორმულა. მთლიანი ინტეგრაციის ინტერვალი დაყოფილია ლუწი რაოდენობის იდენტური სეგმენტების N, სეგმენტის სიგრძეც h=(b-a)/N-ის ტოლი იქნება. სიმპსონის კომპოზიტური ფორმულა არის:

ფორმულაში, ფრჩხილებში გამოსახულებები არის ინტეგრანის მნიშვნელობების ჯამები, შესაბამისად, უცნაური და ლუწი შიდა სეგმენტების ბოლოებში.

სიმპსონის ფორმულის დარჩენილი წევრი უკვე პროპორციულია ნაბიჯის მეოთხე ხარისხთან:

მაგალითი:გამოთვალეთ ინტეგრალი სიმპსონის წესით. (ზუსტი გამოსავალი - 0.2)

გაუსის მეთოდი

გაუსის კვადრატული ფორმულა. მეორე ჯიშის კვადრატული ფორმულების ძირითადი პრინციპი ჩანს ნახაზი 1.12-დან: აუცილებელია წერტილების განთავსება ისე. X 0 და X 1 სეგმენტის შიგნით [ ;] ისე, რომ "სამკუთხედების" ფართობები ჯამურად უტოლდება "სეგმენტის" ფართობებს. გაუსის ფორმულის გამოყენებისას საწყისი სეგმენტი [ ;] მცირდება [-1;1] ინტერვალამდე ცვლადის შეცვლით X on

0.5∙()∙+ 0.5∙( + ).

მერე , სად .

ეს ჩანაცვლება შესაძლებელია თუ და არის სასრული და ფუნქცია (x) უწყვეტია [ ;]. გაუსის ფორმულა ქულები x i, მე=0,1,..,-1 სეგმენტის შიგნით [ ;]:

, (1.27)

სად ტ იდა აისხვადასხვასთვის მოცემულია საცნობარო წიგნებში. მაგალითად, როდის =2 0 = 1=1; ზე =3: 0 =ტ 2" 0.775, 1 =0, 0 = ა 2" 0.555, 1" 0.889.

გაუსის კვადრატული ფორმულა

მიღებული წონის ფუნქციით ერთის ტოლი p(x)= 1 და კვანძები x i, რომლებიც ლეჟანდრის მრავალწევრების ფესვებია

შანსები აიადვილად გამოითვლება ფორმულებით

მე=0,1,2,....

კვანძების და კოეფიციენტების მნიშვნელობები n=2,3,4,5 მოცემულია ცხრილში.

შეკვეთა კვანძები შანსები
=2 x 1=0 x 0 =-x2=0.7745966692 A 1=8/9 A 0 = A 2=5/9
=3 x 2 =-x 1=0.3399810436 x 3 =-x0=0.8611363116 A 1 = A 2=0.6521451549 A 0 = A 3=0.6521451549
n=4 x 2 = 0 x 3 = -x 1 = 0.5384693101 x 4 =-x 0 =0.9061798459 0 =0.568888899 3 = 1 =0.4786286705 0 = 4 =0.2869268851
=5 x 5 = -x 0 =0.9324695142 x 4 = -x 1 =0.6612093865 x 3 = -x 2 =0.2386191861 5 = ა 0 =0.1713244924 4 = ა 1 =0.3607615730 3 = ა 2 =0.4679139346

მაგალითი.გამოთვალეთ მნიშვნელობა გაუსის ფორმულის გამოყენებით =2:

Ზუსტი ღირებულება: .

გაუსის ფორმულის მიხედვით ინტეგრალის გამოთვლის ალგორითმი ითვალისწინებს არა მიკროსეგმენტების რაოდენობის გაორმაგებას, არამედ ორდინატების რაოდენობის 1-ით გაზრდას და ინტეგრალის მიღებული მნიშვნელობების შედარებას. გაუსის ფორმულის უპირატესობა არის მაღალი სიზუსტე ორდინატთა შედარებით მცირე რაოდენობით. ნაკლოვანებები: მოუხერხებელია ხელით გამოთვლებისთვის; უნდა იყოს შენახული კომპიუტერის მეხსიერებაში ტ ი, აისხვადასხვასთვის .

გაუსის კვადრატული ფორმულის შეცდომა სეგმენტზე იქნება ერთსა და იმავე დროს. დარჩენილი წევრის ფორმულა იქნება სადაც α კოეფიციენტი ზრდასთან ერთად სწრაფად მცირდება . Აქ

გაუსის ფორმულები იძლევა მაღალ სიზუსტეს უკვე მცირე რაოდენობის კვანძების შემთხვევაში (4-დან 10-მდე) ამ შემთხვევაში პრაქტიკულ გამოთვლებში კვანძების რაოდენობა რამდენიმე ასეულიდან რამდენიმე ათასამდე მერყეობს. ასევე აღვნიშნავთ, რომ გაუსის კვადრატების წონები ყოველთვის დადებითია, რაც უზრუნველყოფს ჯამების გამოთვლის ალგორითმის სტაბილურობას.

უმცირესი კვადრატების მეთოდი (LSM) საშუალებას გაძლევთ შეაფასოთ სხვადასხვა რაოდენობა შემთხვევითი შეცდომების შემცველი მრავალი გაზომვის შედეგების გამოყენებით.

დამახასიათებელი MNC

ამ მეთოდის მთავარი იდეა ის არის, რომ კვადრატული შეცდომების ჯამი განიხილება, როგორც პრობლემის გადაჭრის სიზუსტის კრიტერიუმი, რომლის მინიმიზაციასაც ცდილობს. ამ მეთოდის გამოყენებისას შეიძლება გამოყენებულ იქნას როგორც რიცხვითი, ასევე ანალიტიკური მიდგომები.

კერძოდ, როგორც რიცხვითი განხორციელება, უმცირესი კვადრატების მეთოდი გულისხმობს უცნობი შემთხვევითი ცვლადის რაც შეიძლება მეტი გაზომვის გაკეთებას. უფრო მეტიც, რაც მეტი გათვლები იქნება, მით უფრო ზუსტი იქნება გამოსავალი. გამოთვლების ამ ნაკრებიდან (საწყისი მონაცემები) მიიღება შემოთავაზებული გადაწყვეტილებების კიდევ ერთი ნაკრები, საიდანაც შემდეგ შეირჩევა საუკეთესო. თუ ამონახსნების სიმრავლე პარამეტრიზებულია, მაშინ უმცირესი კვადრატების მეთოდი შემცირდება პარამეტრების ოპტიმალური მნიშვნელობის პოვნამდე.

როგორც ანალიტიკური მიდგომა LSM-ის განხორციელების საწყის მონაცემებზე (გაზომვები) და შემოთავაზებული გადაწყვეტილებების სიმრავლეზე, განსაზღვრულია ზოგიერთი (ფუნქციური), რომელიც შეიძლება გამოიხატოს მიღებული ფორმულით, როგორც გარკვეული ჰიპოთეზა, რომელიც საჭიროებს დადასტურებას. ამ შემთხვევაში, უმცირესი კვადრატების მეთოდი მცირდება ამ ფუნქციის მინიმუმის პოვნამდე საწყისი მონაცემების კვადრატული შეცდომების სიმრავლეზე.

გაითვალისწინეთ, რომ არა თავად შეცდომები, არამედ შეცდომების კვადრატები. რატომ? ფაქტია, რომ ხშირად გაზომვების გადახრები ზუსტი მნიშვნელობიდან არის როგორც დადებითი, ასევე უარყოფითი. საშუალოს განსაზღვრისას, მარტივმა შეჯამებამ შეიძლება გამოიწვიოს არასწორი დასკვნა შეფასების ხარისხის შესახებ, რადგან დადებითი და უარყოფითი მნიშვნელობების ურთიერთ გაუქმება შეამცირებს გაზომვების ნაკრების შერჩევის ძალას. და, შესაბამისად, შეფასების სიზუსტე.

ამის თავიდან ასაცილებლად, კვადრატული გადახრები ჯამდება. უფრო მეტიც, გაზომილი მნიშვნელობის განზომილების და საბოლოო შეფასების გასათანაბრებლად, გამოიყენება კვადრატული შეცდომების ჯამი ამოსაღებად.

MNC-ების ზოგიერთი აპლიკაცია

MNC ფართოდ გამოიყენება სხვადასხვა სფეროში. მაგალითად, ალბათობის თეორიაში და მათემატიკურ სტატისტიკაში, მეთოდი გამოიყენება შემთხვევითი ცვლადის ისეთი მახასიათებლის დასადგენად, როგორიცაა სტანდარტული გადახრა, რომელიც განსაზღვრავს შემთხვევითი ცვლადის მნიშვნელობების დიაპაზონის სიგანეს.

ექსპერიმენტული მონაცემების დაახლოება არის მეთოდი, რომელიც დაფუძნებულია ექსპერიმენტულად მიღებული მონაცემების ჩანაცვლებაზე ანალიტიკური ფუნქციით, რომელიც ყველაზე ახლოს გადის ან ემთხვევა კვანძების წერტილებში საწყის მნიშვნელობებს (ცდის ან ექსპერიმენტის დროს მიღებული მონაცემები). ამჟამად ანალიტიკური ფუნქციის განსაზღვრის ორი გზა არსებობს:

n-ხარისხის ინტერპოლაციის მრავალწევრის აგებით, რომელიც გადის პირდაპირ ყველა პუნქტითმოცემული მონაცემთა მასივი. ამ შემთხვევაში, მიახლოებითი ფუნქცია წარმოდგენილია როგორც: ინტერპოლაციის პოლინომი ლაგრანგის ფორმით ან ინტერპოლაციის პოლინომი ნიუტონის ფორმით.

n-ხარისხის მიახლოებითი მრავალწევრის აგებით, რომელიც გადის წერტილებთან ახლოსმოცემული მონაცემთა მასივიდან. ამრიგად, მიახლოებითი ფუნქცია არბილებს ყველა შემთხვევით ხმაურს (ან შეცდომებს), რომლებიც შეიძლება წარმოიშვას ექსპერიმენტის დროს: ექსპერიმენტის დროს გაზომილი მნიშვნელობები დამოკიდებულია შემთხვევით ფაქტორებზე, რომლებიც მერყეობენ საკუთარი შემთხვევითი კანონების მიხედვით (გაზომვის ან ინსტრუმენტის შეცდომები, უზუსტობა ან ექსპერიმენტული შეცდომები). ამ შემთხვევაში მიახლოების ფუნქცია განისაზღვრება უმცირესი კვადრატების მეთოდით.

მინიმალური კვადრატის მეთოდი(ინგლისურ ლიტერატურაში Ordinary Least Squares, OLS) არის მათემატიკური მეთოდი, რომელიც დაფუძნებულია მიახლოებითი ფუნქციის განსაზღვრაზე, რომელიც აგებულია ექსპერიმენტული მონაცემების მოცემული მასივის წერტილებთან ყველაზე ახლოს. საწყისი და მიახლოებითი ფუნქციების F(x) სიახლოვე განისაზღვრება რიცხვითი საზომით, კერძოდ: ექსპერიმენტული მონაცემების კვადრატული გადახრების ჯამი მიახლოებითი მრუდიდან F(x) უნდა იყოს ყველაზე მცირე.

დამაგრების მრუდი აგებულია უმცირესი კვადრატების მეთოდით

ყველაზე მცირე კვადრატების მეთოდი გამოიყენება:

ზედმეტად განსაზღვრული განტოლებათა სისტემების ამოხსნა, როცა განტოლებათა რაოდენობა აჭარბებს უცნობის რაოდენობას;

ამოხსნის ძიება განტოლებათა ჩვეულებრივი (არა ზედმეტად განსაზღვრული) არაწრფივი სისტემების შემთხვევაში;

პუნქტების მნიშვნელობების მიახლოებისთვის რაიმე მიახლოებითი ფუნქციით.

უმცირესი კვადრატების მეთოდით მიახლოების ფუნქცია განისაზღვრება ექსპერიმენტული მონაცემების მოცემული მასივიდან გამოთვლილი მიახლოებითი ფუნქციის კვადრატული გადახრების მინიმალური ჯამის პირობიდან. უმცირესი კვადრატების მეთოდის ეს კრიტერიუმი იწერება შემდეგი გამოთქმის სახით:

გამოთვლილი მიახლოებითი ფუნქციის მნიშვნელობები კვანძოვან წერტილებში,

ექსპერიმენტული მონაცემების განსაზღვრული მასივი კვანძოვან წერტილებზე.

კვადრატულ კრიტერიუმს აქვს მთელი რიგი „კარგი“ თვისებები, როგორიცაა დიფერენციალურობა, რომელიც უზრუნველყოფს მიახლოების პრობლემის უნიკალურ გადაწყვეტას პოლინომიური მიახლოებითი ფუნქციებით.

ამოცანის პირობებიდან გამომდინარე, მიახლოებითი ფუნქციაა m ხარისხის მრავალწევრი

მიახლოებითი ფუნქციის ხარისხი არ არის დამოკიდებული კვანძოვანი წერტილების რაოდენობაზე, მაგრამ მისი განზომილება ყოველთვის უნდა იყოს ნაკლები ექსპერიმენტული მონაცემების მოცემული მასივის განზომილებაზე (პუნქტების რაოდენობაზე).

∙ თუ მიახლოებითი ფუნქციის ხარისხი არის m=1, მაშინ ცხრილის ფუნქციას მივაახლოებთ სწორი ხაზით (წრფივი რეგრესია).

∙ თუ მიახლოებითი ფუნქციის ხარისხი არის m=2, მაშინ ცხრილის ფუნქციას ვაახლოებთ კვადრატული პარაბოლით (კვადრატული დაახლოება).

∙ თუ მიახლოებითი ფუნქციის ხარისხი არის m=3, მაშინ ცხრილის ფუნქციას ვაახლოებთ კუბურ პარაბოლას (კუბური მიახლოება).

ზოგად შემთხვევაში, როდესაც საჭიროა m გრადუსის მიახლოებითი მრავალწევრის აგება მოცემული ცხრილის მნიშვნელობებისთვის, ყველა კვანძის წერტილზე კვადრატული გადახრების მინიმალური ჯამის პირობა ხელახლა იწერება შემდეგი სახით:

- m ხარისხის მიახლოებითი მრავალწევრის უცნობი კოეფიციენტები;

ცხრილის მითითებული მნიშვნელობების რაოდენობა.

ფუნქციის მინიმუმის არსებობის აუცილებელი პირობაა მისი ნაწილობრივი წარმოებულების ნულის ტოლობა უცნობი ცვლადების მიმართ. . შედეგად, ჩვენ ვიღებთ განტოლებების შემდეგ სისტემას:

გადავცვალოთ მიღებული განტოლებათა წრფივი სისტემა: გავხსნათ ფრჩხილები და გადავიტანოთ თავისუფალი ტერმინები გამოხატვის მარჯვენა მხარეს. შედეგად, ხაზოვანი ალგებრული გამონათქვამების შედეგად მიღებული სისტემა დაიწერება შემდეგი ფორმით:

ხაზოვანი ალგებრული გამონათქვამების ეს სისტემა შეიძლება გადაიწეროს მატრიცის სახით:

შედეგად მიღებული იქნა m + 1 განზომილების წრფივი განტოლებათა სისტემა, რომელიც შედგება m + 1 უცნობისაგან. ამ სისტემის ამოხსნა შესაძლებელია წრფივი ალგებრული განტოლებების ამოხსნის ნებისმიერი მეთოდის გამოყენებით (მაგალითად, გაუსის მეთოდი). ამოხსნის შედეგად მოიძებნება მიახლოებითი ფუნქციის უცნობი პარამეტრები, რომლებიც უზრუნველყოფენ მიახლოებითი ფუნქციის კვადრატული გადახრების მინიმალურ ჯამს საწყისი მონაცემებისგან, ე.ი. საუკეთესო შესაძლო კვადრატული დაახლოება. უნდა გვახსოვდეს, რომ თუ საწყისი მონაცემების ერთი მნიშვნელობაც კი შეიცვლება, ყველა კოეფიციენტი შეიცვლება მნიშვნელობებს, რადგან ისინი მთლიანად განისაზღვრება საწყისი მონაცემებით.

საწყისი მონაცემების დაახლოება წრფივი დამოკიდებულებით

(წრფივი რეგრესია)

მაგალითად, განვიხილოთ მიახლოებითი ფუნქციის განსაზღვრის მეთოდი, რომელიც მოცემულია როგორც წრფივი მიმართება. უმცირესი კვადრატების მეთოდის მიხედვით, კვადრატული გადახრების მინიმალური ჯამის პირობა იწერება შემდეგნაირად:

ცხრილის კვანძოვანი წერტილების კოორდინატები;

მიახლოებითი ფუნქციის უცნობი კოეფიციენტები, რომელიც მოცემულია როგორც წრფივი მიმართება.

ფუნქციის მინიმუმის არსებობის აუცილებელი პირობაა მისი ნაწილობრივი წარმოებულების ნულის ტოლობა უცნობი ცვლადების მიმართ. შედეგად, ჩვენ ვიღებთ განტოლებების შემდეგ სისტემას:

მოდით გადავცვალოთ მიღებული განტოლებათა წრფივი სისტემა.

ჩვენ ვხსნით სწორხაზოვან განტოლებათა სისტემას. მიახლოებითი ფუნქციის კოეფიციენტები ანალიტიკური ფორმით განისაზღვრება შემდეგნაირად (კრამერის მეთოდი):

ეს კოეფიციენტები უზრუნველყოფს წრფივი მიახლოებითი ფუნქციის აგებას კრიტერიუმის შესაბამისად მიახლოებითი ფუნქციის კვადრატების ჯამის მინიმიზაციის კრიტერიუმის შესაბამისად მოცემული ცხრილური მნიშვნელობებიდან (ექსპერიმენტული მონაცემები).

უმცირესი კვადრატების მეთოდის განხორციელების ალგორითმი

1. საწყისი მონაცემები:

მოცემულია ექსპერიმენტული მონაცემების მასივი გაზომვების რაოდენობით N

მოცემულია მიახლოებითი მრავალწევრის ხარისხი (m).

2. გაანგარიშების ალგორითმი:

2.1. კოეფიციენტები განისაზღვრება განზომილების მქონე განტოლებათა სისტემის ასაგებად

განტოლებათა სისტემის კოეფიციენტები (განტოლების მარცხენა მხარე)

- განტოლებათა სისტემის კვადრატული მატრიცის სვეტის ნომრის ინდექსი

წრფივი განტოლებათა სისტემის თავისუფალი წევრები (განტოლების მარჯვენა მხარე)

- განტოლებათა სისტემის კვადრატული მატრიცის მწკრივის რიცხვის ინდექსი

2.2. განზომილებით წრფივი განტოლებათა სისტემის ფორმირება.

2.3. m ხარისხის მიახლოებითი მრავალწევრის უცნობი კოეფიციენტების დასადგენად წრფივი განტოლებათა სისტემის ამოხსნა.

2.4 მიახლოებითი მრავალწევრის კვადრატული გადახრების ჯამის განსაზღვრა საწყისი მნიშვნელობებიდან ყველა კვანძის წერტილზე

კვადრატული გადახრების ჯამის ნაპოვნი მნიშვნელობა არის მინიმალური შესაძლო.

სხვა ფუნქციებთან დაახლოება

უნდა აღინიშნოს, რომ უმცირესი კვადრატების მეთოდის მიხედვით საწყისი მონაცემების მიახლოებისას ზოგჯერ მიახლოებით ფუნქციად გამოიყენება ლოგარითმული ფუნქცია, ექსპონენციალური ფუნქცია და სიმძლავრის ფუნქცია.

ჟურნალის დაახლოება

განვიხილოთ შემთხვევა, როდესაც მიახლოებითი ფუნქცია მოცემულია ფორმის ლოგარითმული ფუნქციით:

მინიმალური კვადრატის მეთოდი

უმცირესი კვადრატის მეთოდი ( MNK, OLS, ჩვეულებრივი უმცირესი კვადრატები) - რეგრესიული ანალიზის ერთ-ერთი ძირითადი მეთოდი რეგრესიის მოდელების უცნობი პარამეტრების შეფასების ნიმუშის მონაცემებიდან. მეთოდი ეფუძნება რეგრესიის ნარჩენების კვადრატების ჯამის მინიმიზაციას.

უნდა აღინიშნოს, რომ უმცირესი კვადრატების მეთოდს თავისთავად შეიძლება ეწოდოს პრობლემის გადაჭრის მეთოდი ნებისმიერ სფეროში, თუ ამოხსნა შედგება ან აკმაყოფილებს უცნობი ცვლადის ზოგიერთი ფუნქციის კვადრატების ჯამის მინიმიზაციის გარკვეულ კრიტერიუმს. მაშასადამე, უმცირესი კვადრატების მეთოდი ასევე შეიძლება გამოყენებულ იქნას მოცემული ფუნქციის მიახლოებითი წარმოდგენისთვის (დაახლოებით) სხვა (უმარტივესი) ფუნქციებით, როდესაც ვიპოვით სიმრავლეებს, რომლებიც აკმაყოფილებს განტოლებებს ან შეზღუდვებს, რომელთა რაოდენობა აღემატება ამ სიდიდეების რაოდენობას. და ა.შ.

MNC-ის არსი

მოდით (ახსნა) ცვლადს შორის ალბათური (რეგრესიის) დამოკიდებულების (პარამეტრული) მოდელი. და მრავალი ფაქტორი (ახსნა ცვლადები) x

სად არის უცნობი მოდელის პარამეტრების ვექტორი

- შემთხვევითი მოდელის შეცდომა.

დაე, ასევე იყოს მითითებული ცვლადების მნიშვნელობების ნიმუშის დაკვირვება. მოდით იყოს დაკვირვების ნომერი (). შემდეგ არის ცვლადების მნიშვნელობები --ე დაკვირვებაში. შემდეგ, b პარამეტრების მოცემული მნიშვნელობებისთვის, შესაძლებელია ახსნილი ცვლადის y თეორიული (მოდელური) მნიშვნელობების გამოთვლა:

ნარჩენების მნიშვნელობა დამოკიდებულია b პარამეტრების მნიშვნელობებზე.

LSM-ის (ჩვეულებრივი, კლასიკური) არსი არის ისეთი b პარამეტრების პოვნა, რომლებისთვისაც ნარჩენების კვადრატების ჯამი (ინგლ. კვადრატების ნარჩენი ჯამი) მინიმალური იქნება:

ზოგადად, ამ პრობლემის გადაჭრა შესაძლებელია ოპტიმიზაციის (მინიმიზაციის) რიცხვითი მეთოდებით. ამ შემთხვევაში საუბარია არაწრფივი უმცირესი კვადრატები(NLS ან NLLS - ინგლისური. არაწრფივი უმცირესი კვადრატები). ხშირ შემთხვევაში, შესაძლებელია ანალიტიკური გადაწყვეტის მიღება. მინიმიზაციის პრობლემის გადასაჭრელად საჭიროა ვიპოვოთ ფუნქციის სტაციონარული წერტილები უცნობი პარამეტრების მიხედვით დიფერენცირებით, წარმოებულების ნულამდე გათანაბრებით და მიღებული განტოლებათა სისტემის ამოხსნით:

თუ მოდელის შემთხვევითი შეცდომები ჩვეულებრივ განაწილებულია, აქვთ იგივე ვარიაცია და არ არის დაკავშირებული ერთმანეთთან, მინიმალური კვადრატების პარამეტრების შეფასება იგივეა, რაც მაქსიმალური ალბათობის მეთოდის (MLM) შეფასებები.

LSM ხაზოვანი მოდელის შემთხვევაში

დაე, რეგრესიის დამოკიდებულება იყოს წრფივი:

დაე - ახსნილი ცვლადის დაკვირვების სვეტის ვექტორი და - ფაქტორების დაკვირვების მატრიცა (მატრიცის რიგები - ფაქტორების მნიშვნელობების ვექტორები მოცემულ დაკვირვებაში, სვეტების მიხედვით - მოცემული ფაქტორის მნიშვნელობების ვექტორი ყველა დაკვირვებაში) . ხაზოვანი მოდელის მატრიცულ წარმოდგენას აქვს ფორმა:

მაშინ ახსნილი ცვლადის შეფასების ვექტორი და რეგრესიის ნარჩენების ვექტორი ტოლი იქნება

შესაბამისად, რეგრესიის ნარჩენების კვადრატების ჯამი ტოლი იქნება

ამ ფუნქციის დიფერენცირებით პარამეტრის ვექტორთან მიმართებაში და წარმოებულების ნულამდე გათანაბრება, ჩვენ ვიღებთ განტოლებათა სისტემას (მატრიცის სახით):

.

განტოლებათა ამ სისტემის ამოხსნა იძლევა ხაზოვანი მოდელის უმცირესი კვადრატების შეფასების ზოგად ფორმულას:

ანალიტიკური მიზნებისთვის, ამ ფორმულის ბოლო წარმოდგენა სასარგებლო აღმოჩნდება. თუ მონაცემები რეგრესიის მოდელში ორიენტირებული, მაშინ ამ წარმოდგენაში პირველ მატრიცას აქვს ფაქტორების ნიმუშური კოვარიანტების მატრიცის მნიშვნელობა, ხოლო მეორე არის დამოკიდებული ცვლადთან ფაქტორების კოვარიანტების ვექტორი. თუ გარდა ამისა, მონაცემები ასევე ნორმალიზებული SKO-ში (ეს არის საბოლოო ჯამში სტანდარტიზებული), მაშინ პირველ მატრიცას აქვს ფაქტორების ნიმუშის კორელაციის მატრიცის მნიშვნელობა, მეორე ვექტორს - ფაქტორების ნიმუშის კორელაციის ვექტორს დამოკიდებულ ცვლადთან.

LLS შეფასებების მნიშვნელოვანი თვისება მოდელებისთვის მუდმივთან ერთად- აგებული რეგრესიის ხაზი გადის ნიმუშის მონაცემების სიმძიმის ცენტრში, ანუ სრულდება თანასწორობა:

კერძოდ, უკიდურეს შემთხვევაში, როდესაც ერთადერთი რეგრესორი არის მუდმივი, აღმოვაჩენთ, რომ ერთი პარამეტრის OLS შეფასება (თვითონ მუდმივი) უდრის ახსნილი ცვლადის საშუალო მნიშვნელობას. ანუ არითმეტიკული საშუალო, რომელიც ცნობილია თავისი კარგი თვისებებით დიდი რიცხვების კანონებიდან, ასევე არის უმცირესი კვადრატების შეფასება - ის აკმაყოფილებს მისგან კვადრატული გადახრების მინიმალური ჯამის კრიტერიუმს.

მაგალითი: მარტივი (წყვილი) რეგრესია

დაწყვილებული წრფივი რეგრესიის შემთხვევაში, გაანგარიშების ფორმულები გამარტივებულია (შეგიძლიათ გააკეთოთ მატრიცული ალგებრის გარეშე):

OLS შეფასების თვისებები

უპირველეს ყოვლისა, ჩვენ აღვნიშნავთ, რომ წრფივი მოდელებისთვის, უმცირესი კვადრატების შეფასებები არის წრფივი შეფასებები, როგორც ზემოთ მოყვანილი ფორმულიდან ჩანს. OLS-ის მიუკერძოებელი შეფასებისთვის, აუცილებელია და საკმარისია რეგრესიის ანალიზის ყველაზე მნიშვნელოვანი პირობის შესრულება: ფაქტორებით განპირობებული შემთხვევითი შეცდომის მათემატიკური მოლოდინი უნდა იყოს ნულის ტოლი. ეს პირობა დაკმაყოფილებულია, კერძოდ, თუ

  1. შემთხვევითი შეცდომების მათემატიკური მოლოდინი არის ნული და
  2. ფაქტორები და შემთხვევითი შეცდომები დამოუკიდებელი შემთხვევითი ცვლადებია.

მეორე პირობა - ეგზოგენური ფაქტორების მდგომარეობა - ფუნდამენტურია. თუ ეს თვისება არ არის დაკმაყოფილებული, მაშინ შეგვიძლია ვივარაუდოთ, რომ თითქმის ნებისმიერი შეფასება იქნება უკიდურესად არადამაკმაყოფილებელი: ისინი არც კი იქნება თანმიმდევრული (ანუ, მონაცემთა ძალიან დიდი რაოდენობაც კი არ იძლევა ხარისხობრივი შეფასებების მიღებას ამ შემთხვევაში). კლასიკურ შემთხვევაში, უფრო ძლიერი ვარაუდი კეთდება ფაქტორების დეტერმინიზმის შესახებ, შემთხვევითი შეცდომისგან განსხვავებით, რაც ავტომატურად ნიშნავს, რომ ეგზოგენური მდგომარეობა დაკმაყოფილებულია. ზოგად შემთხვევაში, შეფასებების თანმიმდევრულობისთვის საკმარისია ეგზოგენურობის პირობის შესრულება მატრიცის კონვერგენციასთან ერთად ზოგიერთ არასიგნოლურ მატრიცასთან ერთად ნიმუშის ზომის უსასრულობამდე ზრდით.

იმისათვის, რომ, გარდა თანმიმდევრულობისა და მიუკერძოებლობისა, (ჩვეულებრივი) LSM-ის შეფასებები იყოს ასევე ეფექტური (საუკეთესო ხაზოვანი მიუკერძოებელი შეფასებების კლასში), აუცილებელია შესრულდეს შემთხვევითი შეცდომის დამატებითი თვისებები:

ეს დაშვებები შეიძლება ჩამოყალიბდეს შემთხვევითი შეცდომის ვექტორის კოვარიანტული მატრიცისთვის

ხაზოვანი მოდელი, რომელიც აკმაყოფილებს ამ პირობებს ეწოდება კლასიკური. კლასიკური წრფივი რეგრესიის უმცირესი კვადრატების შემფასებლები არის მიუკერძოებელი, თანმიმდევრული და ყველაზე ეფექტური შემფასებლები ყველა წრფივი მიუკერძოებელი შემფასებლების კლასში (აბრევიატურა ლურჯი (საუკეთესო ხაზოვანი უსაფუძვლო შემფასებელი) არის საუკეთესო ხაზოვანი მიუკერძოებელი შეფასება; საშინაო ლიტერატურაში უფრო ხშირად ციტირებულია გაუს-მარკოვის თეორემა). როგორც ადვილი საჩვენებელია, კოეფიციენტის შეფასების ვექტორის კოვარიანტული მატრიცა ტოლი იქნება:

განზოგადებული უმცირესი კვადრატები

უმცირესი კვადრატების მეთოდი ფართო განზოგადების საშუალებას იძლევა. ნარჩენების კვადრატების ჯამის მინიმიზაციის ნაცვლად, შეიძლება მინიმუმამდე დავიყვანოთ ნარჩენი ვექტორის გარკვეული დადებითი განსაზღვრული კვადრატული ფორმა, სადაც არის რაღაც სიმეტრიული დადებითი განსაზღვრული წონის მატრიცა. ჩვეულებრივი უმცირესი კვადრატები ამ მიდგომის განსაკუთრებული შემთხვევაა, როდესაც წონის მატრიცა არის იდენტურობის მატრიცის პროპორციული. როგორც ცნობილია სიმეტრიული მატრიცების (ან ოპერატორების) თეორიიდან, ასეთი მატრიცების დაშლა ხდება. მაშასადამე, მითითებული ფუნქციონალი შეიძლება წარმოდგენილი იყოს შემდეგნაირად, ანუ ეს ფუნქციონალი შეიძლება იყოს წარმოდგენილი, როგორც ზოგიერთი გარდაქმნილი „ნარჩენების“ კვადრატების ჯამი. ამრიგად, ჩვენ შეგვიძლია გამოვყოთ უმცირესი კვადრატების მეთოდების კლასი - LS- მეთოდები (უმცირესი კვადრატები).

დადასტურებულია (აიტკენის თეორემა), რომ განზოგადებული წრფივი რეგრესიის მოდელისთვის (რომელშიც არ არის დაწესებული შეზღუდვები შემთხვევითი შეცდომების კოვარიანსულ მატრიცაზე), ყველაზე ეფექტური (წრფივი მიუკერძოებელი შეფასებების კლასში) შეფასებებია ე.წ. განზოგადებული OLS (OMNK, GLS - გენერალიზებული უმცირესი კვადრატები)- LS-მეთოდი წონის მატრიცით, რომელიც ტოლია შემთხვევითი შეცდომების შებრუნებული კოვარიანტული მატრიცის: .

შეიძლება აჩვენოს, რომ ხაზოვანი მოდელის პარამეტრების GLS-შეფასების ფორმულას აქვს ფორმა

ამ შეფასებების კოვარიანტული მატრიცა, შესაბამისად, ტოლი იქნება

სინამდვილეში, OLS-ის არსი მდგომარეობს თავდაპირველი მონაცემების გარკვეულ (წრფივ) ტრანსფორმაციაში (P) და ჩვეულებრივ უმცირეს კვადრატების გამოყენებაში ტრანსფორმირებულ მონაცემებზე. ამ ტრანსფორმაციის მიზანია ის, რომ ტრანსფორმირებული მონაცემებისთვის შემთხვევითი შეცდომები უკვე აკმაყოფილებს კლასიკურ დაშვებებს.

შეწონილი უმცირესი კვადრატები

დიაგონალური წონის მატრიცის (და, შესაბამისად, შემთხვევითი შეცდომების კოვარიანტული მატრიცის) შემთხვევაში, ჩვენ გვაქვს ეგრეთ წოდებული შეწონილი უმცირესი კვადრატები (WLS - Weighted Least Squares). ამ შემთხვევაში, მოდელის ნარჩენების კვადრატების შეწონილი ჯამი მინიმუმამდეა დაყვანილი, ანუ თითოეული დაკვირვება იღებს „წონას“, რომელიც უკუპროპორციულია ამ დაკვირვებაში შემთხვევითი შეცდომის დისპერსიასთან: . ფაქტობრივად, მონაცემები გარდაიქმნება დაკვირვებების წონით (გაყოფა ოდენობით, რომელიც პროპორციულია შემთხვევითი შეცდომების სავარაუდო სტანდარტული გადახრის პროპორციულად), ხოლო ნორმალური უმცირესი კვადრატები გამოიყენება შეწონილ მონაცემებზე.

LSM-ის პრაქტიკაში გამოყენების რამდენიმე განსაკუთრებული შემთხვევა

ხაზოვანი მიახლოება

განვიხილოთ შემთხვევა, როდესაც გარკვეული სკალარული რაოდენობის დამოკიდებულების შესწავლის შედეგად გარკვეულ სკალარული სიდიდეზე (ეს შეიძლება იყოს, მაგალითად, ძაბვის დამოკიდებულება მიმდინარე სიძლიერეზე: , სადაც არის მუდმივი მნიშვნელობა, გამტარის წინააღმდეგობა ), გაზომეს ეს რაოდენობები, რის შედეგადაც მნიშვნელობები და მათი შესაბამისი მნიშვნელობები. გაზომვის მონაცემები უნდა ჩაიწეროს ცხრილში.

მაგიდა. გაზომვის შედეგები.

გაზომვა No.
1
2
3
4
5
6

კითხვა ასე ჟღერს: კოეფიციენტის რომელი მნიშვნელობა შეიძლება ავირჩიოთ დამოკიდებულების საუკეთესოდ აღსაწერად? უმცირესი კვადრატების მიხედვით, ეს მნიშვნელობა უნდა იყოს ისეთი, რომ მნიშვნელობების კვადრატული გადახრების ჯამი მნიშვნელობებისგან

მინიმალური იყო

კვადრატული გადახრების ჯამს აქვს ერთი უკიდურესი - მინიმუმი, რაც საშუალებას გვაძლევს გამოვიყენოთ ეს ფორმულა. მოდით ვიპოვოთ კოეფიციენტის მნიშვნელობა ამ ფორმულიდან. ამისათვის ჩვენ ვცვლით მის მარცხენა მხარეს შემდეგნაირად:

ბოლო ფორმულა საშუალებას გვაძლევს ვიპოვოთ კოეფიციენტის მნიშვნელობა, რომელიც საჭირო იყო პრობლემაში.

ამბავი

XIX საუკუნის დასაწყისამდე. მეცნიერებს არ ჰქონდათ გარკვეული წესები განტოლებათა სისტემის ამოხსნისთვის, რომელშიც უცნობის რაოდენობა განტოლებათა რაოდენობაზე ნაკლებია; ამ დრომდე გამოიყენებოდა კონკრეტული მეთოდები, განტოლებების ტიპებიდან და კალკულატორების ჭკუიდან გამომდინარე, და, შესაბამისად, სხვადასხვა კალკულატორები, ერთი და იგივე დაკვირვების მონაცემებიდან დაწყებული, სხვადასხვა დასკვნამდე მივიდნენ. გაუსს (1795) მიეწერება მეთოდის პირველი გამოყენება, ხოლო ლეჟანდრმა (1805) დამოუკიდებლად აღმოაჩინა და გამოაქვეყნა იგი მისი თანამედროვე სახელით (fr. Methode des moindres quarres ) . ლაპლასმა მეთოდი დააკავშირა ალბათობის თეორიას და ამერიკელმა მათემატიკოსმა ადრეინმა (1808) განიხილა მისი ალბათური აპლიკაციები. მეთოდი ფართოდ არის გავრცელებული და გაუმჯობესებულია ენკეს, ბესელის, ჰანსენის და სხვათა შემდგომი კვლევებით.

MNC-ების ალტერნატიული გამოყენება

უმცირესი კვადრატების მეთოდის იდეა ასევე შეიძლება გამოყენებულ იქნას სხვა შემთხვევებში, რომლებიც პირდაპირ არ არის დაკავშირებული რეგრესიის ანალიზთან. ფაქტია, რომ კვადრატების ჯამი არის ერთ-ერთი ყველაზე გავრცელებული სიახლოვის საზომი ვექტორებისთვის (ევკლიდური მეტრიკა სასრულ განზომილებიან სივრცეებში).

ერთ-ერთი პროგრამაა წრფივი განტოლებების სისტემების „გადაწყვეტა“, რომლებშიც განტოლებების რაოდენობა ცვლადების რაოდენობაზე მეტია.

სადაც მატრიცა არ არის კვადრატული, არამედ მართკუთხა.

განტოლებათა ასეთ სისტემას, ზოგად შემთხვევაში, არ აქვს ამონახსნი (თუ რანგი რეალურად მეტია ცვლადების რაოდენობაზე). მაშასადამე, ამ სისტემის „გადაჭრა“ შესაძლებელია მხოლოდ ასეთი ვექტორის არჩევის მნიშვნელობით, რათა მინიმუმამდე დაიყვანოს „მანძილი“ ვექტორებსა და . ამისათვის შეგიძლიათ გამოიყენოთ კრიტერიუმი სისტემის განტოლებების მარცხენა და მარჯვენა ნაწილების კვადრატული განსხვავებების ჯამის მინიმიზაციისთვის, ანუ . ადვილია იმის ჩვენება, რომ ამ მინიმიზაციის პრობლემის ამოხსნა იწვევს განტოლებათა შემდეგი სისტემის ამოხსნას