LSM երկու փոփոխականների ֆունկցիայի համար: Փորձարարական տվյալների մոտարկում. Նվազագույն քառակուսի մեթոդ. LSM-ի գործնական իրականացում ոչ ծրագրավորվող հաշվիչից գծային կախվածության համար

Օրինակ.

Փոփոխականների արժեքների վերաբերյալ փորձարարական տվյալներ XԵվ ժամըտրված են աղյուսակում:

Դրանց հավասարեցման արդյունքում ֆունկցիան

Օգտագործելով նվազագույն քառակուսի մեթոդ, մոտավորեք այս տվյալները գծային կախվածությամբ y=ax+b(գտնել տարբերակներ ԱԵվ բ) Պարզեք, թե երկու տողերից որն է ավելի լավ (նվազագույն քառակուսիների մեթոդի իմաստով) հավասարեցնում է փորձարարական տվյալները: Կատարեք նկարչություն:

Նվազագույն քառակուսիների մեթոդի էությունը (LSM).

Խնդիրը գծային կախվածության գործակիցները գտնելն է, որոնց համար գործում է երկու փոփոխականի ֆունկցիա ԱԵվ բ վերցնում է ամենափոքր արժեքը: Այսինքն՝ հաշվի առնելով տվյալները ԱԵվ բԳտնված ուղիղ գծից փորձարարական տվյալների քառակուսի շեղումների գումարը կլինի ամենափոքրը: Սա նվազագույն քառակուսիների մեթոդի ամբողջ իմաստն է:

Այսպիսով, օրինակի լուծումը կրճատվում է երկու փոփոխականների ֆունկցիայի ծայրահեղությունը գտնելով։

Գործակիցներ գտնելու բանաձևերի ստացում.

Կազմվում և լուծվում է երկու անհայտ ունեցող երկու հավասարումների համակարգ: Փոփոխականների նկատմամբ ֆունկցիայի մասնակի ածանցյալների հայտնաբերում ԱԵվ բ, այս ածանցյալները հավասարեցնում ենք զրոյի։

Ստացված հավասարումների համակարգը լուծում ենք ցանկացած մեթոդով (օրինակ փոխարինման մեթոդկամ ) և ստացեք գործակիցները գտնելու բանաձևեր՝ օգտագործելով նվազագույն քառակուսիների մեթոդը (LSM):

Տվյալներով ԱԵվ բֆունկցիան վերցնում է ամենափոքր արժեքը: Այս փաստի ապացույցը տրված է.

Դա նվազագույն քառակուսիների ամբողջ մեթոդն է: Պարամետրը գտնելու բանաձևը ապարունակում է , , , և պարամետր գումարները n- փորձարարական տվյալների քանակը. Այս գումարների արժեքները խորհուրդ է տրվում հաշվարկել առանձին: Գործակից բհայտնաբերվել է հաշվարկից հետո ա.

Ժամանակն է հիշել բնօրինակ օրինակը:

Լուծում.

Մեր օրինակում n=5. Մենք լրացնում ենք աղյուսակը այն գումարների հաշվարկման հարմարության համար, որոնք ներառված են պահանջվող գործակիցների բանաձևերում:

Աղյուսակի չորրորդ շարքի արժեքները ստացվում են յուրաքանչյուր թվի համար 2-րդ շարքի արժեքները 3-րդ շարքի արժեքներով բազմապատկելով։ ես.

Աղյուսակի հինգերորդ շարքի արժեքները ստացվում են յուրաքանչյուր թվի համար 2-րդ շարքի արժեքները քառակուսելով. ես.

Աղյուսակի վերջին սյունակի արժեքները տողերի միջև եղած արժեքների գումարներն են:

Գործակիցները գտնելու համար օգտագործում ենք նվազագույն քառակուսիների մեթոդի բանաձևերը ԱԵվ բ. Մենք դրանցում փոխարինում ենք աղյուսակի վերջին սյունակից համապատասխան արժեքները.

Հետևաբար, y=0.165x+2.184ցանկալի մոտավոր ուղիղ գիծն է:

Մնում է պարզել, թե տողերից որն է y=0.165x+2.184կամ ավելի լավ է մոտենում սկզբնական տվյալներին, այսինքն՝ կատարել գնահատական՝ օգտագործելով նվազագույն քառակուսիների մեթոդը:

Նվազագույն քառակուսիների մեթոդի սխալի գնահատում.

Դա անելու համար դուք պետք է հաշվարկեք այս տողերից սկզբնական տվյալների քառակուսի շեղումների գումարները Եվ , ավելի փոքր արժեքը համապատասխանում է մի տողի, որն ավելի լավ է մոտենում սկզբնական տվյալներին նվազագույն քառակուսիների մեթոդով:

Քանի որ , ապա գիծ y=0.165x+2.184ավելի լավ է մոտեցնում սկզբնական տվյալներին:

Նվազագույն քառակուսիների մեթոդի գրաֆիկական նկարազարդում (LSM):

Ամեն ինչ հիանալի է թվում աղյուսակներում: Կարմիր գիծը գտնված գիծն է y=0.165x+2.184, կապույտ գիծն է , վարդագույն կետերը սկզբնական տվյալներն են։

Ինչի՞ համար է դա, ինչի՞ համար են այս բոլոր մոտարկումները։

Ես անձամբ օգտագործում եմ տվյալների հարթեցման, ինտերպոլացիայի և էքստրապոլացիայի խնդիրները լուծելու համար (բնօրինակ օրինակում ձեզ կարող են խնդրել գտնել դիտարկվող արժեքի արժեքը yժամը x=3կամ երբ x=6 MNC մեթոդի համաձայն): Բայց այս մասին ավելի ուշ կխոսենք կայքի մեկ այլ բաժնում:

Ապացույց.

Այնպես որ, երբ գտնվի ԱԵվ բֆունկցիան վերցնում է ամենափոքր արժեքը, անհրաժեշտ է, որ այս պահին ֆունկցիայի համար երկրորդ կարգի դիֆերենցիալի քառակուսի ձևի մատրիցը միանշանակ դրական էր. Եկեք ցույց տանք:

Այն ունի բազմաթիվ կիրառություններ, քանի որ թույլ է տալիս տրված ֆունկցիայի մոտավոր ներկայացում այլ ավելի պարզ գործառույթներով։ LSM-ը կարող է չափազանց օգտակար լինել դիտարկումների մշակման համար, և այն ակտիվորեն օգտագործվում է որոշ քանակություններ գնահատելու համար՝ պատահական սխալներ պարունակող մյուսների չափումների արդյունքներից: Այս հոդվածում դուք կսովորեք, թե ինչպես իրականացնել նվազագույն քառակուսիների հաշվարկները Excel-ում:

Խնդրի շարադրանք կոնկրետ օրինակով

Ենթադրենք, որ կան երկու ցուցիչներ X և Y: Ավելին, Y-ը կախված է X-ից: Քանի որ OLS-ը մեզ հետաքրքրում է ռեգրեսիոն վերլուծության տեսանկյունից (Excel-ում դրա մեթոդներն իրականացվում են ներկառուցված գործառույթների միջոցով), մենք պետք է անմիջապես շարունակենք: դիտարկել կոնկրետ խնդիր.

Այսպիսով, թող X լինի մթերային խանութի վաճառքի տարածքը՝ չափված քառակուսի մետրով, իսկ Y՝ տարեկան շրջանառությունը՝ սահմանված միլիոնավոր ռուբլով:

Պահանջվում է կանխատեսում անել, թե ինչ շրջանառություն (Y) կունենա խանութը, եթե այն ունի այս կամ այն ​​մանրածախ տարածք: Ակնհայտ է, որ Y = f (X) ֆունկցիան աճում է, քանի որ հիպերմարկետում ավելի շատ ապրանքներ են վաճառվում, քան կրպակը:

Մի քանի խոսք կանխատեսման համար օգտագործվող սկզբնական տվյալների ճիշտության մասին

Ենթադրենք, մենք ունենք n խանութի տվյալների հետ կառուցված աղյուսակ:

Ըստ մաթեմատիկական վիճակագրության՝ արդյունքները քիչ թե շատ ճիշտ կլինեն, եթե հետազոտվեն առնվազն 5-6 օբյեկտների տվյալները։ Բացի այդ, «անոմալ» արդյունքները չեն կարող օգտագործվել: Մասնավորապես, էլիտար փոքր բուտիկը կարող է ունենալ մի քանի անգամ ավելի մեծ շրջանառություն, քան «masmarket» դասի խոշոր կետերի շրջանառությունը։

Մեթոդի էությունը

Աղյուսակի տվյալները կարող են ցուցադրվել դեկարտյան հարթության վրա որպես M 1 (x 1, y 1), ... M n (x n, y n) կետեր: Այժմ խնդրի լուծումը կնվազեցվի y = f (x) մոտավոր ֆունկցիայի ընտրությամբ, որն ունի M 1, M 2, .. M n կետերին հնարավորինս մոտ անցնող գրաֆիկ:

Իհարկե, դուք կարող եք օգտագործել բարձր աստիճանի բազմանդամ, բայց այս տարբերակը ոչ միայն դժվար է իրականացնել, այլ պարզապես սխալ է, քանի որ այն չի արտացոլի հիմնական միտումը, որը պետք է հայտնաբերել: Ամենախելամիտ լուծումը y = ax + b ուղիղ գիծ փնտրելն է, որը լավագույնս մոտավոր է փորձարարական տվյալներին, իսկ ավելի ճիշտ՝ a և b գործակիցներին։

Ճշգրտության միավոր

Ցանկացած մոտարկման համար առանձնահատուկ նշանակություն ունի դրա ճշգրտության գնահատումը: Նշեք e i-ով x i կետի ֆունկցիոնալ և փորձարարական արժեքների տարբերությունը (շեղումը), այսինքն e i = y i - f (x i):

Ակնհայտ է, որ մոտարկման ճշգրտությունը գնահատելու համար կարող եք օգտագործել շեղումների գումարը, այսինքն, երբ ընտրելով ուղիղ գիծ X-ի կախվածությունը Y-ից մոտավոր ներկայացման համար, նախապատվությունը պետք է տրվի նրան, որն ունի ամենափոքր արժեքը: e i գումարը բոլոր դիտարկվող կետերում: Այնուամենայնիվ, ամեն ինչ այնքան էլ պարզ չէ, քանի որ դրական շեղումների հետ մեկտեղ գործնականում կլինեն նաև բացասական:

Խնդիրը կարող եք լուծել՝ օգտագործելով շեղման մոդուլները կամ դրանց քառակուսիները: Վերջին մեթոդը ամենատարածվածն է: Այն օգտագործվում է բազմաթիվ ոլորտներում, ներառյալ ռեգրեսիոն վերլուծությունը (Excel-ում դրա իրականացումն իրականացվում է երկու ներկառուցված գործառույթների միջոցով) և վաղուց ապացուցված է, որ արդյունավետ է:

Նվազագույն քառակուսի մեթոդ

Excel-ում, ինչպես գիտեք, կա ներկառուցված autosum ֆունկցիա, որը թույլ է տալիս հաշվարկել ընտրված միջակայքում գտնվող բոլոր արժեքների արժեքները: Այսպիսով, ոչինչ չի խանգարի մեզ հաշվարկել արտահայտության արժեքը (e 1 2 + e 2 2 + e 3 2 + ... e n 2):

Մաթեմատիկական նշումով սա նման է.

Քանի որ ի սկզբանե որոշում է կայացվել մոտավորել ուղիղ գծով, մենք ունենք.

Այսպիսով, ուղիղ գիծ գտնելու խնդիրը, որը լավագույնս նկարագրում է X-ի և Y-ի միջև որոշակի կապը, հավասար է երկու փոփոխականների ֆունկցիայի նվազագույնի հաշվարկին.

Սա պահանջում է հավասարեցնել զրոյական մասնակի ածանցյալները նոր a և b փոփոխականների նկատմամբ և լուծել պարզունակ համակարգ, որը բաղկացած է երկու հավասարումներից 2 անհայտ ձևով.

Պարզ փոխակերպումներից հետո, այդ թվում՝ բաժանելով 2-ի և շահարկելով գումարները, մենք ստանում ենք.

Այն լուծելով, օրինակ, Կրամերի մեթոդով, մենք ստանում ենք անշարժ կետ a * և b * որոշակի գործակիցներով: Սա նվազագույնն է, այսինքն՝ կանխատեսելու համար, թե ինչ շրջանառություն կունենա խանութը որոշակի տարածքի համար, հարմար է y = a * x + b * ուղիղ գիծը, որը ռեգրեսիոն մոդել է տվյալ օրինակի համար։ Իհարկե, դա թույլ չի տա ձեզ գտնել ճշգրիտ արդյունքը, բայց դա կօգնի ձեզ պատկերացում կազմել, թե արդյոք որոշակի տարածքի համար ապառիկ խանութ գնելը կվճարի:

Ինչպես իրականացնել նվազագույն քառակուսիների մեթոդը Excel-ում

Excel-ն ունի նվազագույն քառակուսիների արժեքը հաշվարկելու ֆունկցիա։ Այն ունի հետևյալ ձևը՝ TREND (հայտնի Y արժեքներ; հայտնի X արժեքներ; նոր X արժեքներ; հաստատուն): Եկեք կիրառենք Excel-ում OLS-ի հաշվարկման բանաձևը մեր աղյուսակում:

Դա անելու համար այն բջիջում, որտեղ պետք է ցուցադրվի Excel-ում նվազագույն քառակուսիների մեթոդով հաշվարկի արդյունքը, մուտքագրեք «=» նշանը և ընտրեք «TREND» ֆունկցիան: Բացվող պատուհանում լրացրեք համապատասխան դաշտերը՝ ընդգծելով.

  • Y-ի հայտնի արժեքների միջակայք (այս դեպքում շրջանառության տվյալները);
  • միջակայք x 1, …x n, այսինքն՝ մանրածախ տարածքի չափը;
  • և x-ի հայտնի և անհայտ արժեքները, որոնց համար անհրաժեշտ է պարզել շրջանառության չափը (աշխատանքային թերթում դրանց գտնվելու վայրի մասին տեղեկությունների համար տե՛ս ստորև):

Բացի այդ, բանաձևում կա «Const» տրամաբանական փոփոխական: Եթե ​​դրան համապատասխան դաշտում մուտքագրեք 1, ապա դա կնշանակի, որ պետք է կատարվեն հաշվարկներ՝ ենթադրելով, որ b \u003d 0:

Եթե ​​Ձեզ անհրաժեշտ է իմանալ կանխատեսումը մեկից ավելի x արժեքների համար, ապա բանաձևը մուտքագրելուց հետո չպետք է սեղմել «Enter», այլ պետք է մուտքագրել «Shift» + «Control» + «Enter» («Enter») համադրությունը: ) ստեղնաշարի վրա:

Որոշ առանձնահատկություններ

Ռեգրեսիոն վերլուծությունը կարող է հասանելի լինել նույնիսկ կեղծիքների համար: Անհայտ փոփոխականների զանգվածի արժեքը կանխատեսելու Excel բանաձեւը` «TREND»-ը կարող է օգտագործվել նույնիսկ նրանց կողմից, ովքեր երբեք չեն լսել նվազագույն քառակուսիների մեթոդի մասին: Բավական է միայն իմանալ նրա աշխատանքի որոշ առանձնահատկություններ։ Մասնավորապես:

  • Եթե ​​մեկ տողում կամ սյունակում տեղադրեք y փոփոխականի հայտնի արժեքների միջակայքը, ապա x-ի հայտնի արժեքներով յուրաքանչյուր տող (սյունակ) ծրագրի կողմից կընկալվի որպես առանձին փոփոխական:
  • Եթե ​​TREND պատուհանում հայտնի x-ով միջակայքը նշված չէ, ապա Excel-ում ֆունկցիան օգտագործելու դեպքում ծրագիրը այն կդիտարկի որպես ամբողջ թվերից բաղկացած զանգված, որոնց թիվը համապատասխանում է տվյալ արժեքներով տիրույթին: y փոփոխականի.
  • «կանխատեսված» արժեքների զանգված դուրս բերելու համար միտում արտահայտությունը պետք է մուտքագրվի որպես զանգվածի բանաձև:
  • Եթե ​​նոր x արժեքներ չեն նշվում, ապա TREND ֆունկցիան դրանք համարում է հայտնիներին հավասար: Եթե ​​դրանք նշված չեն, ապա զանգված 1 ընդունվում է որպես արգումենտ; 2; 3; 4;…, որը համարժեք է արդեն տրված y պարամետրերով տիրույթին:
  • Նոր x արժեքներ պարունակող միջակայքը պետք է ունենա նույն կամ ավելի տողեր կամ սյունակներ, ինչ տրված y արժեքներով միջակայքը: Այլ կերպ ասած, այն պետք է համաչափ լինի անկախ փոփոխականներին։
  • Հայտնի x արժեքներով զանգվածը կարող է պարունակել բազմաթիվ փոփոխականներ: Այնուամենայնիվ, եթե մենք խոսում ենք միայն մեկի մասին, ապա պահանջվում է, որ x և y-ի տրված արժեքներով միջակայքերը լինեն համաչափ: Մի քանի փոփոխականների դեպքում անհրաժեշտ է, որ տվյալ y արժեքներով միջակայքը տեղավորվի մեկ սյունակում կամ մեկ տողում։

FORECAST ֆունկցիա

Այն իրականացվում է մի քանի գործառույթների միջոցով. Դրանցից մեկը կոչվում է «ԿԱՆԽԱՏԵՍՈՒԹՅՈՒՆ»։ Այն նման է TREND-ին, այսինքն՝ տալիս է նվազագույն քառակուսիների մեթոդով հաշվարկների արդյունքը: Սակայն միայն մեկ X-ի համար, որի համար Y-ի արժեքը անհայտ է:

Այժմ դուք գիտեք Excel-ի բանաձևերը կեղծիքների համար, որոնք թույլ են տալիս կանխատեսել ցուցիչի ապագա արժեքի արժեքը գծային միտումի համաձայն:

Նվազագույն քառակուսիների մեթոդը ամենատարածվածներից է և ամենազարգացածներից է դրա շնորհիվ գծային պարամետրերի գնահատման մեթոդների պարզությունն ու արդյունավետությունը. Միևնույն ժամանակ, այն օգտագործելիս պետք է որոշակի զգուշություն ցուցաբերել, քանի որ դրա օգտագործմամբ կառուցված մոդելները կարող են չբավարարել իրենց պարամետրերի որակի մի շարք պահանջներ և, որպես հետևանք, «լավ» չարտացոլեն գործընթացի զարգացման օրինաչափությունները:

Եկեք ավելի մանրամասն քննարկենք գծային էկոնոմետրիկ մոդելի պարամետրերի գնահատման կարգը՝ օգտագործելով նվազագույն քառակուսիների մեթոդը: Նման մոդելը ընդհանուր ձևով կարող է ներկայացվել (1.2) հավասարմամբ.

y t = a 0 + a 1 x 1 t +...+ a n x nt + ε t .

Նախնական տվյալները a 0, a 1,..., a n պարամետրերը գնահատելիս կախված փոփոխականի արժեքների վեկտորն է: y= (y 1, y 2, ..., y T)» և անկախ փոփոխականների արժեքների մատրիցը

որում սյունակներից բաղկացած առաջին սյունակը համապատասխանում է մոդելի գործակցին:

Նվազագույն քառակուսիների մեթոդը ստացել է իր անվանումը՝ հիմնված այն հիմնական սկզբունքի վրա, որ դրա հիման վրա ստացված պարամետրերի գնահատումները պետք է բավարարեն. մոդելի սխալի քառակուսիների գումարը պետք է լինի նվազագույն:

Նվազագույն քառակուսիների մեթոդով խնդիրների լուծման օրինակներ

Օրինակ 2.1.Առևտրային ձեռնարկությունն ունի 12 խանութներից բաղկացած ցանց, որոնց գործունեության մասին տեղեկատվությունը ներկայացված է Աղյուսակում: 2.1.

Ընկերության ղեկավարությունը կցանկանար իմանալ, թե ինչպես է տարեկանի չափը կախված խանութի վաճառքի տարածքից:

Աղյուսակ 2.1

Խանութի համարը

Տարեկան շրջանառություն, միլիոն ռուբլի

Առևտրի տարածք, հզ մ 2

Նվազագույն քառակուսիների լուծում.Եկեք նշանակենք --րդ խանութի տարեկան շրջանառությունը, միլիոն ռուբլի; --րդ խանութի վաճառվող տարածք, հազար մ 2.

Նկ.2.1. Scatterplot օրինակ 2.1

Փոփոխականների միջև ֆունկցիոնալ կապի ձևը որոշելու և ցրված գծապատկերի կառուցման համար (նկ. 2.1):

Ելնելով ցրված դիագրամից՝ մենք կարող ենք եզրակացնել, որ տարեկան շրջանառությունը դրականորեն կախված է վաճառքի տարածքից (այսինքն՝ y-ը կաճի՝ աճի հետ միասին): Ֆունկցիոնալ կապի ամենահարմար ձևը − է գծային.

Հետագա հաշվարկների համար տեղեկատվությունը ներկայացված է Աղյուսակում: 2.2. Օգտագործելով նվազագույն քառակուսիների մեթոդը, մենք գնահատում ենք գծային մեկ գործոնով էկոնոմետրիկ մոդելի պարամետրերը

Աղյուսակ 2.2

Այսպիսով,

Հետևաբար, առևտրի տարածքի 1 հազար մ 2-ով աճով, այլ հավասար պայմաններով, միջին տարեկան շրջանառությունն ավելանում է 67,8871 միլիոն ռուբլով:

Օրինակ 2.2.Ձեռնարկության ղեկավարությունը նկատել է, որ տարեկան շրջանառությունը կախված է ոչ միայն խանութի վաճառքի տարածքից (տես օրինակ 2.1), այլև այցելուների միջին թվից: Համապատասխան տեղեկատվությունը ներկայացված է աղյուսակում: 2.3.

Աղյուսակ 2.3

Լուծում.Նշել - օրական խանութի այցելուների միջին թիվը, հազար մարդ:

Փոփոխականների միջև ֆունկցիոնալ կապի ձևը որոշելու և ցրված գծապատկեր կառուցելու համար (նկ. 2.2):

Ելնելով ցրված գծապատկերից՝ կարող ենք եզրակացնել, որ տարեկան շրջանառությունը դրականորեն կապված է օրական այցելուների միջին թվի հետ (այսինքն՝ y-ն կավելանա ի աճով): Ֆունկցիոնալ կախվածության ձևը գծային է:

Բրինձ. 2.2. Scatterplot օրինակ 2.2

Աղյուսակ 2.4

Ընդհանուր առմամբ, անհրաժեշտ է որոշել երկու գործոնային էկոնոմետրիկ մոդելի պարամետրերը

y t \u003d a 0 + a 1 x 1 t + a 2 x 2 t + ε t

Հետագա հաշվարկների համար անհրաժեշտ տեղեկատվությունը ներկայացված է Աղյուսակում: 2.4.

Եկեք գնահատենք գծային երկգործոն էկոնոմետրիկ մոդելի պարամետրերը՝ օգտագործելով նվազագույն քառակուսիների մեթոդը:

Այսպիսով,

Գործակիցի գնահատումը = 61,6583 ցույց է տալիս, որ այլ հավասար պայմաններով, առևտրի տարածքի 1 հազար մ 2-ով աճի դեպքում տարեկան շրջանառությունը կաճի միջինը 61,6583 միլիոն ռուբլով:

Նվազագույն քառակուսի մեթոդ

Նվազագույն քառակուսի մեթոդ ( MNK, OLS, սովորական նվազագույն քառակուսիներ) - ռեգրեսիոն վերլուծության հիմնական մեթոդներից մեկը` ռեգրեսիոն մոդելների անհայտ պարամետրերը ընտրանքային տվյալներից գնահատելու համար: Մեթոդը հիմնված է ռեգրեսիայի մնացորդների քառակուսիների գումարը նվազագույնի հասցնելու վրա:

Հարկ է նշել, որ ամենափոքր քառակուսիների մեթոդն ինքնին կարելի է անվանել ցանկացած ոլորտում խնդրի լուծման մեթոդ, եթե լուծումը բաղկացած է կամ բավարարում է անհայտ փոփոխականների որոշ ֆունկցիաների քառակուսիների գումարը նվազագույնի հասցնելու որոշակի չափանիշ: Հետևաբար, նվազագույն քառակուսիների մեթոդը կարող է օգտագործվել նաև այլ (ավելի պարզ) ֆունկցիաներով տրված ֆունկցիայի մոտավոր ներկայացման (մոտարկման) համար, երբ գտնում ենք հավասարումների կամ սահմանափակումների բավարարող մեծությունների մի շարք, որոնց թիվը գերազանցում է այդ մեծությունների թիվը։ և այլն։

ՄՆԿ-ի էությունը

Թող (բացատրված) փոփոխականի միջև հավանական (ռեգեսիոն) կախվածության որոշ (պարամետրիկ) մոդել yև բազմաթիվ գործոններ (բացատրական փոփոխականներ) x

որտեղ է անհայտ մոդելի պարամետրերի վեկտորը

- Պատահական մոդելի սխալ:

Թող լինեն նաև նշված փոփոխականների արժեքների նմուշային դիտարկումներ: Թող լինի դիտարկման թիվը (): Այնուհետև --րդ դիտարկման փոփոխականների արժեքներն են: Այնուհետև b պարամետրերի տրված արժեքների համար հնարավոր է հաշվարկել y բացատրված փոփոխականի տեսական (մոդելային) արժեքները.

Մնացորդների արժեքը կախված է պարամետրերի արժեքներից b.

LSM-ի էությունը (սովորական, դասական) այնպիսի պարամետրեր գտնելն է b, որոնց համար մնացորդների քառակուսիների գումարը (eng. Քառակուսիների մնացորդային գումարը) կլինի նվազագույն.

Ընդհանուր դեպքում այս խնդիրը կարող է լուծվել օպտիմալացման (մինիմիզացման) թվային մեթոդներով։ Այս դեպքում խոսվում է ոչ գծային նվազագույն քառակուսիներ(NLS կամ NLLS - անգլերեն. Ոչ գծային նվազագույն քառակուսիներ) Շատ դեպքերում կարելի է վերլուծական լուծում ստանալ։ Մինիմալացման խնդիրը լուծելու համար անհրաժեշտ է գտնել ֆունկցիայի անշարժ կետերը՝ այն տարբերակելով b անհայտ պարամետրերի նկատմամբ, ածանցյալները հավասարեցնելով զրոյի և լուծելով ստացված հավասարումների համակարգը.

Եթե ​​մոդելի պատահական սխալները սովորաբար բաշխված են, ունեն նույն շեղումը և փոխկապակցված չեն միմյանց հետ, նվազագույն քառակուսիների պարամետրի գնահատումները նույնն են, ինչ առավելագույն հավանականության մեթոդի (MLM) գնահատումները:

LSM գծային մոդելի դեպքում

Թող ռեգրեսիայի կախվածությունը լինի գծային.

Թող y- բացատրված փոփոխականի դիտարկումների սյունակային վեկտոր և - գործոնների դիտարկումների մատրիցա (մատրիցի տողեր՝ տվյալ դիտարկման գործոնի արժեքների վեկտորներ, ըստ սյունակների՝ տվյալ գործոնի արժեքների վեկտոր բոլոր դիտարկումներում) . Գծային մոդելի մատրիցային ներկայացումն ունի հետևյալ ձևը.

Այնուհետև բացատրված փոփոխականի գնահատումների վեկտորը և ռեգրեսիայի մնացորդների վեկտորը հավասար կլինեն.

համապատասխանաբար, ռեգրեսիայի մնացորդների քառակուսիների գումարը հավասար կլինի

Տարբերակելով այս ֆունկցիան պարամետրի վեկտորի նկատմամբ և հավասարեցնելով ածանցյալները զրոյի, մենք ստանում ենք հավասարումների համակարգ (մատրիցի տեսքով).

.

Հավասարումների այս համակարգի լուծումը տալիս է գծային մոդելի նվազագույն քառակուսիների գնահատումների ընդհանուր բանաձևը.

Վերլուծական նպատակներով այս բանաձևի վերջին ներկայացումը օգտակար է դառնում: Եթե ​​տվյալները ռեգրեսիայի մոդելում կենտրոնացած, ապա այս ներկայացման մեջ առաջին մատրիցն ունի գործակիցների օրինակելի կովարիանս մատրիցի նշանակությունը, իսկ երկրորդը կախված փոփոխականով գործոնների կովարիանսների վեկտորն է։ Եթե, ի լրումն, տվյալները նույնպես նորմալացված SKO-ում (այսինքն, ի վերջո ստանդարտացված), ապա առաջին մատրիցն ունի գործոնների ընտրանքային հարաբերակցության մատրիցայի նշանակությունը, երկրորդ վեկտորը՝ կախված փոփոխականի հետ գործոնների ընտրանքային հարաբերակցության վեկտորը։

LLS գնահատումների կարևոր հատկությունը մոդելների համար հաստատունով- կառուցված ռեգրեսիայի գիծն անցնում է նմուշի տվյալների ծանրության կենտրոնով, այսինքն՝ հավասարությունը կատարվում է.

Մասնավորապես, ծայրահեղ դեպքում, երբ միակ ռեգրեսորը հաստատուն է, մենք գտնում ենք, որ մեկ պարամետրի OLS գնահատականը (հաստատուն ինքնին) հավասար է բացատրվող փոփոխականի միջին արժեքին: Այսինքն՝ թվաբանական միջինը, որը հայտնի է մեծ թվերի օրենքներից իր լավ հատկություններով, նաև նվազագույն քառակուսիների գնահատական ​​է. այն բավարարում է դրանից քառակուսի շեղումների նվազագույն գումարի չափանիշը:

Օրինակ՝ պարզ (զույգ) ռեգրեսիա

Զուգակցված գծային ռեգրեսիայի դեպքում հաշվարկման բանաձևերը պարզեցված են (կարող եք անել առանց մատրիցային հանրահաշվի).

OLS գնահատումների հատկությունները

Նախևառաջ, մենք նշում ենք, որ գծային մոդելների համար նվազագույն քառակուսիների գնահատումները գծային գնահատումներ են, ինչպես հետևում է վերը նշված բանաձևից: OLS-ի անաչառ գնահատումների համար անհրաժեշտ և բավարար է կատարել ռեգրեսիոն վերլուծության ամենակարևոր պայմանը. գործոններով պայմանավորված պատահական սխալի մաթեմատիկական ակնկալիքը պետք է հավասար լինի զրոյի: Այս պայմանը բավարարվում է, մասնավորապես, եթե

  1. պատահական սխալների մաթեմատիկական ակնկալիքը զրո է, և
  2. գործոնները և պատահական սխալները անկախ պատահական փոփոխականներ են:

Երկրորդ պայմանը` էկզոգեն գործոնների վիճակը, հիմնարար է: Եթե ​​այս հատկությունը բավարարված չէ, ապա կարող ենք ենթադրել, որ գրեթե ցանկացած գնահատական ​​կլինի ծայրահեղ անբավարար. դրանք նույնիսկ չեն լինի հետևողական (այսինքն, նույնիսկ շատ մեծ քանակությամբ տվյալներ թույլ չեն տալիս այս դեպքում որակական գնահատականներ ստանալ): Դասական դեպքում ավելի ուժեղ ենթադրություն է արվում գործոնների դետերմինիզմի մասին, ի տարբերություն պատահական սխալի, ինչը ավտոմատ կերպով նշանակում է, որ էկզոգեն պայմանը բավարարված է։ Ընդհանուր դեպքում, գնահատումների հետևողականության համար բավարար է էկզոգենության պայմանի կատարումը մատրիցի կոնվերգենցիայի հետ մեկտեղ ոչ եզակի մատրիցին՝ ընտրանքի չափի աճով մինչև անսահմանություն:

Որպեսզի, բացի հետևողականությունից և անաչառությունից, (սովորական) նվազագույն քառակուսիների գնահատումները նույնպես արդյունավետ լինեն (լավագույնը գծային անկողմնակալ գնահատումների դասում), անհրաժեշտ է կատարել պատահական սխալի լրացուցիչ հատկություններ.

Այս ենթադրությունները կարող են ձևակերպվել պատահական սխալի վեկտորի կովարիանսային մատրիցայի համար

Գծային մոդելը, որը բավարարում է այս պայմանները, կոչվում է դասական. Դասական գծային ռեգրեսիայի OLS գնահատականները անաչառ, հետևողական և ամենաարդյունավետ գնահատականներն են բոլոր գծային անկողմնակալ գնահատումների դասում (անգլերեն գրականության մեջ հապավումը երբեմն օգտագործվում է. Կապույտ (Լավագույն գծային անհիմն գնահատիչ) լավագույն գծային անաչառ գնահատականն է. հայրենական գրականության մեջ ավելի հաճախ նշվում է Գաուս-Մարկովի թեորեմը): Քանի որ հեշտ է ցույց տալ, գործակիցների գնահատման վեկտորի կովարիանսի մատրիցը հավասար կլինի.

Ընդհանրացված նվազագույն քառակուսիներ

Նվազագույն քառակուսիների մեթոդը թույլ է տալիս լայն ընդհանրացում: Մնացորդների քառակուսիների գումարը նվազագույնի հասցնելու փոխարեն, կարելի է նվազագույնի հասցնել մնացորդային վեկտորի որոշ դրական հստակ քառակուսի ձև, որտեղ կա որոշ սիմետրիկ դրական որոշակի քաշի մատրիցա: Սովորական նվազագույն քառակուսիները այս մոտեցման հատուկ դեպք է, երբ քաշի մատրիցը համաչափ է նույնականացման մատրիցին: Ինչպես հայտնի է սիմետրիկ մատրիցների (կամ օպերատորների) տեսությունից, այդպիսի մատրիցների համար կա տարրալուծում։ Հետևաբար, նշված ֆունկցիոնալը կարող է ներկայացվել հետևյալ կերպ, այսինքն՝ այս ֆունկցիոնալը կարող է ներկայացվել որպես որոշ փոխակերպված «մնացորդների» քառակուսիների գումար։ Այսպիսով, մենք կարող ենք տարբերակել նվազագույն քառակուսիների մեթոդների դաս՝ LS-մեթոդներ (Նվազագույն քառակուսիներ):

Ապացուցված է (Այթքենի թեորեմ), որ ընդհանրացված գծային ռեգրեսիոն մոդելի համար (որում պատահական սխալների կովարիանսային մատրիցայի վրա սահմանափակումներ չեն դրվում), ամենաարդյունավետը (գծային անկողմնակալ գնահատումների դասում) գնահատումներ են այսպես կոչված. ընդհանրացված OLS (OMNK, GLS - Ընդհանրացված նվազագույն քառակուսիներ)- LS-մեթոդ քաշային մատրիցով, որը հավասար է պատահական սխալների հակադարձ կովարիանսային մատրիցին.

Կարելի է ցույց տալ, որ գծային մոդելի պարամետրերի GLS-գնահատումների բանաձևն ունի ձև.

Այս գնահատումների կովարիանսային մատրիցը, համապատասխանաբար, հավասար կլինի

Փաստորեն, OLS-ի էությունը կայանում է սկզբնական տվյալների որոշակի (գծային) փոխակերպման (P) և փոխակերպված տվյալների նկատմամբ սովորական նվազագույն քառակուսիների կիրառման մեջ: Այս փոխակերպման նպատակն այն է, որ փոխակերպված տվյալների համար պատահական սխալներն արդեն բավարարում են դասական ենթադրությունները։

Քաշված նվազագույն քառակուսիները

Շեղանկյուն քաշային մատրիցայի դեպքում (և հետևաբար՝ պատահական սխալների կովարիանսի մատրիցը), մենք ունենք այսպես կոչված կշռված նվազագույն քառակուսիներ (WLS - Weighted Least Squares): Այս դեպքում մոդելի մնացորդների քառակուսիների կշռված գումարը նվազագույնի է հասցվում, այսինքն՝ յուրաքանչյուր դիտարկում ստանում է «կշիռ», որը հակադարձ համեմատական ​​է այս դիտարկման պատահական սխալի շեղմանը. Փաստորեն, տվյալները փոխակերպվում են դիտարկումների կշռման միջոցով (բաժանելով պատահական սխալների ենթադրյալ ստանդարտ շեղմանը համամասնորեն), և կշռված տվյալների վրա կիրառվում են նորմալ նվազագույն քառակուսիներ:

LSM-ի գործնականում կիրառման մի քանի հատուկ դեպքեր

Գծային մոտարկում

Դիտարկենք այն դեպքը, երբ որոշակի սկալային մեծության կախվածությունը որոշակի սկալյար մեծությունից ուսումնասիրելու արդյունքում (սա կարող է լինել, օրինակ, լարման կախվածությունը ընթացիկ ուժից. ), չափվել են այդ մեծությունները, ինչի արդյունքում արժեքներն ու դրանց համապատասխան արժեքները։ Չափման տվյալները պետք է գրանցվեն աղյուսակում:

Աղյուսակ. Չափման արդյունքները.

Չափման թիվ
1
2
3
4
5
6

Հարցը հնչում է այսպես. գործակիցի ո՞ր արժեքը կարելի է ընտրել կախվածությունը լավագույնս նկարագրելու համար: Ըստ նվազագույն քառակուսիների, այս արժեքը պետք է լինի այնպիսին, որ արժեքների քառակուսի շեղումների գումարը արժեքներից

նվազագույն էր

Քառակուսի շեղումների գումարն ունի մեկ ծայրահեղություն՝ նվազագույնը, որը թույլ է տալիս օգտագործել այս բանաձևը։ Եկեք այս բանաձևից գտնենք գործակցի արժեքը. Դա անելու համար մենք նրա ձախ կողմը վերափոխում ենք հետևյալ կերպ.

Վերջին բանաձևը թույլ է տալիս գտնել այն գործակիցի արժեքը, որը պահանջվում էր խնդրի մեջ:

Պատմություն

Մինչև XIX դարի սկիզբը։ գիտնականները չունեին որոշակի կանոններ հավասարումների համակարգ լուծելու համար, որտեղ անհայտների թիվը հավասարումների քանակից փոքր է. Մինչ այդ օգտագործվում էին որոշակի մեթոդներ՝ կախված հավասարումների տեսակից և հաշվիչների հնարամտությունից, և, հետևաբար, տարբեր հաշվիչներ, սկսած նույն դիտողական տվյալներից, եկան տարբեր եզրակացությունների։ Գաուսը (1795) վերագրվում է մեթոդի առաջին կիրառմանը, իսկ Լեժանդրը (1805) ինքնուրույն հայտնաբերել և հրատարակել է այն իր ժամանակակից անունով (fr. Methode des moindres quarres ) . Լապլասը մեթոդը կապում է հավանականության տեսության հետ, իսկ ամերիկացի մաթեմատիկոս Ադրեյնը (1808) դիտարկել է դրա հավանականական կիրառությունները։ Մեթոդը լայն տարածում ունի և բարելավվել է Էնկեի, Բեսելի, Հանսենի և այլոց հետագա հետազոտություններով։

MNC-ների այլընտրանքային օգտագործումը

Նվազագույն քառակուսիների մեթոդի գաղափարը կարող է օգտագործվել նաև այլ դեպքերում, որոնք ուղղակիորեն կապված չեն ռեգրեսիոն վերլուծության հետ: Փաստն այն է, որ քառակուսիների գումարը վեկտորների մոտիկության ամենատարածված չափորոշիչներից մեկն է (էվկլիդյան մետրիկ վերջավոր չափերի տարածություններում):

Մեկ կիրառություն է «լուծել» գծային հավասարումների համակարգերը, որոնցում հավասարումների թիվը մեծ է փոփոխականների թվից։

որտեղ մատրիցը քառակուսի չէ, այլ ուղղանկյուն:

Հավասարումների նման համակարգը, ընդհանուր դեպքում, լուծում չունի (եթե աստիճանը իրականում մեծ է փոփոխականների քանակից)։ Հետևաբար, այս համակարգը կարող է «լուծվել» միայն այնպիսի վեկտորի ընտրության իմաստով, որպեսզի նվազագույնի հասցվի վեկտորների միջև «հեռավորությունը» և . Դա անելու համար կարող եք կիրառել համակարգի հավասարումների ձախ և աջ մասերի քառակուսի տարբերությունների գումարը նվազագույնի հասցնելու չափանիշը, այսինքն՝ . Հեշտ է ցույց տալ, որ նվազագույնի հասցնելու այս խնդրի լուծումը հանգեցնում է հետևյալ հավասարումների համակարգի լուծմանը

Օրինակ.

Փոփոխականների արժեքների վերաբերյալ փորձարարական տվյալներ XԵվ ժամըտրված են աղյուսակում:

Դրանց հավասարեցման արդյունքում ֆունկցիան

Օգտագործելով նվազագույն քառակուսի մեթոդ, մոտավորեք այս տվյալները գծային կախվածությամբ y=ax+b(գտնել տարբերակներ ԱԵվ բ) Պարզեք, թե երկու տողերից որն է ավելի լավ (նվազագույն քառակուսիների մեթոդի իմաստով) հավասարեցնում է փորձարարական տվյալները: Կատարեք նկարչություն:

Նվազագույն քառակուսիների մեթոդի էությունը (LSM).

Խնդիրը գծային կախվածության գործակիցները գտնելն է, որոնց համար գործում է երկու փոփոխականի ֆունկցիա ԱԵվ բ վերցնում է ամենափոքր արժեքը: Այսինքն՝ հաշվի առնելով տվյալները ԱԵվ բԳտնված ուղիղ գծից փորձարարական տվյալների քառակուսի շեղումների գումարը կլինի ամենափոքրը: Սա նվազագույն քառակուսիների մեթոդի ամբողջ իմաստն է:

Այսպիսով, օրինակի լուծումը կրճատվում է երկու փոփոխականների ֆունկցիայի ծայրահեղությունը գտնելով։

Գործակիցներ գտնելու բանաձևերի ստացում.

Կազմվում և լուծվում է երկու անհայտ ունեցող երկու հավասարումների համակարգ: Գործառույթների մասնակի ածանցյալների հայտնաբերում ըստ փոփոխականների ԱԵվ բ, այս ածանցյալները հավասարեցնում ենք զրոյի։

Ստացված հավասարումների համակարգը լուծում ենք ցանկացած մեթոդով (օրինակ փոխարինման մեթոդկամ Կրամերի մեթոդը) և ստացեք գործակիցները գտնելու բանաձևեր՝ օգտագործելով նվազագույն քառակուսիների մեթոդը (LSM):

Տվյալներով ԱԵվ բֆունկցիան վերցնում է ամենափոքր արժեքը: Այս փաստի ապացույցը տրված է էջի վերջում գտնվող տեքստի տակ.

Դա նվազագույն քառակուսիների ամբողջ մեթոդն է: Պարամետրը գտնելու բանաձևը ապարունակում է ,,, և պարամետր գումարները n- փորձարարական տվյալների քանակը. Այս գումարների արժեքները խորհուրդ է տրվում հաշվարկել առանձին: Գործակից բհայտնաբերվել է հաշվարկից հետո ա.

Ժամանակն է հիշել բնօրինակ օրինակը:

Լուծում.

Մեր օրինակում n=5. Մենք լրացնում ենք աղյուսակը այն գումարների հաշվարկման հարմարության համար, որոնք ներառված են պահանջվող գործակիցների բանաձևերում:

Աղյուսակի չորրորդ շարքի արժեքները ստացվում են յուրաքանչյուր թվի համար 2-րդ շարքի արժեքները 3-րդ շարքի արժեքներով բազմապատկելով։ ես.

Աղյուսակի հինգերորդ շարքի արժեքները ստացվում են յուրաքանչյուր թվի համար 2-րդ շարքի արժեքները քառակուսելով. ես.

Աղյուսակի վերջին սյունակի արժեքները տողերի միջև եղած արժեքների գումարներն են:

Գործակիցները գտնելու համար օգտագործում ենք նվազագույն քառակուսիների մեթոդի բանաձևերը ԱԵվ բ. Մենք դրանցում փոխարինում ենք աղյուսակի վերջին սյունակից համապատասխան արժեքները.

Հետևաբար, y=0.165x+2.184ցանկալի մոտավոր ուղիղ գիծն է:

Մնում է պարզել, թե տողերից որն է y=0.165x+2.184կամ ավելի լավ է մոտենում սկզբնական տվյալներին, այսինքն՝ կատարել գնահատական՝ օգտագործելով նվազագույն քառակուսիների մեթոդը:

Նվազագույն քառակուսիների մեթոդի սխալի գնահատում.

Դա անելու համար դուք պետք է հաշվարկեք այս տողերից սկզբնական տվյալների քառակուսի շեղումների գումարները Եվ , ավելի փոքր արժեքը համապատասխանում է մի տողի, որն ավելի լավ է մոտենում սկզբնական տվյալներին նվազագույն քառակուսիների մեթոդով:

Քանի որ , ապա գիծ y=0.165x+2.184ավելի լավ է մոտեցնում սկզբնական տվյալներին:

Նվազագույն քառակուսիների մեթոդի գրաֆիկական նկարազարդում (LSM):

Ամեն ինչ հիանալի է թվում աղյուսակներում: Կարմիր գիծը գտնված գիծն է y=0.165x+2.184, կապույտ գիծն է , վարդագույն կետերը սկզբնական տվյալներն են։

Գործնականում տարբեր գործընթացներ մոդելավորելիս, մասնավորապես, տնտեսական, ֆիզիկական, տեխնիկական, սոցիալական, լայնորեն օգտագործվում է որոշ ֆիքսված կետերում իրենց հայտնի արժեքներից ֆունկցիաների մոտավոր արժեքների հաշվարկման այս կամ այն ​​մեթոդը:

Այս տեսակի գործառույթների մոտարկման խնդիրներ հաճախ են առաջանում.

    փորձի արդյունքում ստացված աղյուսակային տվյալների համաձայն ուսումնասիրվող գործընթացի բնորոշ քանակությունների արժեքները հաշվարկելու մոտավոր բանաձևեր կառուցելիս.

    թվային ինտեգրման, տարբերակման, դիֆերենցիալ հավասարումների լուծման և այլն;

    եթե անհրաժեշտ է հաշվարկել գործառույթների արժեքները դիտարկվող միջակայքի միջանկյալ կետերում.

    դիտարկվող միջակայքից դուրս գործընթացի բնորոշ մեծությունների արժեքները որոշելիս, մասնավորապես, կանխատեսելիս.

Եթե ​​աղյուսակով սահմանված որոշակի գործընթաց մոդելավորելու համար կառուցվում է մի ֆունկցիա, որը մոտավորապես նկարագրում է այս գործընթացը՝ հիմնվելով նվազագույն քառակուսիների մեթոդի վրա, այն կկոչվի մոտավոր ֆունկցիա (ռեգեսիա), և ինքնին մոտավոր գործառույթներ կառուցելու առաջադրանքը կկատարվի: լինել մոտավոր խնդիր:

Այս հոդվածում քննարկվում են MS Excel փաթեթի հնարավորությունները նման խնդիրների լուծման համար, բացի այդ, տրված են աղյուսակային տրված գործառույթների համար ռեգրեսիաների կառուցման (ստեղծման) մեթոդներ և տեխնիկա (որը ռեգրեսիոն վերլուծության հիմքն է):

Excel-ում ռեգրեսիաներ կառուցելու երկու տարբերակ կա.

    Ընտրված ռեգրեսիաների (միտման գծերի) ավելացում գծապատկերում, որը կառուցված է ուսումնասիրված գործընթացի բնութագրիչի տվյալների աղյուսակի հիման վրա (հասանելի է միայն գծապատկերի կառուցման դեպքում);

    Excel-ի աշխատաթերթի ներկառուցված վիճակագրական գործառույթների օգտագործումը, որը թույլ է տալիս ստանալ ռեգրեսիաներ (միտման գծեր) անմիջապես աղբյուրի տվյալների աղյուսակից:

Գծապատկերում միտումների ավելացում

Տվյալների աղյուսակի համար, որը նկարագրում է որոշակի գործընթաց և ներկայացված է դիագրամով, Excel-ն ունի ռեգրեսիայի վերլուծության արդյունավետ գործիք, որը թույլ է տալիս.

    կառուցել նվազագույն քառակուսիների մեթոդի հիման վրա և դիագրամին ավելացնել հինգ տեսակի ռեգրեսիաներ, որոնք մոդելավորում են ուսումնասիրվող գործընթացը տարբեր աստիճանի ճշգրտությամբ.

    դիագրամին ավելացնել կառուցված ռեգրեսիայի հավասարումը.

    որոշել ընտրված ռեգրեսիայի համապատասխանության աստիճանը գծապատկերում ցուցադրված տվյալների հետ:

Գծապատկերի տվյալների հիման վրա Excel-ը թույլ է տալիս ստանալ ռեգրեսիաների գծային, բազմանդամ, լոգարիթմական, էքսպոնենցիալ, էքսպոնենցիալ տեսակներ, որոնք տրված են հավասարմամբ.

y = y(x)

որտեղ x-ը անկախ փոփոխական է, որը հաճախ վերցնում է բնական թվերի հաջորդականության արժեքները (1; 2; 3; ...) և արտադրում է, օրինակ, ուսումնասիրվող գործընթացի ժամանակի հետհաշվարկը (բնութագրերը) .

1 . Գծային ռեգրեսիան լավ է մոդելավորում այն ​​հատկանիշները, որոնք աճում կամ նվազում են հաստատուն արագությամբ: Սա ուսումնասիրվող գործընթացի ամենապարզ մոդելն է։ Այն կառուցված է ըստ հավասարման.

y=mx+b

որտեղ m-ը գծային ռեգրեսիայի թեքության շոշափումն է x առանցքին. b - y առանցքի հետ գծային ռեգրեսիայի հատման կետի կոորդինատը.

2 . Բազմանդամային միտումը օգտակար է բնութագրերի նկարագրության համար, որոնք ունեն մի քանի տարբեր ծայրահեղություններ (բարձր և ցածր): Բազմանանդամի աստիճանի ընտրությունը որոշվում է ուսումնասիրվող հատկանիշի ծայրահեղությունների քանակով։ Այսպիսով, երկրորդ աստիճանի բազմանդամը կարող է լավ նկարագրել մի գործընթաց, որն ունի միայն մեկ առավելագույն կամ նվազագույն; երրորդ աստիճանի բազմանդամ - ոչ ավելի, քան երկու ծայրահեղություն; չորրորդ աստիճանի բազմանդամ - ոչ ավելի, քան երեք ծայրահեղություն և այլն:

Այս դեպքում միտումի գիծը կառուցվում է հետևյալ հավասարման համաձայն.

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

որտեղ c0, c1, c2,... c6 գործակիցները հաստատուններ են, որոնց արժեքները որոշվում են շինարարության ընթացքում:

3 . Լոգարիթմական միտումի գիծը հաջողությամբ օգտագործվում է մոդելավորման բնութագրերում, որոնց արժեքները սկզբում արագ փոխվում են, այնուհետև աստիճանաբար կայունանում են:

y = c ln(x) + b

4 . Էլեկտրաէներգիայի միտման գիծը լավ արդյունքներ է տալիս, եթե ուսումնասիրված կախվածության արժեքները բնութագրվում են աճի տեմպի մշտական ​​փոփոխությամբ: Նման կախվածության օրինակ կարող է ծառայել որպես մեքենայի միատեսակ արագացված շարժման գրաֆիկ: Եթե ​​տվյալների մեջ կան զրոյական կամ բացասական արժեքներ, դուք չեք կարող օգտագործել հոսանքի միտման գիծ:

Այն կառուցված է հետևյալ հավասարման համաձայն.

y = cxb

որտեղ b, c գործակիցները հաստատուններ են:

5 . Էքսպոնենցիալ միտումի գիծը պետք է օգտագործվի, եթե տվյալների փոփոխության տեմպերը շարունակաբար աճում են: Զրո կամ բացասական արժեքներ պարունակող տվյալների համար նման մոտարկումը նույնպես կիրառելի չէ:

Այն կառուցված է հետևյալ հավասարման համաձայն.

y=cebx

որտեղ b, c գործակիցները հաստատուններ են:

Թրենդային գիծ ընտրելիս Excel-ը ավտոմատ կերպով հաշվարկում է R2-ի արժեքը, որը բնութագրում է մոտարկման ճշգրտությունը. որքան R2 արժեքը մոտ է մեկին, այնքան ավելի հուսալի է միտումի գիծը մոտեցնում ուսումնասիրվող գործընթացին: Անհրաժեշտության դեպքում R2-ի արժեքը միշտ կարող է ցուցադրվել դիագրամի վրա:

Որոշվում է բանաձևով.

Տվյալների շարքին միտման գիծ ավելացնելու համար՝

    ակտիվացրեք տվյալների շարքի հիման վրա կառուցված գծապատկերը, այսինքն՝ սեղմեք գծապատկերի տարածքում: Գծապատկերի տարրը կհայտնվի հիմնական ընտրացանկում;

    Այս տարրի վրա սեղմելուց հետո էկրանին կհայտնվի մենյու, որում պետք է ընտրել Add trend line հրամանը։

Նույն գործողությունները հեշտությամբ իրականացվում են, եթե սավառնել եք տվյալների շարքերից մեկին համապատասխանող գրաֆիկի վրա և սեղմել աջը. համատեքստի ընտրացանկում, որը երևում է, ընտրեք Add trend line հրամանը: Էկրանի վրա կհայտնվի Trendline երկխոսության տուփը, երբ բացված է Type ներդիրը (նկ. 1):

Դրանից հետո ձեզ հարկավոր է.

Տիպ ներդիրում ընտրեք պահանջվող միտումի գծի տեսակը (Գծայինը ընտրված է լռելյայն): Polynomial տեսակի համար Degree դաշտում նշեք ընտրված բազմանդամի աստիճանը:

1 . Կառուցված շարքի վրա դաշտը թվարկում է տվյալ գծապատկերի բոլոր տվյալների շարքերը: Տվյալների որոշակի շարքին միտում ավելացնելու համար ընտրեք դրա անունը Կառուցված սերիայի դաշտում:

Անհրաժեշտության դեպքում, անցնելով Պարամետրեր ներդիր (նկ. 2), կարող եք տենդենցի գծի համար սահմանել հետևյալ պարամետրերը.

    փոխեք միտումի գծի անվանումը մոտավոր (հարթեցված) կորի դաշտում:

    Կանխատեսման դաշտում սահմանել ժամանակաշրջանների քանակը (առաջ կամ հետընթաց) կանխատեսման համար.

    Ցուցադրել գծի գծի հավասարումը գծապատկերի տարածքում, որի համար պետք է միացնեք վանդակը՝ ցույց տալ գծապատկերի հավասարումը.

    Ցուցադրել մոտավոր հուսալիության R2 արժեքը դիագրամի տարածքում, որի համար դուք պետք է միացնեք վանդակը դիագրամի վրա դնել մոտարկման հուսալիության արժեքը (R^2).

    սահմանեք տենդենցի գծի հատման կետը Y առանցքի հետ, որի համար պետք է միացնեք կորի հատման կետը Y առանցքի հետ մի կետում.

    սեղմեք OK կոճակը՝ երկխոսության տուփը փակելու համար:

Արդեն կառուցված միտումների գիծը խմբագրելու երեք եղանակ կա.

    օգտագործեք Ընտրված միտումի գիծ հրամանը Ձևաչափի ընտրացանկից՝ միտումի գիծն ընտրելուց հետո;

    համատեքստի ընտրացանկից ընտրեք Format Trendline հրամանը, որը կանչվում է՝ աջ սեղմելով trendline-ի վրա;

    կրկնակի սեղմելով միտումի գծի վրա:

Էկրանի վրա կհայտնվի Format Trendline երկխոսության տուփը (նկ. 3), որը պարունակում է երեք ներդիր՝ View, Type, Parameters, և վերջին երկուսի բովանդակությունը լիովին համընկնում է Trendline երկխոսության տուփի նմանատիպ ներդիրների հետ (նկ. 1-2): ) Դիտել ներդիրում կարող եք սահմանել գծի տեսակը, դրա գույնը և հաստությունը:

Արդեն կառուցված միտումների գիծը ջնջելու համար ընտրեք ջնջվող միտումի գիծը և սեղմեք Ջնջել ստեղնը:

Դիտարկվող ռեգրեսիոն վերլուծության գործիքի առավելություններն են.

    գծապատկերների վրա միտումի գիծ գծելու հարաբերական հեշտությունը՝ առանց դրա համար տվյալների աղյուսակ ստեղծելու.

    առաջարկվող միտումների գծերի տեսակների բավականին լայն ցանկ, և այս ցանկը ներառում է ռեգրեսիայի ամենատարածված տեսակները.

    ուսումնասիրվող գործընթացի վարքագիծը կանխատեսելու հնարավորություն կամայական (առողջ բանականության սահմաններում) քայլերի առաջ, ինչպես նաև ետ.

    միտումի գծի հավասարումը վերլուծական ձևով ստանալու հնարավորությունը.

    անհրաժեշտության դեպքում մոտարկման հավաստիության գնահատական ​​ստանալու հնարավորությունը։

Թերությունները ներառում են հետևյալ կետերը.

    Միտման գծի կառուցումն իրականացվում է միայն այն դեպքում, եթե կա մի շարք տվյալների վրա կառուցված գծապատկեր.

    Ուսումնասիրվող բնութագրի համար տվյալների շարքերի ստեղծման գործընթացը, որը հիմնված է դրա համար ձեռք բերված միտումի գծի հավասարումների վրա, որոշ չափով խառնաշփոթ է. ցանկալի ռեգրեսիոն հավասարումները թարմացվում են սկզբնական տվյալների շարքի արժեքների յուրաքանչյուր փոփոխության հետ, բայց միայն գծապատկերի տարածքում: , մինչդեռ հին գծային հավասարման միտումի հիման վրա ձևավորված տվյալների շարքը մնում է անփոփոխ.

    PivotChart հաշվետվություններում, երբ փոխում եք գծապատկերի տեսքը կամ առնչվող PivotTable հաշվետվությունը, գոյություն ունեցող միտումները չեն պահպանվում, ինչը նշանակում է, որ նախքան միտումների գծերը գծելը կամ առանցքային գծապատկերի հաշվետվությունը ձևավորելը, դուք պետք է համոզվեք, որ զեկույցի դասավորությունը համապատասխանում է ձեր պահանջներին:

Միտման գծերը կարող են ավելացվել գծապատկերների վրա ներկայացված տվյալների շարքերին, ինչպիսիք են գրաֆիկը, հիստոգրամը, հարթ չնորմալացված տարածքի գծապատկերները, բարակ, ցրումը, փուչիկների և ֆոնդային գծապատկերները:

Դուք չեք կարող միտումներ ավելացնել 3-D, Standard, Radar, Pie և Donut գծապատկերների տվյալների շարքին:

Օգտագործելով ներկառուցված Excel գործառույթներ

Excel-ը նաև տրամադրում է ռեգրեսիայի վերլուծության գործիք՝ գծապատկերի տարածքից դուրս միտումների գծերի գծագրման համար: Այս նպատակով կարող են օգտագործվել վիճակագրական աշխատանքային թերթիկի մի շարք ֆունկցիաներ, սակայն դրանք բոլորը թույլ են տալիս կառուցել միայն գծային կամ էքսպոնենցիալ ռեգրեսիաներ։

Excel-ն ունի գծային ռեգրեսիա կառուցելու մի քանի գործառույթ, մասնավորապես.

    TREND;

  • ԼԱՆՔ եւ ԿՏՐՈՒՄ.

Ինչպես նաև էքսպոնենցիալ միտումի գիծ կառուցելու մի քանի գործառույթ, մասնավորապես.

    LGRFPմոտ.

Պետք է նշել, որ TREND և GROWTH ֆունկցիաների օգտագործմամբ ռեգրեսիաների կառուցման տեխնիկան գործնականում նույնն է: Նույնը կարելի է ասել LINEST և LGRFPRIBL ֆունկցիաների զույգի մասին։ Այս չորս գործառույթների համար արժեքների աղյուսակ ստեղծելիս օգտագործվում են Excel-ի այնպիսի գործառույթներ, ինչպիսիք են զանգվածի բանաձևերը, ինչը որոշակիորեն խաթարում է ռեգրեսիաների կառուցման գործընթացը: Մենք նաև նշում ենք, որ գծային ռեգրեսիայի կառուցումը, մեր կարծիքով, ամենահեշտն է իրականացնել SLOPE և INTERCEPT ֆունկցիաների միջոցով, որտեղ դրանցից առաջինը որոշում է գծային ռեգրեսիայի թեքությունը, իսկ երկրորդը որոշում է ռեգրեսիայի կողմից կտրված հատվածը: y առանցքի վրա:

Ռեգրեսիոն վերլուծության համար ներկառուցված գործառույթների գործիքի առավելություններն են.

    ուսումնասիրվող բնութագրիչի տվյալների շարքերի ձևավորման միևնույն տիպի բավականին պարզ գործընթաց բոլոր ներկառուցված վիճակագրական գործառույթների համար, որոնք սահմանում են միտումների գծեր.

    գեներացված տվյալների շարքի հիման վրա միտումների գծերի կառուցման ստանդարտ տեխնիկա.

    ուսումնասիրվող գործընթացի վարքագիծը կանխատեսելու ունակություն՝ առաջ կամ հետ գնալու անհրաժեշտ քանակի քայլերի համար:

Իսկ թերությունները ներառում են այն փաստը, որ Excel-ը չունի ներկառուցված գործառույթներ այլ (բացառությամբ գծային և էքսպոնենցիալ) տեսակի միտումների գծերի ստեղծման համար։ Այս հանգամանքը հաճախ թույլ չի տալիս ընտրել ուսումնասիրվող գործընթացի բավական ճշգրիտ մոդել, ինչպես նաև ստանալ իրականությանը մոտ կանխատեսումներ։ Բացի այդ, TREND և GROW ֆունկցիաները օգտագործելիս միտումների գծերի հավասարումները հայտնի չեն:

Հարկ է նշել, որ հեղինակները հոդվածի նպատակ չեն դրել ներկայացնել ռեգրեսիոն վերլուծության ընթացքը տարբեր աստիճանի ամբողջականությամբ։ Նրա հիմնական խնդիրն է ցույց տալ Excel փաթեթի հնարավորությունները մոտավոր խնդիրների լուծման մեջ՝ օգտագործելով կոնկրետ օրինակներ. ցույց տալ, թե ինչ արդյունավետ գործիքներ ունի Excel-ը ռեգրեսիաներ կառուցելու և կանխատեսելու համար. ցույց է տալիս, թե որքան համեմատաբար հեշտ է նման խնդիրները լուծել նույնիսկ այն օգտվողը, ով չունի ռեգրեսիոն վերլուծության խորը գիտելիքներ:

Հատուկ խնդիրների լուծման օրինակներ

Դիտարկենք հատուկ խնդիրների լուծումը՝ օգտագործելով Excel փաթեթի թվարկված գործիքները:

Առաջադրանք 1

1995-2002 թվականների ավտոտրանսպորտային ձեռնարկության շահույթի վերաբերյալ տվյալների աղյուսակով. դուք պետք է անեք հետևյալը.

    Կառուցեք գծապատկեր:

    Գծապատկերում ավելացրեք գծային և բազմանդամ (քառանկյուն և խորանարդ) միտումների գծեր:

    Օգտագործելով միտումների գծի հավասարումները, ստացեք աղյուսակային տվյալներ ձեռնարկության շահույթի վերաբերյալ 1995-2004 թվականների յուրաքանչյուր միտումի գծի համար:

    Կատարեք ձեռնարկության շահույթի կանխատեսում 2003 և 2004 թվականների համար:

Խնդրի լուծումը

    Excel-ի աշխատաթերթի A4:C11 բջիջների տիրույթում մենք մուտքագրում ենք նկ. 4.

    Ընտրելով B4:C11 բջիջների տիրույթը՝ մենք կառուցում ենք գծապատկեր:

    Մենք ակտիվացնում ենք կառուցված գծապատկերը և, օգտագործելով վերը նկարագրված մեթոդը, Trend Line երկխոսության վանդակում տենդենցի գծի տեսակն ընտրելուց հետո (տե՛ս Նկար 1), մենք հերթափոխով ավելացնում ենք գծային, քառակուսի և խորանարդ միտումների գծեր գծապատկերում: Նույն երկխոսության վանդակում բացեք Պարամետրեր ներդիրը (տես նկ. 2), մոտավոր (հարթեցված) կորի դաշտում մուտքագրեք ավելացվող միտումի անվանումը և «Կանխատեսում առաջ՝ ժամանակաշրջանների համար» դաշտում սահմանեք: արժեքը 2, քանի որ նախատեսվում է շահույթի կանխատեսում կատարել առաջիկա երկու տարվա համար։ Ռեգրեսիոն հավասարումը և մոտավոր հուսալիության R2 արժեքը դիագրամների տարածքում ցուցադրելու համար միացրեք վանդակները Ցույց տալ հավասարումը էկրանին և մոտավոր հուսալիության արժեքը (R^2) դնել դիագրամի վրա: Ավելի լավ տեսողական ընկալման համար մենք փոխում ենք գծագրված միտումների գծերի տեսակը, գույնը և հաստությունը, ինչի համար օգտագործում ենք Trend Line Format երկխոսության տուփի View ներդիրը (տես նկ. 3): Ստացված գծապատկերը՝ ավելացված միտումների գծերով, ներկայացված է նկ. 5.

    Ձեռք բերել աղյուսակային տվյալներ ձեռնարկության շահույթի վերաբերյալ յուրաքանչյուր միտումի գծի համար 1995-2004 թթ. Եկեք օգտագործենք թրենդային գծերի հավասարումները, որոնք ներկայացված են նկ. 5. Դա անելու համար D3:F3 տիրույթի բջիջներում մուտքագրեք տեքստային տեղեկատվություն ընտրված միտումի գծի տեսակի մասին՝ Գծային միտում, Քառակուսի միտում, Խորանարդ միտում: Հաջորդը, մուտքագրեք գծային ռեգրեսիայի բանաձևը D4 բջիջում և, օգտագործելով լրացման նշիչը, պատճենեք այս բանաձևը D5:D13 բջիջների տիրույթի հարաբերական հղումներով: Հարկ է նշել, որ D4:D13 բջիջների տիրույթից գծային ռեգրեսիայի բանաձևով յուրաքանչյուր բջիջ որպես արգումենտ ունի համապատասխան բջիջ A4:A13 միջակայքից: Նմանապես, քառակուսային ռեգրեսիայի համար լրացվում է E4:E13 բջիջների միջակայքը, իսկ խորանարդ ռեգրեսիայի դեպքում՝ F4:F13 բջիջների միջակայքը: Այսպիսով, ձեռնարկության շահույթի կանխատեսում է արվել 2003 և 2004 թվականների համար։ երեք միտումներով. Ստացված արժեքների աղյուսակը ներկայացված է նկ. 6.

Առաջադրանք 2

    Կառուցեք գծապատկեր:

    Գծապատկերում ավելացրեք լոգարիթմական, էքսպոնենցիալ և էքսպոնենցիալ միտումների գծեր:

    Ստացված միտման գծերի հավասարումները, ինչպես նաև դրանցից յուրաքանչյուրի համար մոտավոր հուսալիության R2 արժեքները:

    Օգտագործելով միտումների գծի հավասարումները, ստացեք աղյուսակային տվյալներ ձեռնարկության շահույթի վերաբերյալ 1995-2002 թվականների յուրաքանչյուր միտումի գծի համար:

    Կատարեք բիզնեսի շահույթի կանխատեսում 2003 և 2004 թվականների համար՝ օգտագործելով այս միտումների գծերը:

Խնդրի լուծումը

Հետևելով 1-ին խնդրի լուծմանը տրված մեթոդաբանությանը, մենք ստանում ենք դիագրամ՝ ավելացված լոգարիթմական, էքսպոնենցիալ և էքսպոնենցիալ միտումների գծերով (նկ. 7): Այնուհետև, օգտագործելով ձեռք բերված միտումների գծի հավասարումները, մենք լրացնում ենք ձեռնարկության շահույթի արժեքների աղյուսակը, ներառյալ 2003 և 2004 թվականների կանխատեսված արժեքները: (նկ. 8):

Նկ. 5 և նկ. երևում է, որ լոգարիթմական միտումով մոդելը համապատասխանում է մոտարկման հուսալիության ամենացածր արժեքին.

R2 = 0,8659

R2-ի ամենաբարձր արժեքները համապատասխանում են բազմանդամ միտում ունեցող մոդելներին՝ քառակուսի (R2 = 0,9263) և խորանարդ (R2 = 0,933):

Առաջադրանք 3

1-ին առաջադրանքում տրված 1995-2002 թվականների ավտոտրանսպորտային ձեռնարկության շահույթի վերաբերյալ տվյալների աղյուսակով դուք պետք է կատարեք հետևյալ քայլերը.

    Ստացեք տվյալների շարքեր գծային և էքսպոնենցիալ միտումների համար՝ օգտագործելով TREND և GROW ֆունկցիաները:

    Օգտագործելով TREND և GROWTH ֆունկցիաները, կատարեք ձեռնարկության շահույթի կանխատեսում 2003 և 2004 թվականների համար:

    Սկզբնական տվյալների և ստացված տվյալների շարքի համար կառուցեք դիագրամ:

Խնդրի լուծումը

Եկեք օգտագործենք առաջադրանքի 1-ին աշխատանքային թերթիկը (տես նկ. 4): Սկսենք TREND ֆունկցիայից.

    ընտրեք D4:D11 բջիջների շրջանակը, որը պետք է լրացվի TREND ֆունկցիայի արժեքներով, որոնք համապատասխանում են ձեռնարկության շահույթի մասին հայտնի տվյալներին.

    Զանգահարեք Function հրամանը Insert ցանկից: «Function Wizard» երկխոսության դաշտում, որը երևում է, ընտրեք «TREND» գործառույթը «Վիճակագրական» կատեգորիայից և սեղմեք «OK» կոճակը: Նույն գործողությունը կարելի է կատարել՝ սեղմելով ստանդարտ գործիքագոտու կոճակը (Insert function):

    Ֆունկցիայի փաստարկներ երկխոսության վանդակում, որը հայտնվում է, մուտքագրեք C4:C11 բջիջների տիրույթը Known_values_y դաշտում; Known_values_x դաշտում - B4:B11 բջիջների տիրույթը;

    մուտքագրված բանաձևը զանգվածի բանաձև դարձնելու համար օգտագործեք + + ստեղնաշարի համակցությունը:

Բանաձևը, որը մենք մուտքագրել ենք բանաձևերի տողում, կունենա հետևյալ տեսքը՝ =(TREND(C4:C11;B4:B11)):

Արդյունքում D4:D11 բջիջների տիրույթը լրացվում է TREND ֆունկցիայի համապատասխան արժեքներով (նկ. 9):

Կատարել ընկերության շահույթի կանխատեսում 2003 եւ 2004 թթ. անհրաժեշտ:

    ընտրեք D12:D13 բջիջների տիրույթը, որտեղ մուտքագրվելու են TREND ֆունկցիայի կողմից կանխատեսված արժեքները:

    կանչեք TREND ֆունկցիան և երևացող Function Arguments երկխոսության վանդակում մուտքագրեք Known_values_y դաշտում՝ C4:C11 բջիջների տիրույթը; Known_values_x դաշտում - B4:B11 բջիջների տիրույթը; իսկ New_values_x դաշտում՝ B12:B13 բջիջների տիրույթը:

    այս բանաձևը վերածեք զանգվածի բանաձևի՝ օգտագործելով ստեղնաշարի դյուրանցումը Ctrl + Shift + Enter:

    Մուտքագրված բանաձևը կունենա հետևյալ տեսքը. 9):

Նմանապես, տվյալների շարքը լրացվում է օգտագործելով GROWTH ֆունկցիան, որն օգտագործվում է ոչ գծային կախվածությունների վերլուծության մեջ և աշխատում է ճիշտ այնպես, ինչպես իր գծային TREND-ը:

Նկար 10-ը ցույց է տալիս աղյուսակը բանաձևի ցուցադրման ռեժիմում:

Սկզբնական տվյալների և ստացված տվյալների շարքի համար նկ. տասնմեկ.

Առաջադրանք 4

Ընթացիկ ամսվա 1-ից 11-ն ընկած ժամանակահատվածում ավտոտրանսպորտային ձեռնարկության դիսպետչերական ծառայության կողմից ծառայությունների հայտերի ստացման վերաբերյալ տվյալների աղյուսակով պետք է կատարվեն հետևյալ գործողությունները.

    Ստացեք տվյալների շարք գծային ռեգրեսիայի համար՝ օգտագործելով SLOPE և INTERCEPT ֆունկցիաները; օգտագործելով LINEST ֆունկցիան:

    Ստացեք տվյալների շարք էքսպոնենցիալ ռեգրեսիայի համար՝ օգտագործելով LYFFPRIB ֆունկցիան:

    Օգտագործելով վերը նշված գործառույթները, կատարեք կանխատեսում ընթացիկ ամսվա 12-ից 14-ը ընկած ժամանակահատվածում դիսպետչերական ծառայության դիմումների ստացման վերաբերյալ:

    Բնօրինակ և ստացված տվյալների շարքի համար կառուցեք դիագրամ:

Խնդրի լուծումը

Նկատի ունեցեք, որ, ի տարբերություն TREND և GROW ֆունկցիաների, վերը թվարկված գործառույթներից և ոչ մեկը (SLOPE, INTERCEPTION, LINEST, LGRFPRIB) ռեգրեսիա չէ: Այս գործառույթները խաղում են միայն օժանդակ դեր՝ որոշելով ռեգրեսիայի անհրաժեշտ պարամետրերը։

SLOPE, INTERCEPT, LINEST, LGRFPRIB ֆունկցիաների օգտագործմամբ կառուցված գծային և էքսպոնենցիալ ռեգրեսիաների համար դրանց հավասարումների տեսքը միշտ հայտնի է՝ ի տարբերություն TREND և GROWTH ֆունկցիաներին համապատասխանող գծային և էքսպոնենցիալ ռեգրեսիաների։

1 . Եկեք կառուցենք գծային ռեգրեսիա, որն ունի հավասարում.

y=mx+b

օգտագործելով SLOPE և INTERCEPT ֆունկցիաները՝ m ռեգրեսիայի թեքությունը որոշվում է SLOPE ֆունկցիայով, իսկ b հաստատուն անդամը՝ INTERCEPT ֆունկցիայով:

Դա անելու համար մենք կատարում ենք հետևյալ գործողությունները.

    մուտքագրեք աղբյուրի աղյուսակը A4:B14 բջիջների միջակայքում;

    m պարամետրի արժեքը կորոշվի C19 բջիջում: Վիճակագրական կատեգորիայից ընտրել Slope ֆունկցիան; մուտքագրեք B4:B14 բջիջների միջակայքը հայտնի_արժեքներ_y դաշտում, իսկ A4:A14 բջիջների տիրույթը՝ հայտնի_արժեք_x դաշտում: Բանաձևը մուտքագրվելու է C19 բջիջ. =SLOPE(B4:B14;A4:A14);

    օգտագործելով նմանատիպ մեթոդ, որոշվում է b պարամետրի արժեքը D19 բջիջում: Եվ դրա բովանդակությունը կունենա հետևյալ տեսքը՝ = INTERCEPT(B4:B14;A4:A14): Այսպիսով, m և b պարամետրերի արժեքները, որոնք անհրաժեշտ են գծային ռեգրեսիա կառուցելու համար, կպահվեն համապատասխանաբար C19, D19 բջիջներում;

    այնուհետև C4 բջիջում մուտքագրում ենք գծային ռեգրեսիայի բանաձևը՝ = $ C * A4 + $ D: Այս բանաձևում C19 և D19 բջիջները գրված են բացարձակ հղումներով (բջջի հասցեն չպետք է փոխվի հնարավոր պատճենմամբ): $ բացարձակ հղման նշանը կարելի է մուտքագրել կամ ստեղնաշարից կամ օգտագործելով F4 ստեղնը՝ կուրսորը բջջային հասցեի վրա դնելուց հետո: Օգտագործելով լրացման բռնակը, պատճենեք այս բանաձևը C4:C17 բջիջների տիրույթում: Մենք ստանում ենք ցանկալի տվյալների շարքը (նկ. 12): Հաշվի առնելով այն հանգամանքը, որ հարցումների թիվը ամբողջ թիվ է, դուք պետք է թվի ձևաչափը սահմանեք «Բջջային ձևաչափ» պատուհանի «Թիվ» ներդիրում՝ տասնորդական վայրերի թվով 0:

2 . Հիմա եկեք կառուցենք գծային ռեգրեսիա, որը տրված է հավասարմամբ.

y=mx+b

օգտագործելով LINEST ֆունկցիան:

Սրա համար:

    մուտքագրեք LINEST ֆունկցիան որպես զանգվածի բանաձև C20:D20: =(LINEST(B4:B14;A4:A14) բջիջների տիրույթում: Արդյունքում մենք ստանում ենք m պարամետրի արժեքը C20 բջիջում, իսկ b պարամետրի արժեքը D20 բջիջում;

    մուտքագրեք բանաձևը D4 բջիջում՝ =$C*A4+$D;

    պատճենեք այս բանաձևը՝ օգտագործելով լրացման նշիչը D4:D17 բջիջների տիրույթում և ստացեք ցանկալի տվյալների շարքը:

3 . Մենք կառուցում ենք էքսպոնենցիալ ռեգրեսիա, որն ունի հավասարում.

LGRFPRIBL ֆունկցիայի օգնությամբ այն կատարվում է նույն կերպ.

    C21:D21 բջիջների միջակայքում մուտքագրեք LGRFPRIBL ֆունկցիան որպես զանգվածի բանաձև՝ =( LGRFPRIBL (B4:B14;A4:A14)): Այս դեպքում m պարամետրի արժեքը կորոշվի C21 բջիջում, իսկ b պարամետրի արժեքը՝ D21 բջիջում;

    բանաձևը մուտքագրվում է E4 բջիջում՝ =$D*$C^A4;

    օգտագործելով լրացման նշիչը, այս բանաձևը պատճենվում է E4:E17 բջիջների տիրույթում, որտեղ տեղակայվելու է էքսպոնենցիալ ռեգրեսիայի տվյալների շարքը (տես նկ. 12):

Նկ. 13-ը ցույց է տալիս աղյուսակ, որտեղ մենք կարող ենք տեսնել այն գործառույթները, որոնք մենք օգտագործում ենք անհրաժեշտ բջիջների միջակայքերով, ինչպես նաև բանաձևեր:

Արժեք Ռ 2 կանչեց որոշման գործակիցը.

Ռեգրեսիոն կախվածության կառուցման խնդիրն է գտնել մոդելի m գործակիցների վեկտորը (1), որի դեպքում R գործակիցը վերցնում է առավելագույն արժեքը։

R-ի նշանակությունը գնահատելու համար օգտագործվում է Ֆիշերի F-թեստը, որը հաշվարկվում է բանաձևով

Որտեղ n- նմուշի չափը (փորձերի քանակը);

k-ն մոդելի գործակիցների թիվն է:

Եթե ​​F-ը գերազանցում է տվյալների համար որոշ կրիտիկական արժեք nԵվ կև ընդունված վստահության մակարդակը, ապա R-ի արժեքը համարվում է նշանակալի: F-ի կրիտիկական արժեքների աղյուսակները տրված են մաթեմատիկական վիճակագրության տեղեկատու գրքերում:

Այսպիսով, R-ի նշանակությունը որոշվում է ոչ միայն նրա արժեքով, այլ նաև փորձերի քանակի և մոդելի գործակիցների (պարամետրերի) քանակի հարաբերակցությամբ։ Իրոք, n=2-ի հարաբերակցությունը պարզ գծային մոդելի համար 1 է (հարթության 2 կետերի միջով միշտ կարող եք մեկ ուղիղ գիծ գծել): Այնուամենայնիվ, եթե փորձարարական տվյալները պատահական փոփոխականներ են, R-ի նման արժեքին պետք է մեծ զգուշությամբ վստահել: Սովորաբար, զգալի R և հուսալի ռեգրեսիա ստանալու համար այն նպատակաուղղված է ապահովելու, որ փորձերի թիվը զգալիորեն գերազանցի մոդելային գործակիցների թիվը (n>k):

Գծային ռեգրեսիայի մոդել կառուցելու համար դուք պետք է.

1) պատրաստել փորձնական տվյալները պարունակող n տողերի և m սյունակների ցուցակ (ելքային արժեքը պարունակող սյունակ). Յպետք է լինի առաջինը կամ վերջինը ցանկում); օրինակ՝ վերցնենք նախորդ առաջադրանքի տվյալները՝ ավելացնելով «ժամանակահատվածի համար» կոչվող սյունակը՝ համարակալելով 1-ից 12 պարբերաշրջանների համարները (սրանք կլինեն արժեքները. X)

2) անցեք մենյու Տվյալների/Տվյալների վերլուծություն/Ռեգրեսիա

Եթե ​​«Գործիքներ» ցանկի «Տվյալների վերլուծություն» կետը բացակայում է, ապա դուք պետք է գնաք նույն ցանկի «Հավելումներ» կետը և նշեք «Վերլուծական փաթեթ» վանդակը:

3) «Regression» երկխոսության վանդակում սահմանեք.

մուտքագրման միջակայքը Y;

մուտքագրման միջակայք X;

ելքային ինտերվալ - այն միջակայքի վերին ձախ բջիջը, որում կտեղադրվեն հաշվարկի արդյունքները (խորհուրդ է տրվում տեղադրել այն նոր աշխատաթերթում);

4) սեղմեք «Ok» և վերլուծեք արդյունքները: