คุณสมบัติการดำเนินการเพื่อคำนวณคุณลักษณะเชิงปริมาณของตัวแปรสุ่ม ลักษณะพื้นฐานของตัวแปรสุ่ม การกระจายตัวและส่วนเบี่ยงเบนมาตรฐาน

วัตถุประสงค์ของการวิเคราะห์ความสัมพันธ์คือการระบุการประมาณความแข็งแกร่งของการเชื่อมต่อระหว่างตัวแปรสุ่ม (คุณสมบัติ) ที่กำหนดลักษณะของกระบวนการจริงบางอย่าง
ปัญหาการวิเคราะห์ความสัมพันธ์:
ก) การวัดระดับการเชื่อมโยงกัน (ความใกล้ชิด ความแรง ความรุนแรง ความรุนแรง) ของปรากฏการณ์สองปรากฏการณ์ขึ้นไป
b) การเลือกปัจจัยที่มีผลกระทบที่สำคัญที่สุดต่อคุณลักษณะผลลัพธ์ โดยพิจารณาจากการวัดระดับความเชื่อมโยงระหว่างปรากฏการณ์ ปัจจัยที่มีนัยสำคัญในด้านนี้จะถูกนำไปใช้เพิ่มเติมในการวิเคราะห์การถดถอย
c) การตรวจหาความสัมพันธ์เชิงสาเหตุที่ไม่ทราบสาเหตุ

รูปแบบการแสดงความสัมพันธ์มีความหลากหลายมาก ประเภทที่พบบ่อยที่สุดคือประเภทการใช้งาน (สมบูรณ์) และ การเชื่อมต่อสหสัมพันธ์ (ไม่สมบูรณ์).
ความสัมพันธ์แสดงให้เห็นโดยเฉลี่ยสำหรับการสังเกตมวลเมื่อค่าที่กำหนดของตัวแปรตามสอดคล้องกับชุดค่าความน่าจะเป็นบางชุดของตัวแปรอิสระ ความสัมพันธ์เรียกว่าความสัมพันธ์ถ้าแต่ละค่าของคุณลักษณะตัวประกอบสอดคล้องกับค่าที่ไม่ใช่ค่าสุ่มที่กำหนดไว้อย่างดีของคุณลักษณะผลลัพธ์
การแสดงตารางความสัมพันธ์ด้วยภาพคือฟิลด์ความสัมพันธ์ เป็นกราฟที่มีค่า X ถูกพล็อตบนแกน Abscissa ค่า Y ถูกพล็อตบนแกนกำหนดและการรวมกันของ X และ Y จะแสดงด้วยจุด โดยตำแหน่งของจุดเราสามารถตัดสินการมีอยู่ได้ ของการเชื่อมต่อ
ตัวบ่งชี้ความใกล้ชิดของการเชื่อมต่อทำให้สามารถระบุลักษณะการพึ่งพาความแปรผันของลักษณะผลลัพธ์จากการแปรผันของลักษณะปัจจัยได้
ตัวบ่งชี้ระดับความแออัดขั้นสูงยิ่งขึ้น การเชื่อมต่อความสัมพันธ์เป็น สัมประสิทธิ์สหสัมพันธ์เชิงเส้น. เมื่อคำนวณตัวบ่งชี้นี้ ไม่เพียงแต่คำนึงถึงการเบี่ยงเบนของค่าแต่ละค่าของคุณลักษณะจากค่าเฉลี่ยเท่านั้น แต่ยังคำนึงถึงขนาดของการเบี่ยงเบนเหล่านี้ด้วย

คำถามสำคัญของหัวข้อนี้คือสมการของความสัมพันธ์การถดถอยระหว่างคุณลักษณะที่มีประสิทธิผลกับตัวแปรอธิบาย วิธีกำลังสองน้อยที่สุดสำหรับการประมาณค่าพารามิเตอร์ของแบบจำลองการถดถอย การวิเคราะห์คุณภาพของสมการการถดถอยที่เกิดขึ้น การสร้างช่วงความเชื่อมั่นสำหรับการทำนาย ค่าคุณลักษณะที่มีประสิทธิผลโดยใช้สมการถดถอย

ตัวอย่างที่ 2


ระบบสมการปกติ
n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
สำหรับข้อมูลของเรา ระบบสมการจะมีรูปแบบ
30a + 5763 ข = 21460
5763 ก + 1200261 ข = 3800360
จากสมการแรกที่เราแสดงออก และแทนลงในสมการที่สอง:
เราได้ b = -3.46, a = 1379.33
สมการถดถอย:
y = -3.46 x + 1379.33

2. การคำนวณพารามิเตอร์สมการถดถอย
หมายถึงตัวอย่าง.



ผลต่างตัวอย่าง:


ส่วนเบี่ยงเบนมาตรฐาน


1.1. ค่าสัมประสิทธิ์สหสัมพันธ์
ความแปรปรวนร่วม.

เราคำนวณตัวบ่งชี้ความใกล้ชิดของการเชื่อมต่อ ตัวบ่งชี้นี้คือค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นตัวอย่างซึ่งคำนวณโดยสูตร:

ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นรับค่าตั้งแต่ –1 ถึง +1
การเชื่อมต่อระหว่างคุณลักษณะอาจอ่อนแอและแข็งแกร่ง (ปิด) เกณฑ์ของพวกเขาได้รับการประเมินในระดับ Chaddock:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
ในตัวอย่างของเรา ความสัมพันธ์ระหว่างคุณลักษณะ Y และปัจจัย X มีค่าสูงและผกผัน
นอกจากนี้ ค่าสัมประสิทธิ์สหสัมพันธ์คู่เชิงเส้นสามารถหาได้จากค่าสัมประสิทธิ์การถดถอย b:

1.2. สมการถดถอย(การประมาณสมการถดถอย)

สมการการถดถอยเชิงเส้นคือ y = -3.46 x + 1379.33

ค่าสัมประสิทธิ์ b = -3.46 แสดงการเปลี่ยนแปลงโดยเฉลี่ยในตัวบ่งชี้ประสิทธิภาพ (ในหน่วยการวัด y) โดยมีค่าเพิ่มขึ้นหรือลดลงของปัจจัย x ต่อหน่วยการวัด ในตัวอย่างนี้ เมื่อเพิ่มขึ้น 1 หน่วย y จะลดลง -3.46 โดยเฉลี่ย
ค่าสัมประสิทธิ์ a = 1379.33 จะแสดงระดับที่คาดการณ์ไว้ของ y อย่างเป็นทางการ แต่เฉพาะในกรณีที่ x = 0 ใกล้เคียงกับค่าตัวอย่างเท่านั้น
แต่ถ้า x=0 อยู่ไกลจากค่าตัวอย่างของ x การตีความตามตัวอักษรอาจนำไปสู่ผลลัพธ์ที่ไม่ถูกต้อง และแม้ว่าเส้นการถดถอยจะอธิบายค่าตัวอย่างที่สังเกตได้ค่อนข้างแม่นยำ แต่ก็ไม่มีการรับประกันว่าสิ่งนี้จะเช่นกัน จะเป็นกรณีเมื่อคาดคะเนทางซ้ายหรือทางขวา
ด้วยการแทนที่ค่า x ที่เหมาะสมลงในสมการการถดถอย เราสามารถกำหนดค่าที่จัดตำแหน่ง (คาดการณ์) ของตัวบ่งชี้ประสิทธิภาพ y(x) สำหรับการสังเกตแต่ละครั้ง
ความสัมพันธ์ระหว่าง y และ x กำหนดสัญลักษณ์ของสัมประสิทธิ์การถดถอย b (ถ้า > 0 - ความสัมพันธ์โดยตรง มิฉะนั้น - ผกผัน) ในตัวอย่างของเรา การเชื่อมต่อเป็นแบบย้อนกลับ
1.3. ค่าสัมประสิทธิ์ความยืดหยุ่น
ไม่แนะนำให้ใช้สัมประสิทธิ์การถดถอย (ตัวอย่าง b) เพื่อประเมินอิทธิพลของปัจจัยที่มีต่อคุณลักษณะผลลัพธ์โดยตรง หากมีความแตกต่างในหน่วยการวัดของตัวบ่งชี้ผลลัพธ์ y และคุณลักษณะของปัจจัย x
เพื่อวัตถุประสงค์เหล่านี้ จะมีการคำนวณค่าสัมประสิทธิ์ความยืดหยุ่นและค่าสัมประสิทธิ์เบต้า
ค่าสัมประสิทธิ์ความยืดหยุ่นโดยเฉลี่ย E แสดงด้วยเปอร์เซ็นต์โดยเฉลี่ยที่ผลลัพธ์จะเปลี่ยนแปลงโดยรวม ที่จากค่าเฉลี่ยเมื่อปัจจัยเปลี่ยนแปลง x 1% ของมูลค่าเฉลี่ย
ค่าสัมประสิทธิ์ความยืดหยุ่นพบได้จากสูตร:


ค่าสัมประสิทธิ์ความยืดหยุ่นน้อยกว่า 1 ดังนั้น หาก X เปลี่ยนแปลง 1% Y จะเปลี่ยนน้อยกว่า 1% กล่าวอีกนัยหนึ่ง อิทธิพลของ X ต่อ Y ไม่มีนัยสำคัญ
ค่าสัมประสิทธิ์เบต้าแสดงโดยส่วนใดของค่าของส่วนเบี่ยงเบนมาตรฐาน ค่าเฉลี่ยของคุณลักษณะผลลัพธ์จะเปลี่ยนไปเมื่อลักษณะปัจจัยเปลี่ยนแปลงตามค่าของส่วนเบี่ยงเบนมาตรฐาน โดยค่าของตัวแปรอิสระที่เหลืออยู่คงที่ที่ระดับคงที่:

เหล่านั้น. การเพิ่มขึ้นของ x ด้วยค่าเบี่ยงเบนมาตรฐาน S x จะทำให้ค่าเฉลี่ยของ Y ลดลง 0.74 ส่วนเบี่ยงเบนมาตรฐาน S y
1.4. ข้อผิดพลาดโดยประมาณ
ให้เราประเมินคุณภาพของสมการถดถอยโดยใช้ข้อผิดพลาดของการประมาณค่าสัมบูรณ์ ข้อผิดพลาดในการประมาณเฉลี่ย - ส่วนเบี่ยงเบนเฉลี่ยของค่าที่คำนวณจากค่าจริง:


เนื่องจากข้อผิดพลาดน้อยกว่า 15% สมการนี้จึงสามารถใช้เป็นการถดถอยได้
การวิเคราะห์ความแปรปรวน
วัตถุประสงค์ของการวิเคราะห์ความแปรปรวนคือเพื่อวิเคราะห์ความแปรปรวนของตัวแปรตาม:
∑(y i - y cp) 2 = ∑(y(x) - y cp) 2 + ∑(y - y(x)) 2
ที่ไหน
∑(y i - y cp) 2 - ผลรวมของการเบี่ยงเบนกำลังสอง
∑(y(x) - y cp) 2 - ผลรวมของการเบี่ยงเบนกำลังสองเนื่องจากการถดถอย (“ อธิบาย” หรือ“ แฟกทอเรียล”);
∑(y - y(x)) 2 - ผลรวมที่เหลือของการเบี่ยงเบนกำลังสอง
ความสัมพันธ์สหสัมพันธ์เชิงทฤษฎีสำหรับการเชื่อมต่อเชิงเส้นเท่ากับค่าสัมประสิทธิ์สหสัมพันธ์ r xy .
สำหรับการพึ่งพารูปแบบใด ๆ ความแน่นของการเชื่อมต่อจะถูกกำหนดโดยใช้ สัมประสิทธิ์สหสัมพันธ์พหุคูณ:

สัมประสิทธิ์นี้เป็นค่าสากล เนื่องจากสะท้อนถึงความใกล้ชิดของความสัมพันธ์และความแม่นยำของแบบจำลอง และยังใช้สำหรับการเชื่อมต่อระหว่างตัวแปรทุกรูปแบบอีกด้วย เมื่อสร้างแบบจำลองความสัมพันธ์แบบปัจจัยเดียว ค่าสัมประสิทธิ์สหสัมพันธ์พหุคูณจะเท่ากับค่าสัมประสิทธิ์สหสัมพันธ์คู่ r xy
1.6. ค่าสัมประสิทธิ์การตัดสินใจ
กำลังสองของค่าสัมประสิทธิ์สหสัมพันธ์ (หลายรายการ) เรียกว่าค่าสัมประสิทธิ์การกำหนด ซึ่งแสดงสัดส่วนของการแปรผันในคุณลักษณะผลลัพธ์ที่อธิบายโดยการแปรผันในคุณลักษณะตัวประกอบ
ส่วนใหญ่แล้วเมื่อตีความค่าสัมประสิทธิ์การตัดสินใจจะแสดงเป็นเปอร์เซ็นต์
R2 = -0.742 = 0.5413
เหล่านั้น. ใน 54.13% ของกรณี การเปลี่ยนแปลงใน x นำไปสู่การเปลี่ยนแปลงใน y กล่าวอีกนัยหนึ่งความแม่นยำในการเลือกสมการถดถอยนั้นเป็นค่าเฉลี่ย ส่วนที่เหลืออีก 45.87% ของการเปลี่ยนแปลงใน Y อธิบายโดยปัจจัยที่ไม่ได้นำมาพิจารณาในแบบจำลอง

บรรณานุกรม

  1. เศรษฐมิติ: ตำราเรียน / เอ็ด ฉัน. เอลิเซวา. – อ.: การเงินและสถิติ, 2544, หน้า. 34..89.
  2. Magnus Y.R., Katyshev P.K., Peresetsky A.A. เศรษฐมิติ. หลักสูตรเริ่มต้น บทช่วยสอน – ฉบับที่ 2, ฉบับที่. – อ.: เดโล, 1998, หน้า. 17..42.
  3. การประชุมเชิงปฏิบัติการเรื่องเศรษฐมิติ: Proc. เบี้ยเลี้ยง / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko และคนอื่น ๆ ; เอ็ด ฉัน. เอลิเซวา. – อ.: การเงินและสถิติ, 2544, หน้า. 5..48.

บริษัทมีพนักงาน 10 คน ตารางที่ 2 แสดงข้อมูลประสบการณ์การทำงานและ

เงินเดือน.

คำนวณโดยใช้ข้อมูลเหล่านี้

  • - ค่าของการประมาณค่าความแปรปรวนร่วมตัวอย่าง
  • - ค่าของสัมประสิทธิ์สหสัมพันธ์เพียร์สันตัวอย่าง
  • - ประเมินทิศทางและความแรงของการเชื่อมต่อจากค่าที่ได้รับ
  • - กำหนดว่าการกล่าวว่าบริษัทนี้ใช้รูปแบบการจัดการแบบญี่ปุ่นนั้นถูกต้องตามกฎหมายเพียงใด ซึ่งถือว่ายิ่งพนักงานใช้เวลาในบริษัทใดบริษัทหนึ่งมากเท่าไร เงินเดือนของเขาก็จะยิ่งสูงขึ้นเท่านั้น

จากฟิลด์สหสัมพันธ์ เราสามารถตั้งสมมติฐาน (สำหรับประชากร) ว่าความสัมพันธ์ระหว่างค่าที่เป็นไปได้ทั้งหมดของ X และ Y นั้นเป็นเส้นตรง

ในการคำนวณพารามิเตอร์การถดถอย เราจะสร้างตารางการคำนวณ

หมายถึงตัวอย่าง.

ผลต่างตัวอย่าง:

จะได้สมการการถดถอยโดยประมาณ

y = bx + a + e,

โดยที่ ei คือค่าที่สังเกตได้ (ค่าประมาณ) ของข้อผิดพลาด ei, a และ b ตามลำดับ ค่าประมาณของพารามิเตอร์ b และในแบบจำลองการถดถอยที่ควรพบ

ในการประมาณค่าพารามิเตอร์ b และ c จะใช้วิธีกำลังสองน้อยที่สุด (วิธีกำลังสองน้อยที่สุด)

ระบบสมการปกติ

a?x + b?x2 = ?y*x

สำหรับข้อมูลของเรา ระบบสมการจะมีรูปแบบ

  • 10a + 307 ข = 33300
  • 307 ก + 1,0857 ข = 1127700

ลองคูณสมการ (1) ของระบบด้วย (-30.7) เราจะได้ระบบที่เราแก้ด้วยวิธีบวกพีชคณิต

  • -307a -9424.9ข = -1022310
  • 307 ก + 1,0857 ข = 1127700

เราได้รับ:

1432.1 ข = 1,05390

b = 73.5912 มาจากไหน?

ตอนนี้เรามาหาค่าสัมประสิทธิ์ "a" จากสมการ (1):

  • 10a + 307 ข = 33300
  • 10a + 307 * 73.5912 = 33300
  • 10a = 10707.49

เราได้รับสัมประสิทธิ์การถดถอยเชิงประจักษ์: b = 73.5912, a = 1,070.7492

สมการการถดถอย (สมการถดถอยเชิงประจักษ์):

y = 73.5912 x + 1,070.7492

ความแปรปรวนร่วม

ในตัวอย่างของเรา ความเชื่อมโยงระหว่างคุณลักษณะ Y และปัจจัย X นั้นสูงและตรง

ดังนั้นเราจึงสามารถพูดได้อย่างปลอดภัยว่า ยิ่งพนักงานทำงานในบริษัทใดบริษัทหนึ่งมากเท่าไร เงินเดือนของเขาก็ก็จะสูงขึ้นตามไปด้วย

4. การทดสอบสมมติฐานทางสถิติ เมื่อแก้ไขปัญหานี้ ขั้นตอนแรกคือการกำหนดสมมติฐานที่ทดสอบได้และสมมติฐานทางเลือก

การตรวจสอบความเท่าเทียมกันของหุ้นสามัญ

การศึกษาผลการปฏิบัติงานของนักศึกษาทั้ง 2 คณะ ผลลัพธ์สำหรับตัวเลือกต่างๆ แสดงไว้ในตารางที่ 3 เป็นไปได้ไหมที่จะบอกว่าทั้งสองคณะมีเปอร์เซ็นต์นักเรียนดีเด่นเท่ากัน?

ค่าเฉลี่ยเลขคณิตอย่างง่าย

เราทดสอบสมมติฐานเกี่ยวกับความเท่าเทียมกันของหุ้นทั่วไป:

มาหาค่าทดลองของเกณฑ์ของนักเรียนกัน:

จำนวนองศาความเป็นอิสระ

f = nх + nу - 2 = 2 + 2 - 2 = 2

กำหนดค่า tkp โดยใช้ตารางการแจกแจงของนักเรียน

เมื่อใช้ตารางนักเรียนเราจะพบ:

Ttable(f;b/2) = Ttable(2;0.025) = 4.303

จากการใช้ตารางจุดวิกฤติของการแจกแจงของนักเรียนที่ระดับนัยสำคัญ b = 0.05 และจำนวนองศาอิสระที่กำหนด เราจะพบว่า tcr = 4.303

เพราะ tob > tcr จากนั้นสมมติฐานว่างจะถูกปฏิเสธ ส่วนแบ่งทั่วไปของทั้งสองตัวอย่างไม่เท่ากัน

ตรวจสอบความสม่ำเสมอของการกระจายทั่วไป

เจ้าหน้าที่ของมหาวิทยาลัยต้องการทราบว่าความนิยมของภาควิชามนุษยศาสตร์เปลี่ยนแปลงไปอย่างไรเมื่อเวลาผ่านไป จำนวนผู้สมัครที่สมัครเข้าเรียนคณะนี้ได้รับการวิเคราะห์โดยสัมพันธ์กับจำนวนผู้สมัครทั้งหมดในปีที่เกี่ยวข้อง (ข้อมูลได้รับในตารางที่ 4) ถ้าเราพิจารณาจำนวนผู้สมัครเพื่อเป็นตัวอย่างเป็นตัวแทนของจำนวนผู้สำเร็จการศึกษาระดับโรงเรียนทั้งหมดในปีนั้น จะพูดได้ไหมว่าความสนใจของเด็กนักเรียนในสาขาวิชาเฉพาะทางของคณะนี้ไม่เปลี่ยนแปลงไปตามกาลเวลา?

ตัวเลือกที่ 4

วิธีแก้ไข: ตารางการคำนวณตัวบ่งชี้

ตรงกลางของช่วงเวลา xi

ความถี่สะสม S

ความถี่, fi/n

ในการประเมินซีรีย์การจัดจำหน่าย เราจะพบตัวบ่งชี้ต่อไปนี้:

ถัวเฉลี่ยถ่วงน้ำหนัก

ช่วงของการแปรผันคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของคุณลักษณะอนุกรมหลัก

R = 2008 - 1988 = 20 การกระจายตัว - กำหนดลักษณะการวัดการกระจายตัวรอบๆ ค่าเฉลี่ย (การวัดการกระจาย กล่าวคือ การเบี่ยงเบนจากค่าเฉลี่ย)

ส่วนเบี่ยงเบนมาตรฐาน (ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย)

แต่ละค่าของอนุกรมจะแตกต่างจากค่าเฉลี่ยปี 2545.66 โดยเฉลี่ย 6.32

ทดสอบสมมติฐานเกี่ยวกับการกระจายตัวของประชากรแบบสม่ำเสมอ

เพื่อทดสอบสมมติฐานเกี่ยวกับการกระจายตัวแบบสม่ำเสมอของ X กล่าวคือ ตามกฎหมาย: f(x) = 1/(b-a) ในช่วงเวลา (a,b) จำเป็น:

ประมาณค่าพารามิเตอร์ a และ b - จุดสิ้นสุดของช่วงเวลาที่สังเกตค่าที่เป็นไปได้ของ X โดยใช้สูตร (เครื่องหมาย * หมายถึงการประมาณค่าพารามิเตอร์):

ค้นหาความหนาแน่นของความน่าจะเป็นของการแจกแจงที่คาดหวัง f(x) = 1/(b* - a*)

ค้นหาความถี่ทางทฤษฎี:

n1 = nP1 = n = n*1/(b* - a*)*(x1 - a*)

n2 = n3 = ... = ns-1 = n*1/(b* - a*)*(xi - xi-1)

ns = n*1/(b* - a*)*(b* - xs-1)

เปรียบเทียบความถี่เชิงประจักษ์และความถี่ทางทฤษฎีโดยใช้เกณฑ์ของเพียร์สัน โดยหาจำนวนดีกรีอิสระ k = s-3 โดยที่ s คือจำนวนช่วงการสุ่มตัวอย่างเริ่มต้น หากมีการใช้การรวมกันของความถี่เล็ก ๆ และช่วงเวลานั้นเอง ดังนั้น s คือจำนวนช่วงเวลาที่เหลือหลังจากการรวมกัน ให้เราค้นหาค่าประมาณสำหรับพารามิเตอร์ a* และ b* ของการแจกแจงแบบสม่ำเสมอโดยใช้สูตร:

ให้เราค้นหาความหนาแน่นของการกระจายตัวแบบสมมติ:

ฉ(x) = 1/(b* - ก*) = 1/(2556.62 - 2534.71) = 0.0456

มาหาความถี่ทางทฤษฎี:

n1 = n*f(x)(x1 - a*) = 0.77 * 0.0456(1992-1991.71) = 0.0102

n5 = n*f(x)(b* - x4) = 0.77 * 0.0456(2556.62-2551) = 0.2

ns = n*f(x)(xi - xi-1)

เนื่องจากสถิติของเพียร์สันวัดความแตกต่างระหว่างการแจกแจงเชิงประจักษ์และการแจกแจงเชิงทฤษฎี ยิ่งค่า Kob ที่สังเกตได้มีค่ามากเท่าใด ข้อโต้แย้งที่ขัดแย้งกับสมมติฐานหลักก็จะยิ่งแข็งแกร่งขึ้นเท่านั้น

ดังนั้นขอบเขตวิกฤตสำหรับสถิตินี้จึงอยู่ทางขวาเสมอ: ) อาจแตกต่างอย่างมีนัยสำคัญจากลักษณะที่สอดคล้องกันของโครงร่างดั้งเดิม (ไม่บิดเบือน) (, l) - ตัวอย่างเช่นด้านล่าง (ดูหัวข้อ 1.1.4) จะแสดงขึ้น ว่าการกำหนดข้อผิดพลาดปกติแบบสุ่มในสองมิติดั้งเดิม รูปแบบปกติ (, m) จะลดค่าสัมบูรณ์ของสัมประสิทธิ์การถดถอย Ql ที่สัมพันธ์กัน (B. 15) เสมอและทำให้ระดับความใกล้ชิดของการเชื่อมต่อระหว่างมันลดลง (เช่น จะลดค่าสัมบูรณ์ของสัมประสิทธิ์สหสัมพันธ์ r)

อิทธิพลของข้อผิดพลาดในการวัดต่อค่าสัมประสิทธิ์สหสัมพันธ์ ให้เราต้องการประมาณระดับความใกล้ชิดของความสัมพันธ์ระหว่างส่วนประกอบของตัวแปรสุ่มปกติสองมิติ (, TJ) แต่เราสามารถสังเกตได้เฉพาะกับข้อผิดพลาดในการวัดแบบสุ่ม es และ e ตามลำดับเท่านั้น (ดูแผนภาพของ D2 การพึ่งพาอาศัยกันในบทนำ) ดังนั้นข้อมูลการทดลอง (xit i/i), i = 1, 2, .., l เป็นค่าตัวอย่างของตัวแปรสุ่มสองมิติที่บิดเบี้ยว (, r)) โดยที่ =

วิธีการร. ประกอบด้วยการหาสมการการถดถอย (รวมถึงการประมาณค่าพารามิเตอร์) โดยช่วยหาค่าเฉลี่ยของตัวแปรสุ่มหากทราบค่าของอีกค่าหนึ่ง (หรือค่าอื่นๆ ในกรณีของการถดถอยหลายตัวแปรหรือหลายตัวแปร) (ในทางตรงกันข้าม การวิเคราะห์ความสัมพันธ์ใช้เพื่อค้นหาและแสดงจุดแข็งของความสัมพันธ์ระหว่างตัวแปรสุ่ม71)

ในการศึกษาความสัมพันธ์ของสัญญาณที่ไม่เกี่ยวข้องกับการเปลี่ยนแปลงอย่างต่อเนื่องเมื่อเวลาผ่านไป แต่ละสัญญาณจะเปลี่ยนแปลงภายใต้อิทธิพลของเหตุผลหลายประการ โดยถือเป็นการสุ่ม ในซีรีส์ไดนามิก การเปลี่ยนแปลงในเวลาของแต่ละซีรีส์จะถูกเพิ่มเข้าไป การเปลี่ยนแปลงนี้นำไปสู่สิ่งที่เรียกว่าความสัมพันธ์อัตโนมัติ - อิทธิพลของการเปลี่ยนแปลงในระดับของซีรีส์ก่อนหน้าต่อลำดับที่ตามมา ดังนั้นความสัมพันธ์ระหว่างระดับของอนุกรมเวลาจะแสดงความสัมพันธ์อย่างใกล้ชิดระหว่างปรากฏการณ์ที่สะท้อนในอนุกรมเวลาได้ก็ต่อเมื่อไม่มีความสัมพันธ์อัตโนมัติในแต่ละปรากฏการณ์ นอกจากนี้ ความสัมพันธ์อัตโนมัติยังนำไปสู่การบิดเบือนค่าของค่าคลาดเคลื่อนกำลังสองเฉลี่ยของสัมประสิทธิ์การถดถอย ซึ่งทำให้ยากต่อการสร้างช่วงความเชื่อมั่นสำหรับค่าสัมประสิทธิ์การถดถอย ตลอดจนทดสอบนัยสำคัญด้วย

ค่าสัมประสิทธิ์สหสัมพันธ์ทางทฤษฎีและตัวอย่างที่กำหนดโดยความสัมพันธ์ (1.8) และ (1.8) ตามลำดับ สามารถคำนวณอย่างเป็นทางการสำหรับระบบการสังเกตสองมิติใดๆ ก็ได้ โดยเป็นการวัดระดับความใกล้ชิดของความสัมพันธ์ทางสถิติเชิงเส้นระหว่างคุณลักษณะที่วิเคราะห์ อย่างไรก็ตาม เฉพาะในกรณีของการแจกแจงปกติร่วมของตัวแปรสุ่มภายใต้การศึกษาและ q ค่าสัมประสิทธิ์สหสัมพันธ์ r มีความหมายที่ชัดเจนในฐานะลักษณะของระดับความใกล้ชิดของความสัมพันธ์ระหว่างตัวแปรเหล่านั้น โดยเฉพาะอย่างยิ่งในกรณีนี้ อัตราส่วน r - 1 ยืนยันความสัมพันธ์เชิงเส้นตรงเชิงฟังก์ชันระหว่างปริมาณที่กำลังศึกษา และสมการ r = 0 บ่งบอกถึงความเป็นอิสระซึ่งกันและกันโดยสมบูรณ์ นอกจากนี้ ค่าสัมประสิทธิ์สหสัมพันธ์ ร่วมกับค่าเฉลี่ยและความแปรปรวนของตัวแปรสุ่มและ TJ ถือเป็นพารามิเตอร์ทั้ง 5 รายการที่ให้ข้อมูลที่ครอบคลุมเกี่ยวกับ

เมื่อพิจารณาสมการของเส้นถดถอยทางทฤษฎีแล้ว จำเป็นต้องหาปริมาณความใกล้ชิดของความสัมพันธ์ระหว่างการสังเกตสองชุด เส้นถดถอยที่ลากในรูป 4.1, b, c เหมือนกัน แต่ในรูป 4.1, b จุดต่างๆ อยู่ใกล้ (ใกล้) กับเส้นถดถอยมากกว่าในรูป 4.1 ค.

ในการวิเคราะห์ความสัมพันธ์ จะถือว่าปัจจัยและการตอบสนองมีลักษณะสุ่มและเป็นไปตามกฎการแจกแจงแบบปกติ

ความใกล้ชิดของความสัมพันธ์ระหว่างตัวแปรสุ่มนั้นมีลักษณะเฉพาะด้วยอัตราส่วนสหสัมพันธ์ p xy ให้เราดูรายละเอียดเพิ่มเติมเกี่ยวกับความหมายทางกายภาพของตัวบ่งชี้นี้ เพื่อทำเช่นนี้ เราได้แนะนำแนวคิดใหม่

การกระจายตัวของสารตกค้าง 5^res แสดงลักษณะเฉพาะของการกระจายในการทดลอง

จุดที่สังเกตสัมพันธ์กับเส้นการถดถอยและแสดงถึงข้อผิดพลาดในการทำนายพารามิเตอร์ y ตามสมการการถดถอย (รูปที่ 4.6):



ส2 =ฉ)