คุณสมบัติการดำเนินการเพื่อคำนวณคุณลักษณะเชิงปริมาณของตัวแปรสุ่ม ลักษณะพื้นฐานของตัวแปรสุ่ม การกระจายตัวและส่วนเบี่ยงเบนมาตรฐาน
ปัญหาการวิเคราะห์ความสัมพันธ์:
ก) การวัดระดับการเชื่อมโยงกัน (ความใกล้ชิด ความแรง ความรุนแรง ความรุนแรง) ของปรากฏการณ์สองปรากฏการณ์ขึ้นไป
b) การเลือกปัจจัยที่มีผลกระทบที่สำคัญที่สุดต่อคุณลักษณะผลลัพธ์ โดยพิจารณาจากการวัดระดับความเชื่อมโยงระหว่างปรากฏการณ์ ปัจจัยที่มีนัยสำคัญในด้านนี้จะถูกนำไปใช้เพิ่มเติมในการวิเคราะห์การถดถอย
c) การตรวจหาความสัมพันธ์เชิงสาเหตุที่ไม่ทราบสาเหตุ
รูปแบบการแสดงความสัมพันธ์มีความหลากหลายมาก ประเภทที่พบบ่อยที่สุดคือประเภทการใช้งาน (สมบูรณ์) และ การเชื่อมต่อสหสัมพันธ์ (ไม่สมบูรณ์).
ความสัมพันธ์แสดงให้เห็นโดยเฉลี่ยสำหรับการสังเกตมวลเมื่อค่าที่กำหนดของตัวแปรตามสอดคล้องกับชุดค่าความน่าจะเป็นบางชุดของตัวแปรอิสระ ความสัมพันธ์เรียกว่าความสัมพันธ์ถ้าแต่ละค่าของคุณลักษณะตัวประกอบสอดคล้องกับค่าที่ไม่ใช่ค่าสุ่มที่กำหนดไว้อย่างดีของคุณลักษณะผลลัพธ์
การแสดงตารางความสัมพันธ์ด้วยภาพคือฟิลด์ความสัมพันธ์ เป็นกราฟที่มีค่า X ถูกพล็อตบนแกน Abscissa ค่า Y ถูกพล็อตบนแกนกำหนดและการรวมกันของ X และ Y จะแสดงด้วยจุด โดยตำแหน่งของจุดเราสามารถตัดสินการมีอยู่ได้ ของการเชื่อมต่อ
ตัวบ่งชี้ความใกล้ชิดของการเชื่อมต่อทำให้สามารถระบุลักษณะการพึ่งพาความแปรผันของลักษณะผลลัพธ์จากการแปรผันของลักษณะปัจจัยได้
ตัวบ่งชี้ระดับความแออัดขั้นสูงยิ่งขึ้น การเชื่อมต่อความสัมพันธ์เป็น สัมประสิทธิ์สหสัมพันธ์เชิงเส้น. เมื่อคำนวณตัวบ่งชี้นี้ ไม่เพียงแต่คำนึงถึงการเบี่ยงเบนของค่าแต่ละค่าของคุณลักษณะจากค่าเฉลี่ยเท่านั้น แต่ยังคำนึงถึงขนาดของการเบี่ยงเบนเหล่านี้ด้วย
คำถามสำคัญของหัวข้อนี้คือสมการของความสัมพันธ์การถดถอยระหว่างคุณลักษณะที่มีประสิทธิผลกับตัวแปรอธิบาย วิธีกำลังสองน้อยที่สุดสำหรับการประมาณค่าพารามิเตอร์ของแบบจำลองการถดถอย การวิเคราะห์คุณภาพของสมการการถดถอยที่เกิดขึ้น การสร้างช่วงความเชื่อมั่นสำหรับการทำนาย ค่าคุณลักษณะที่มีประสิทธิผลโดยใช้สมการถดถอย
ตัวอย่างที่ 2
ระบบสมการปกติ
n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
สำหรับข้อมูลของเรา ระบบสมการจะมีรูปแบบ
30a + 5763 ข = 21460
5763 ก + 1200261 ข = 3800360
จากสมการแรกที่เราแสดงออก กและแทนลงในสมการที่สอง:
เราได้ b = -3.46, a = 1379.33
สมการถดถอย:
y = -3.46 x + 1379.33
2. การคำนวณพารามิเตอร์สมการถดถอย
หมายถึงตัวอย่าง.
ผลต่างตัวอย่าง:
ส่วนเบี่ยงเบนมาตรฐาน
1.1. ค่าสัมประสิทธิ์สหสัมพันธ์
ความแปรปรวนร่วม.
เราคำนวณตัวบ่งชี้ความใกล้ชิดของการเชื่อมต่อ ตัวบ่งชี้นี้คือค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นตัวอย่างซึ่งคำนวณโดยสูตร:
ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นรับค่าตั้งแต่ –1 ถึง +1
การเชื่อมต่อระหว่างคุณลักษณะอาจอ่อนแอและแข็งแกร่ง (ปิด) เกณฑ์ของพวกเขาได้รับการประเมินในระดับ Chaddock:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
ในตัวอย่างของเรา ความสัมพันธ์ระหว่างคุณลักษณะ Y และปัจจัย X มีค่าสูงและผกผัน
นอกจากนี้ ค่าสัมประสิทธิ์สหสัมพันธ์คู่เชิงเส้นสามารถหาได้จากค่าสัมประสิทธิ์การถดถอย b:
1.2. สมการถดถอย(การประมาณสมการถดถอย)
สมการการถดถอยเชิงเส้นคือ y = -3.46 x + 1379.33
ค่าสัมประสิทธิ์ b = -3.46 แสดงการเปลี่ยนแปลงโดยเฉลี่ยในตัวบ่งชี้ประสิทธิภาพ (ในหน่วยการวัด y) โดยมีค่าเพิ่มขึ้นหรือลดลงของปัจจัย x ต่อหน่วยการวัด ในตัวอย่างนี้ เมื่อเพิ่มขึ้น 1 หน่วย y จะลดลง -3.46 โดยเฉลี่ย
ค่าสัมประสิทธิ์ a = 1379.33 จะแสดงระดับที่คาดการณ์ไว้ของ y อย่างเป็นทางการ แต่เฉพาะในกรณีที่ x = 0 ใกล้เคียงกับค่าตัวอย่างเท่านั้น
แต่ถ้า x=0 อยู่ไกลจากค่าตัวอย่างของ x การตีความตามตัวอักษรอาจนำไปสู่ผลลัพธ์ที่ไม่ถูกต้อง และแม้ว่าเส้นการถดถอยจะอธิบายค่าตัวอย่างที่สังเกตได้ค่อนข้างแม่นยำ แต่ก็ไม่มีการรับประกันว่าสิ่งนี้จะเช่นกัน จะเป็นกรณีเมื่อคาดคะเนทางซ้ายหรือทางขวา
ด้วยการแทนที่ค่า x ที่เหมาะสมลงในสมการการถดถอย เราสามารถกำหนดค่าที่จัดตำแหน่ง (คาดการณ์) ของตัวบ่งชี้ประสิทธิภาพ y(x) สำหรับการสังเกตแต่ละครั้ง
ความสัมพันธ์ระหว่าง y และ x กำหนดสัญลักษณ์ของสัมประสิทธิ์การถดถอย b (ถ้า > 0 - ความสัมพันธ์โดยตรง มิฉะนั้น - ผกผัน) ในตัวอย่างของเรา การเชื่อมต่อเป็นแบบย้อนกลับ
1.3. ค่าสัมประสิทธิ์ความยืดหยุ่น
ไม่แนะนำให้ใช้สัมประสิทธิ์การถดถอย (ตัวอย่าง b) เพื่อประเมินอิทธิพลของปัจจัยที่มีต่อคุณลักษณะผลลัพธ์โดยตรง หากมีความแตกต่างในหน่วยการวัดของตัวบ่งชี้ผลลัพธ์ y และคุณลักษณะของปัจจัย x
เพื่อวัตถุประสงค์เหล่านี้ จะมีการคำนวณค่าสัมประสิทธิ์ความยืดหยุ่นและค่าสัมประสิทธิ์เบต้า
ค่าสัมประสิทธิ์ความยืดหยุ่นโดยเฉลี่ย E แสดงด้วยเปอร์เซ็นต์โดยเฉลี่ยที่ผลลัพธ์จะเปลี่ยนแปลงโดยรวม ที่จากค่าเฉลี่ยเมื่อปัจจัยเปลี่ยนแปลง x 1% ของมูลค่าเฉลี่ย
ค่าสัมประสิทธิ์ความยืดหยุ่นพบได้จากสูตร:
ค่าสัมประสิทธิ์ความยืดหยุ่นน้อยกว่า 1 ดังนั้น หาก X เปลี่ยนแปลง 1% Y จะเปลี่ยนน้อยกว่า 1% กล่าวอีกนัยหนึ่ง อิทธิพลของ X ต่อ Y ไม่มีนัยสำคัญ
ค่าสัมประสิทธิ์เบต้าแสดงโดยส่วนใดของค่าของส่วนเบี่ยงเบนมาตรฐาน ค่าเฉลี่ยของคุณลักษณะผลลัพธ์จะเปลี่ยนไปเมื่อลักษณะปัจจัยเปลี่ยนแปลงตามค่าของส่วนเบี่ยงเบนมาตรฐาน โดยค่าของตัวแปรอิสระที่เหลืออยู่คงที่ที่ระดับคงที่:
เหล่านั้น. การเพิ่มขึ้นของ x ด้วยค่าเบี่ยงเบนมาตรฐาน S x จะทำให้ค่าเฉลี่ยของ Y ลดลง 0.74 ส่วนเบี่ยงเบนมาตรฐาน S y
1.4. ข้อผิดพลาดโดยประมาณ
ให้เราประเมินคุณภาพของสมการถดถอยโดยใช้ข้อผิดพลาดของการประมาณค่าสัมบูรณ์ ข้อผิดพลาดในการประมาณเฉลี่ย - ส่วนเบี่ยงเบนเฉลี่ยของค่าที่คำนวณจากค่าจริง:
เนื่องจากข้อผิดพลาดน้อยกว่า 15% สมการนี้จึงสามารถใช้เป็นการถดถอยได้
การวิเคราะห์ความแปรปรวน
วัตถุประสงค์ของการวิเคราะห์ความแปรปรวนคือเพื่อวิเคราะห์ความแปรปรวนของตัวแปรตาม:
∑(y i - y cp) 2 = ∑(y(x) - y cp) 2 + ∑(y - y(x)) 2
ที่ไหน
∑(y i - y cp) 2 - ผลรวมของการเบี่ยงเบนกำลังสอง
∑(y(x) - y cp) 2 - ผลรวมของการเบี่ยงเบนกำลังสองเนื่องจากการถดถอย (“ อธิบาย” หรือ“ แฟกทอเรียล”);
∑(y - y(x)) 2 - ผลรวมที่เหลือของการเบี่ยงเบนกำลังสอง
ความสัมพันธ์สหสัมพันธ์เชิงทฤษฎีสำหรับการเชื่อมต่อเชิงเส้นเท่ากับค่าสัมประสิทธิ์สหสัมพันธ์ r xy .
สำหรับการพึ่งพารูปแบบใด ๆ ความแน่นของการเชื่อมต่อจะถูกกำหนดโดยใช้ สัมประสิทธิ์สหสัมพันธ์พหุคูณ:
สัมประสิทธิ์นี้เป็นค่าสากล เนื่องจากสะท้อนถึงความใกล้ชิดของความสัมพันธ์และความแม่นยำของแบบจำลอง และยังใช้สำหรับการเชื่อมต่อระหว่างตัวแปรทุกรูปแบบอีกด้วย เมื่อสร้างแบบจำลองความสัมพันธ์แบบปัจจัยเดียว ค่าสัมประสิทธิ์สหสัมพันธ์พหุคูณจะเท่ากับค่าสัมประสิทธิ์สหสัมพันธ์คู่ r xy
1.6. ค่าสัมประสิทธิ์การตัดสินใจ
กำลังสองของค่าสัมประสิทธิ์สหสัมพันธ์ (หลายรายการ) เรียกว่าค่าสัมประสิทธิ์การกำหนด ซึ่งแสดงสัดส่วนของการแปรผันในคุณลักษณะผลลัพธ์ที่อธิบายโดยการแปรผันในคุณลักษณะตัวประกอบ
ส่วนใหญ่แล้วเมื่อตีความค่าสัมประสิทธิ์การตัดสินใจจะแสดงเป็นเปอร์เซ็นต์
R2 = -0.742 = 0.5413
เหล่านั้น. ใน 54.13% ของกรณี การเปลี่ยนแปลงใน x นำไปสู่การเปลี่ยนแปลงใน y กล่าวอีกนัยหนึ่งความแม่นยำในการเลือกสมการถดถอยนั้นเป็นค่าเฉลี่ย ส่วนที่เหลืออีก 45.87% ของการเปลี่ยนแปลงใน Y อธิบายโดยปัจจัยที่ไม่ได้นำมาพิจารณาในแบบจำลอง
บรรณานุกรม
- เศรษฐมิติ: ตำราเรียน / เอ็ด ฉัน. เอลิเซวา. – อ.: การเงินและสถิติ, 2544, หน้า. 34..89.
- Magnus Y.R., Katyshev P.K., Peresetsky A.A. เศรษฐมิติ. หลักสูตรเริ่มต้น บทช่วยสอน – ฉบับที่ 2, ฉบับที่. – อ.: เดโล, 1998, หน้า. 17..42.
- การประชุมเชิงปฏิบัติการเรื่องเศรษฐมิติ: Proc. เบี้ยเลี้ยง / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko และคนอื่น ๆ ; เอ็ด ฉัน. เอลิเซวา. – อ.: การเงินและสถิติ, 2544, หน้า. 5..48.
บริษัทมีพนักงาน 10 คน ตารางที่ 2 แสดงข้อมูลประสบการณ์การทำงานและ
เงินเดือน.
คำนวณโดยใช้ข้อมูลเหล่านี้
- - ค่าของการประมาณค่าความแปรปรวนร่วมตัวอย่าง
- - ค่าของสัมประสิทธิ์สหสัมพันธ์เพียร์สันตัวอย่าง
- - ประเมินทิศทางและความแรงของการเชื่อมต่อจากค่าที่ได้รับ
- - กำหนดว่าการกล่าวว่าบริษัทนี้ใช้รูปแบบการจัดการแบบญี่ปุ่นนั้นถูกต้องตามกฎหมายเพียงใด ซึ่งถือว่ายิ่งพนักงานใช้เวลาในบริษัทใดบริษัทหนึ่งมากเท่าไร เงินเดือนของเขาก็จะยิ่งสูงขึ้นเท่านั้น
จากฟิลด์สหสัมพันธ์ เราสามารถตั้งสมมติฐาน (สำหรับประชากร) ว่าความสัมพันธ์ระหว่างค่าที่เป็นไปได้ทั้งหมดของ X และ Y นั้นเป็นเส้นตรง
ในการคำนวณพารามิเตอร์การถดถอย เราจะสร้างตารางการคำนวณ
หมายถึงตัวอย่าง.
ผลต่างตัวอย่าง:
จะได้สมการการถดถอยโดยประมาณ
y = bx + a + e,
โดยที่ ei คือค่าที่สังเกตได้ (ค่าประมาณ) ของข้อผิดพลาด ei, a และ b ตามลำดับ ค่าประมาณของพารามิเตอร์ b และในแบบจำลองการถดถอยที่ควรพบ
ในการประมาณค่าพารามิเตอร์ b และ c จะใช้วิธีกำลังสองน้อยที่สุด (วิธีกำลังสองน้อยที่สุด)
ระบบสมการปกติ
a?x + b?x2 = ?y*x
สำหรับข้อมูลของเรา ระบบสมการจะมีรูปแบบ
- 10a + 307 ข = 33300
- 307 ก + 1,0857 ข = 1127700
ลองคูณสมการ (1) ของระบบด้วย (-30.7) เราจะได้ระบบที่เราแก้ด้วยวิธีบวกพีชคณิต
- -307a -9424.9ข = -1022310
- 307 ก + 1,0857 ข = 1127700
เราได้รับ:
1432.1 ข = 1,05390
b = 73.5912 มาจากไหน?
ตอนนี้เรามาหาค่าสัมประสิทธิ์ "a" จากสมการ (1):
- 10a + 307 ข = 33300
- 10a + 307 * 73.5912 = 33300
- 10a = 10707.49
เราได้รับสัมประสิทธิ์การถดถอยเชิงประจักษ์: b = 73.5912, a = 1,070.7492
สมการการถดถอย (สมการถดถอยเชิงประจักษ์):
y = 73.5912 x + 1,070.7492
ความแปรปรวนร่วม
ในตัวอย่างของเรา ความเชื่อมโยงระหว่างคุณลักษณะ Y และปัจจัย X นั้นสูงและตรง
ดังนั้นเราจึงสามารถพูดได้อย่างปลอดภัยว่า ยิ่งพนักงานทำงานในบริษัทใดบริษัทหนึ่งมากเท่าไร เงินเดือนของเขาก็ก็จะสูงขึ้นตามไปด้วย
4. การทดสอบสมมติฐานทางสถิติ เมื่อแก้ไขปัญหานี้ ขั้นตอนแรกคือการกำหนดสมมติฐานที่ทดสอบได้และสมมติฐานทางเลือก
การตรวจสอบความเท่าเทียมกันของหุ้นสามัญ
การศึกษาผลการปฏิบัติงานของนักศึกษาทั้ง 2 คณะ ผลลัพธ์สำหรับตัวเลือกต่างๆ แสดงไว้ในตารางที่ 3 เป็นไปได้ไหมที่จะบอกว่าทั้งสองคณะมีเปอร์เซ็นต์นักเรียนดีเด่นเท่ากัน?
ค่าเฉลี่ยเลขคณิตอย่างง่าย
เราทดสอบสมมติฐานเกี่ยวกับความเท่าเทียมกันของหุ้นทั่วไป:
มาหาค่าทดลองของเกณฑ์ของนักเรียนกัน:
จำนวนองศาความเป็นอิสระ
f = nх + nу - 2 = 2 + 2 - 2 = 2
กำหนดค่า tkp โดยใช้ตารางการแจกแจงของนักเรียน
เมื่อใช้ตารางนักเรียนเราจะพบ:
Ttable(f;b/2) = Ttable(2;0.025) = 4.303
จากการใช้ตารางจุดวิกฤติของการแจกแจงของนักเรียนที่ระดับนัยสำคัญ b = 0.05 และจำนวนองศาอิสระที่กำหนด เราจะพบว่า tcr = 4.303
เพราะ tob > tcr จากนั้นสมมติฐานว่างจะถูกปฏิเสธ ส่วนแบ่งทั่วไปของทั้งสองตัวอย่างไม่เท่ากัน
ตรวจสอบความสม่ำเสมอของการกระจายทั่วไป
เจ้าหน้าที่ของมหาวิทยาลัยต้องการทราบว่าความนิยมของภาควิชามนุษยศาสตร์เปลี่ยนแปลงไปอย่างไรเมื่อเวลาผ่านไป จำนวนผู้สมัครที่สมัครเข้าเรียนคณะนี้ได้รับการวิเคราะห์โดยสัมพันธ์กับจำนวนผู้สมัครทั้งหมดในปีที่เกี่ยวข้อง (ข้อมูลได้รับในตารางที่ 4) ถ้าเราพิจารณาจำนวนผู้สมัครเพื่อเป็นตัวอย่างเป็นตัวแทนของจำนวนผู้สำเร็จการศึกษาระดับโรงเรียนทั้งหมดในปีนั้น จะพูดได้ไหมว่าความสนใจของเด็กนักเรียนในสาขาวิชาเฉพาะทางของคณะนี้ไม่เปลี่ยนแปลงไปตามกาลเวลา?
ตัวเลือกที่ 4 |
|||||
วิธีแก้ไข: ตารางการคำนวณตัวบ่งชี้
ตรงกลางของช่วงเวลา xi |
ความถี่สะสม S |
ความถี่, fi/n |
|||||
ในการประเมินซีรีย์การจัดจำหน่าย เราจะพบตัวบ่งชี้ต่อไปนี้:
ถัวเฉลี่ยถ่วงน้ำหนัก
ช่วงของการแปรผันคือความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของคุณลักษณะอนุกรมหลัก
R = 2008 - 1988 = 20 การกระจายตัว - กำหนดลักษณะการวัดการกระจายตัวรอบๆ ค่าเฉลี่ย (การวัดการกระจาย กล่าวคือ การเบี่ยงเบนจากค่าเฉลี่ย)
ส่วนเบี่ยงเบนมาตรฐาน (ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย)
แต่ละค่าของอนุกรมจะแตกต่างจากค่าเฉลี่ยปี 2545.66 โดยเฉลี่ย 6.32
ทดสอบสมมติฐานเกี่ยวกับการกระจายตัวของประชากรแบบสม่ำเสมอ
เพื่อทดสอบสมมติฐานเกี่ยวกับการกระจายตัวแบบสม่ำเสมอของ X กล่าวคือ ตามกฎหมาย: f(x) = 1/(b-a) ในช่วงเวลา (a,b) จำเป็น:
ประมาณค่าพารามิเตอร์ a และ b - จุดสิ้นสุดของช่วงเวลาที่สังเกตค่าที่เป็นไปได้ของ X โดยใช้สูตร (เครื่องหมาย * หมายถึงการประมาณค่าพารามิเตอร์):
ค้นหาความหนาแน่นของความน่าจะเป็นของการแจกแจงที่คาดหวัง f(x) = 1/(b* - a*)
ค้นหาความถี่ทางทฤษฎี:
n1 = nP1 = n = n*1/(b* - a*)*(x1 - a*)
n2 = n3 = ... = ns-1 = n*1/(b* - a*)*(xi - xi-1)
ns = n*1/(b* - a*)*(b* - xs-1)
เปรียบเทียบความถี่เชิงประจักษ์และความถี่ทางทฤษฎีโดยใช้เกณฑ์ของเพียร์สัน โดยหาจำนวนดีกรีอิสระ k = s-3 โดยที่ s คือจำนวนช่วงการสุ่มตัวอย่างเริ่มต้น หากมีการใช้การรวมกันของความถี่เล็ก ๆ และช่วงเวลานั้นเอง ดังนั้น s คือจำนวนช่วงเวลาที่เหลือหลังจากการรวมกัน ให้เราค้นหาค่าประมาณสำหรับพารามิเตอร์ a* และ b* ของการแจกแจงแบบสม่ำเสมอโดยใช้สูตร:
ให้เราค้นหาความหนาแน่นของการกระจายตัวแบบสมมติ:
ฉ(x) = 1/(b* - ก*) = 1/(2556.62 - 2534.71) = 0.0456
มาหาความถี่ทางทฤษฎี:
n1 = n*f(x)(x1 - a*) = 0.77 * 0.0456(1992-1991.71) = 0.0102
n5 = n*f(x)(b* - x4) = 0.77 * 0.0456(2556.62-2551) = 0.2
ns = n*f(x)(xi - xi-1)
เนื่องจากสถิติของเพียร์สันวัดความแตกต่างระหว่างการแจกแจงเชิงประจักษ์และการแจกแจงเชิงทฤษฎี ยิ่งค่า Kob ที่สังเกตได้มีค่ามากเท่าใด ข้อโต้แย้งที่ขัดแย้งกับสมมติฐานหลักก็จะยิ่งแข็งแกร่งขึ้นเท่านั้น
ดังนั้นขอบเขตวิกฤตสำหรับสถิตินี้จึงอยู่ทางขวาเสมอ: ) อาจแตกต่างอย่างมีนัยสำคัญจากลักษณะที่สอดคล้องกันของโครงร่างดั้งเดิม (ไม่บิดเบือน) (, l) - ตัวอย่างเช่นด้านล่าง (ดูหัวข้อ 1.1.4) จะแสดงขึ้น ว่าการกำหนดข้อผิดพลาดปกติแบบสุ่มในสองมิติดั้งเดิม รูปแบบปกติ (, m) จะลดค่าสัมบูรณ์ของสัมประสิทธิ์การถดถอย Ql ที่สัมพันธ์กัน (B. 15) เสมอและทำให้ระดับความใกล้ชิดของการเชื่อมต่อระหว่างมันลดลง (เช่น จะลดค่าสัมบูรณ์ของสัมประสิทธิ์สหสัมพันธ์ r)
อิทธิพลของข้อผิดพลาดในการวัดต่อค่าสัมประสิทธิ์สหสัมพันธ์ ให้เราต้องการประมาณระดับความใกล้ชิดของความสัมพันธ์ระหว่างส่วนประกอบของตัวแปรสุ่มปกติสองมิติ (, TJ) แต่เราสามารถสังเกตได้เฉพาะกับข้อผิดพลาดในการวัดแบบสุ่ม es และ e ตามลำดับเท่านั้น (ดูแผนภาพของ D2 การพึ่งพาอาศัยกันในบทนำ) ดังนั้นข้อมูลการทดลอง (xit i/i), i = 1, 2, .., l เป็นค่าตัวอย่างของตัวแปรสุ่มสองมิติที่บิดเบี้ยว (, r)) โดยที่ =
วิธีการร. ประกอบด้วยการหาสมการการถดถอย (รวมถึงการประมาณค่าพารามิเตอร์) โดยช่วยหาค่าเฉลี่ยของตัวแปรสุ่มหากทราบค่าของอีกค่าหนึ่ง (หรือค่าอื่นๆ ในกรณีของการถดถอยหลายตัวแปรหรือหลายตัวแปร) (ในทางตรงกันข้าม การวิเคราะห์ความสัมพันธ์ใช้เพื่อค้นหาและแสดงจุดแข็งของความสัมพันธ์ระหว่างตัวแปรสุ่ม71)
ในการศึกษาความสัมพันธ์ของสัญญาณที่ไม่เกี่ยวข้องกับการเปลี่ยนแปลงอย่างต่อเนื่องเมื่อเวลาผ่านไป แต่ละสัญญาณจะเปลี่ยนแปลงภายใต้อิทธิพลของเหตุผลหลายประการ โดยถือเป็นการสุ่ม ในซีรีส์ไดนามิก การเปลี่ยนแปลงในเวลาของแต่ละซีรีส์จะถูกเพิ่มเข้าไป การเปลี่ยนแปลงนี้นำไปสู่สิ่งที่เรียกว่าความสัมพันธ์อัตโนมัติ - อิทธิพลของการเปลี่ยนแปลงในระดับของซีรีส์ก่อนหน้าต่อลำดับที่ตามมา ดังนั้นความสัมพันธ์ระหว่างระดับของอนุกรมเวลาจะแสดงความสัมพันธ์อย่างใกล้ชิดระหว่างปรากฏการณ์ที่สะท้อนในอนุกรมเวลาได้ก็ต่อเมื่อไม่มีความสัมพันธ์อัตโนมัติในแต่ละปรากฏการณ์ นอกจากนี้ ความสัมพันธ์อัตโนมัติยังนำไปสู่การบิดเบือนค่าของค่าคลาดเคลื่อนกำลังสองเฉลี่ยของสัมประสิทธิ์การถดถอย ซึ่งทำให้ยากต่อการสร้างช่วงความเชื่อมั่นสำหรับค่าสัมประสิทธิ์การถดถอย ตลอดจนทดสอบนัยสำคัญด้วย
ค่าสัมประสิทธิ์สหสัมพันธ์ทางทฤษฎีและตัวอย่างที่กำหนดโดยความสัมพันธ์ (1.8) และ (1.8) ตามลำดับ สามารถคำนวณอย่างเป็นทางการสำหรับระบบการสังเกตสองมิติใดๆ ก็ได้ โดยเป็นการวัดระดับความใกล้ชิดของความสัมพันธ์ทางสถิติเชิงเส้นระหว่างคุณลักษณะที่วิเคราะห์ อย่างไรก็ตาม เฉพาะในกรณีของการแจกแจงปกติร่วมของตัวแปรสุ่มภายใต้การศึกษาและ q ค่าสัมประสิทธิ์สหสัมพันธ์ r มีความหมายที่ชัดเจนในฐานะลักษณะของระดับความใกล้ชิดของความสัมพันธ์ระหว่างตัวแปรเหล่านั้น โดยเฉพาะอย่างยิ่งในกรณีนี้ อัตราส่วน r - 1 ยืนยันความสัมพันธ์เชิงเส้นตรงเชิงฟังก์ชันระหว่างปริมาณที่กำลังศึกษา และสมการ r = 0 บ่งบอกถึงความเป็นอิสระซึ่งกันและกันโดยสมบูรณ์ นอกจากนี้ ค่าสัมประสิทธิ์สหสัมพันธ์ ร่วมกับค่าเฉลี่ยและความแปรปรวนของตัวแปรสุ่มและ TJ ถือเป็นพารามิเตอร์ทั้ง 5 รายการที่ให้ข้อมูลที่ครอบคลุมเกี่ยวกับ
เมื่อพิจารณาสมการของเส้นถดถอยทางทฤษฎีแล้ว จำเป็นต้องหาปริมาณความใกล้ชิดของความสัมพันธ์ระหว่างการสังเกตสองชุด เส้นถดถอยที่ลากในรูป 4.1, b, c เหมือนกัน แต่ในรูป 4.1, b จุดต่างๆ อยู่ใกล้ (ใกล้) กับเส้นถดถอยมากกว่าในรูป 4.1 ค.
ในการวิเคราะห์ความสัมพันธ์ จะถือว่าปัจจัยและการตอบสนองมีลักษณะสุ่มและเป็นไปตามกฎการแจกแจงแบบปกติ
ความใกล้ชิดของความสัมพันธ์ระหว่างตัวแปรสุ่มนั้นมีลักษณะเฉพาะด้วยอัตราส่วนสหสัมพันธ์ p xy ให้เราดูรายละเอียดเพิ่มเติมเกี่ยวกับความหมายทางกายภาพของตัวบ่งชี้นี้ เพื่อทำเช่นนี้ เราได้แนะนำแนวคิดใหม่
การกระจายตัวของสารตกค้าง 5^res แสดงลักษณะเฉพาะของการกระจายในการทดลอง
จุดที่สังเกตสัมพันธ์กับเส้นการถดถอยและแสดงถึงข้อผิดพลาดในการทำนายพารามิเตอร์ y ตามสมการการถดถอย (รูปที่ 4.6):
ส2 =ฉ)
เราก็ขอแนะนำเช่นกัน