Regresyon fonksiyonunun tahmini. Regresyon analizi - rastgele bir değişkenin değişkenlere bağımlılığını incelemek için istatistiksel bir yöntem
Regresyon analizinin temel özelliği, incelenen değişkenler arasındaki ilişkinin biçimi ve doğası hakkında belirli bilgiler elde etmek için kullanılabilmesidir.
Regresyon analizi aşamalarının sırası
Regresyon analizinin aşamalarını kısaca ele alalım.
Görev formülasyonu. Bu aşamada, incelenen fenomenlerin bağımlılığı hakkında ön hipotezler oluşturulur.
Bağımlı ve bağımsız (açıklayıcı) değişkenlerin tanımı.
İstatistiksel verilerin toplanması. Regresyon modelinde yer alan değişkenlerin her biri için veri toplanmalıdır.
Bağlantı biçimi (basit veya çoklu, doğrusal veya doğrusal olmayan) hakkında bir hipotezin formüle edilmesi.
Tanım regresyon fonksiyonları (regresyon denkleminin parametrelerinin sayısal değerlerinin hesaplanmasından oluşur)
Regresyon analizinin doğruluğunun değerlendirilmesi.
Elde edilen sonuçların yorumlanması. Regresyon analizinin sonuçları ön hipotezlerle karşılaştırılır. Elde edilen sonuçların doğruluğu ve inandırıcılığı değerlendirilir.
Tahmin olumsuzluk bilinen değerler bağımlı değişken.
Regresyon analizi yardımıyla tahmin ve sınıflandırma problemini çözmek mümkündür. Tahmini değerler, açıklayıcı değişkenlerin değerleri regresyon denkleminde değiştirilerek hesaplanır. Sınıflandırma problemi şu şekilde çözülür: regresyon çizgisi tüm nesne kümesini iki sınıfa ayırır ve kümenin fonksiyonun değerinin sıfırdan büyük olduğu kısmı bir sınıfa, küçük olduğu kısmı ise bir sınıfa aittir. sıfırdan başka bir sınıfa aittir.
Regresyon analizinin görevleri
Regresyon analizinin ana görevlerini göz önünde bulundurun: bağımlılık biçimini belirlemek, belirlemek regresyon fonksiyonları, bağımlı değişkenin bilinmeyen değerlerinin bir tahmini.
Bağımlılık biçiminin oluşturulması.
Değişkenler arasındaki ilişkinin doğası ve biçimi aşağıdaki regresyon türlerini oluşturabilir:
pozitif lineer regresyon (fonksiyonun düzgün büyümesi olarak ifade edilir);
pozitif düzgün hızlanan regresyon;
pozitif düzgün artan regresyon;
negatif doğrusal regresyon (fonksiyonda tekdüze bir düşüş olarak ifade edilir);
negatif düzgün hızlandırılmış azalan regresyon;
negatif düzgün azalan regresyon.
Bununla birlikte, açıklanan çeşitler genellikle saf halde değil, birbirleriyle kombinasyon halinde bulunur. Bu durumda, birleşik gerileme biçimlerinden söz edilir.
Regresyon fonksiyonunun tanımı.
İkinci görev, ana faktörlerin veya nedenlerin bağımlı değişken üzerindeki etkisini bulmaktır, diğer her şey eşittir ve rastgele öğelerin bağımlı değişken üzerindeki etkisinin hariç tutulmasına tabidir. regresyon fonksiyonuşu ya da bu türden bir matematiksel denklem olarak tanımlanır.
Bağımlı değişkenin bilinmeyen değerlerinin tahmini.
Bu sorunun çözümü, aşağıdaki türlerden birinin sorununu çözmeye indirgenmiştir:
İlk verilerin dikkate alınan aralığı içindeki bağımlı değişkenin değerlerinin tahmini, yani. kayıp değerler; bu enterpolasyon problemini çözer.
Bağımlı değişkenin gelecekteki değerlerinin tahmin edilmesi, yani. ilk verilerin verilen aralığı dışındaki değerleri bulmak; bu ekstrapolasyon problemini çözer.
Her iki problem de, bağımsız değişkenlerin değerlerinin parametrelerinin bulunan tahminlerinin regresyon denklemine değiştirilmesiyle çözülür. Denklemi çözmenin sonucu, hedef (bağımlı) değişkenin değerinin bir tahminidir.
Regresyon analizinin dayandığı bazı varsayımlara bakalım.
Doğrusallık varsayımı, yani incelenen değişkenler arasındaki ilişkinin doğrusal olduğu varsayılır. Böylece, bu örnekte, bir dağılım grafiği oluşturduk ve net bir doğrusal ilişki görebildik. Değişkenlerin dağılım grafiğinde, doğrusal bir ilişkinin açık bir şekilde yokluğunu görürsek, yani doğrusal olmayan bir ilişki varsa, doğrusal olmayan analiz yöntemleri kullanılmalıdır.
Normallik Varsayımı kalanlar. Öngörülen ve gözlemlenen değerler arasındaki farkın dağılımının normal olduğunu varsayar. Dağılımın doğasını görsel olarak belirlemek için histogramları kullanabilirsiniz. kalanlar.
Regresyon analizini kullanırken, ana sınırlaması dikkate alınmalıdır. Regresyon analizinin, bu bağımlılıkların altında yatan ilişkileri değil, yalnızca bağımlılıkları tespit etmenize izin vermesi gerçeğinden oluşur.
Regresyon analizi, bilinen birkaç değere dayalı olarak bir değişkenin beklenen değerini hesaplayarak değişkenler arasındaki ilişkinin derecesini değerlendirmeyi mümkün kılar.
Regresyon denklemi.
Regresyon denklemi şöyle görünür: Y=a+b*X
Bu denklem kullanılarak Y değişkeni, a sabiti ve doğrunun (veya eğimin) b eğiminin X değişkeninin değeriyle çarpımı olarak ifade edilir. a sabitine aynı zamanda kesişme noktası da denir ve eğim regresyondur katsayısı veya B faktörü.
Çoğu durumda (her zaman olmasa da) regresyon çizgisi hakkında belirli bir gözlem dağılımı vardır.
kalan tek bir noktanın (gözlem) regresyon çizgisinden (öngörülen değer) sapmasıdır.
MS Excel'de regresyon analizi problemini çözmek için menüden seçin Hizmet"Analiz Paketi" ve Regresyon analiz aracı. X ve Y giriş aralıklarını belirtin Y giriş aralığı, analiz edilen bağımlı veri aralığıdır ve bir sütun içermelidir. Giriş aralığı X, analiz edilecek bağımsız veri aralığıdır. Giriş aralığı sayısı 16'yı geçmemelidir.
Çıktı aralığındaki prosedürün çıktısında, verilen raporu alırız. tablo 8.3a-8.3v.
SONUÇLAR
Tablo 8.3a. Regresyon istatistikleri |
|
Regresyon istatistikleri |
|
Çoklu R | |
R Meydanı | |
Normalleştirilmiş R-kare | |
standart hata | |
gözlemler |
İlk olarak, aşağıda sunulan hesaplamaların üst kısmını göz önünde bulundurun. tablo 8.3a, - gerileme istatistikleri.
Değer R Meydanı kesinlik ölçüsü olarak da adlandırılan , ortaya çıkan regresyon çizgisinin kalitesini karakterize eder. Bu kalite, orijinal veriler ile regresyon modeli (hesaplanan veriler) arasındaki uygunluk derecesi ile ifade edilir. Kesinliğin ölçüsü her zaman aralığın içindedir.
Çoğu durumda, değer R Meydanı bu değerler arasındadır, aşırı denir, yani. sıfır ile bir arasında.
eğer değer R Meydanı bire yakın, bu, oluşturulan modelin karşılık gelen değişkenlerin neredeyse tüm değişkenliğini açıkladığı anlamına gelir. Buna karşılık, değer R Meydanı sıfıra yakın demek kötü kalite inşa edilmiş model.
Örneğimizde, kesinlik ölçüsü 0,99673'tür ve bu, regresyon çizgisinin orijinal verilere çok iyi uyduğunu gösterir.
çoğul R - çoklu korelasyon katsayısı R - bağımsız değişkenlerin (X) ve bağımlı değişkenin (Y) bağımlılık derecesini ifade eder.
Çoklu R eşittir kare kök belirleme katsayısından bu değer sıfır ile bir arasında değerler alır.
Basit doğrusal regresyon analizinde çoğul R Pearson korelasyon katsayısına eşittir. Yok canım, çoğul R bizim durumumuzda, önceki örnekteki Pearson korelasyon katsayısına eşittir (0.998364).
Tablo 8.3b. Regresyon katsayıları |
|||
Oranlar |
standart hata |
t-istatistik |
|
Y kavşağı | |||
Değişken X 1 | |||
* Hesaplamaların kısaltılmış hali verilmiştir. |
Şimdi, aşağıda sunulan hesaplamaların orta kısmını ele alalım. tablo 8.3b. Burada regresyon katsayısı b (2,305454545) ve y ekseni boyunca ofset verilmiştir, yani sabit bir (2,694545455).
Hesaplamalara dayanarak, regresyon denklemini aşağıdaki gibi yazabiliriz:
Y= x*2,305454545+2,694545455
Değişkenler arasındaki ilişkinin yönü, regresyon katsayılarının (katsayı b) işaretlerine (negatif veya pozitif) göre belirlenir.
Regresyon katsayısının işareti pozitif ise bağımlı değişken ile bağımsız değişken arasındaki ilişki pozitif olacaktır. Bizim durumumuzda regresyon katsayısının işareti pozitiftir, dolayısıyla ilişki de pozitiftir.
Regresyon katsayısının işareti negatif ise bağımlı değişken ile bağımsız değişken arasındaki ilişki negatiftir (ters).
AT tablo 8.3c. çıktı sonuçları sunulur kalanlar. Bu sonuçların raporda görünmesi için, "Regresyon" aracını başlatırken "Kalıntılar" onay kutusunun etkinleştirilmesi gerekir.
KALAN ÇEKİM
Tablo 8.3c. Kalıntılar |
|||
Gözlem |
tahmin edilen Y |
Kalıntılar |
Standart bakiyeler |
Raporun bu bölümünü kullanarak, oluşturulan regresyon çizgisinden her bir noktanın sapmalarını görebiliriz. En büyük mutlak değer kalan bizim durumumuzda - 0.778, en küçük - 0.043. Bu verilerin daha iyi yorumlanması için, orijinal verilerin grafiğini ve Şekil 2'de sunulan oluşturulmuş regresyon çizgisini kullanacağız. pilav. 8.3. Gördüğünüz gibi, regresyon çizgisi, orijinal verilerin değerlerine oldukça doğru bir şekilde "uydurulmuştur".
Ele alınan örneğin oldukça basit olduğu ve niteliksel olarak doğrusal bir regresyon çizgisi oluşturmanın her zaman mümkün olmadığı dikkate alınmalıdır.
Pirinç. 8.3. Başlangıç verileri ve regresyon çizgisi
Bağımsız değişkenin bilinen değerlerine dayalı olarak bağımlı değişkenin gelecekteki bilinmeyen değerlerini tahmin etme sorunu dikkate alınmadan kaldı, yani. tahmin görevi.
Bir regresyon denklemine sahip olan tahmin problemi, Y= x*2.305454545+2.694545455 denklemini bilinen x değerleri ile çözmeye indirgenmiştir. Bağımlı değişken Y'yi altı adım öteden tahmin etmenin sonuçları sunulmuştur. tablo 8.4'te.
Tablo 8.4. Y değişkeni tahmin sonuçları |
|
Y(tahmin edilen) |
|
Böylece, Microsoft Excel paketinde regresyon analizi kullanmanın bir sonucu olarak:
bir regresyon denklemi oluşturdu;
bağımlılığın biçimini ve değişkenler arasındaki ilişkinin yönünü belirledi - işlevin düzgün bir büyümesinde ifade edilen pozitif bir doğrusal regresyon;
değişkenler arasındaki ilişkinin yönünü belirleyen;
ortaya çıkan regresyon çizgisinin kalitesini değerlendirdi;
hesaplanan verilerin orijinal setin verilerinden sapmalarını görebilmiş;
bağımlı değişkenin gelecekteki değerlerini tahmin etti.
Eğer bir regresyon fonksiyonu tanımlanmış, yorumlanmış ve gerekçelendirilmiş ve regresyon analizinin doğruluğunun değerlendirilmesi gereksinimleri karşılıyorsa, oluşturulan modelin ve tahmin değerlerinin yeterince güvenilir olduğunu varsayabiliriz.
Bu şekilde elde edilen tahmin edilen değerler beklenebilecek ortalama değerlerdir.
Bu yazıda, ana özellikleri inceledik tanımlayıcı istatistikler ve bunların arasında gibi kavramlar kastetmek,medyan,maksimum,minimum ve veri varyasyonunun diğer özellikleri.
Konseptin kısa bir tartışması da oldu. emisyonlar. Ele alınan özellikler, sözde keşifsel veri analizine atıfta bulunur, sonuçları genel nüfus için geçerli olmayabilir, ancak yalnızca bir veri örneği için geçerli olabilir. Keşifsel veri analizi, popülasyon hakkında birincil sonuçlar çıkarmak ve hipotezler oluşturmak için kullanılır.
Korelasyon ve regresyon analizinin temelleri, görevleri ve pratik kullanım olanakları da ele alındı.
Modern siyaset bilimi, toplumdaki tüm fenomenlerin ve süreçlerin ilişkisi konusundaki konumundan hareket eder. Olayları ve süreçleri anlamak, fenomenleri tahmin etmek ve kontrol etmek imkansızdır. siyasi hayat toplum yaşamının siyasi alanında var olan bağlantıları ve bağımlılıkları incelemeden. Politika araştırmasının en yaygın görevlerinden biri, bazı gözlemlenebilir değişkenler arasındaki ilişkiyi incelemektir. Bu sorunu çözmeye yardımcı olur bütün sınıf"gerileme analizi" (veya aynı zamanda "korelasyon-gerileme analizi" olarak da adlandırılır) ortak adı ile birleştirilen istatistiksel analiz yöntemleri. Bununla birlikte, korelasyon analizi iki değişken arasındaki ilişkinin gücünü değerlendirmeyi mümkün kılıyorsa, regresyon analizi kullanılarak bu ilişkinin türünü belirlemek, herhangi bir değişkenin değerinin başka bir değişkenin değerine bağımlılığını tahmin etmek mümkündür. .
İlk olarak, korelasyonun ne olduğunu hatırlayalım. bağıntılı en önemli denir özel durum bir değişkenin eşit değerlerinin farklı değerlere karşılık gelmesinden oluşan istatistiksel ilişki ortalama değerler bir diğer. x niteliğinin değerindeki bir değişiklikle, y niteliğinin ortalama değeri doğal olarak değişirken, her durumda niteliğin değeri değişir. de(farklı olasılıklarla) birçok farklı değer alabilir.
İstatistikte “korelasyon” teriminin ortaya çıkışı (ve siyaset bilimi, sorunlarını çözmek için istatistiklerin başarısını çeker, bu nedenle siyaset bilimiyle ilgili bir disiplindir), İngiliz biyolog ve istatistikçi Francis Galton'un adıyla ilişkilidir. 19. yüzyılda kim teklif etti. teorik temel korelasyon ve regresyon analizi. Bilimde "korelasyon" terimi daha önce biliniyordu. Özellikle, 18. yüzyılda paleontolojide. Fransız bilim adamı Georges Cuvier tarafından uygulandı. Kazılar sırasında bulunan hayvan kalıntılarına göre görünüşlerini eski haline getirmenin mümkün olduğu sözde korelasyon yasasını çıkardı.
Bu bilim adamının adı ve korelasyon yasası ile ilgili iyi bilinen bir hikaye var. Böylece, bir üniversitenin tatil olduğu günlerde, ünlü bir profesöre oyun oynamaya karar veren öğrenciler, bir öğrencinin üzerine boynuzlu ve toynaklı bir keçi derisi çektiler. Cuvier'in yatak odasının penceresine tırmandı ve "Seni yerim" diye bağırdı. Profesör uyandı, siluete baktı ve cevap verdi: “Boynuzlarınız ve toynaklarınız varsa, o zaman bir otobursunuz ve beni yiyemezsiniz. Ve korelasyon yasasını bilmediğiniz için bir ikili elde edeceksiniz. Döndü ve uykuya daldı. Şaka şakadır ama bu örnekte çoklu korelasyon-regresyon analizinin kullanıldığı özel bir durum görüyoruz. Burada profesör, gözlemlenen iki özelliğin (boynuzların ve toynakların varlığı) değerlerinin bilgisine dayanarak, korelasyon yasasına dayanarak, üçüncü özelliğin (bu hayvanın ait olduğu sınıf) ortalama değerini türetmiştir. bir otoburdur). Bu durumda, bu değişkenin belirli değerinden bahsetmiyoruz (yani, bu hayvan nominal ölçekte farklı değerler alabilir - keçi, koç veya boğa olabilir ...).
Şimdi "gerileme" terimine geçelim. Açıkçası, bu yöntemle çözülen istatistiksel problemlerin anlamı ile bağlantılı değildir. Terimin açıklaması, yalnızca özellikler arasındaki ilişkileri incelemek için yöntemlerin gelişim tarihi bilgisi temelinde verilebilir. Bu tür çalışmaların ilk örneklerinden biri, babaların ve çocuklarının büyümesi arasında gözlemlenebilir iki belirtiye göre bir model bulmaya çalışan istatistikçiler F. Galton ve K. Pearson'un çalışmalarıydı. X- babasının boyu ve U-çocukların büyümesi). Çalışmalarında, ortalama olarak uzun boylu babaların ortalama olarak uzun boylu çocuklar yetiştirdiği şeklindeki ilk hipotezi doğruladılar. Aynı ilke düşük babalar ve çocuklar için de geçerlidir. Ancak bilim adamları burada dursalardı, istatistik ders kitaplarında çalışmalarından asla bahsedilmezdi. Araştırmacılar, daha önce bahsedilen doğrulanmış hipotez içinde başka bir model buldular. Çok uzun babaların, ortalama olarak uzun boylu, ancak babaları ortalamanın üzerinde olmasına rağmen ortalama boydan çok farklı olmayan çocuklardan boy olarak çok farklı olmayan çocuklar ürettiklerini kanıtladılar. Aynı şey, çok kısa boylu babalar için de geçerlidir (kısa grubun ortalamasından sapan) - çocukları, ortalama olarak, babaları kısa olan akranlarından farklı değildi. Bu düzenliliği tanımlayan işlevi çağırdılar. regresyon fonksiyonu. Bu çalışmadan sonra benzer fonksiyonları tanımlayan ve benzer şekilde kurulan tüm denklemlere regresyon denklemleri denilmeye başlanmıştır.
Regresyon analizi- çok boyutlu yöntemlerden biri istatistiksel analiz bir bağımlı ve birkaç (veya bir) bağımsız değişken arasındaki ilişkileri incelemek veya modellemek için tasarlanmış bir dizi istatistiksel tekniği birleştiren veriler. İstatistikte kabul edilen geleneğe göre bağımlı değişken, yanıt olarak adlandırılır ve şu şekilde gösterilir: v Bağımsız değişkenler yordayıcı olarak adlandırılır ve şu şekilde gösterilir: x. Analiz süresince, bazı değişkenler yanıtla zayıf bir şekilde ilişkili olacak ve sonunda analizden çıkarılacaktır. Bağımlı olanla ilişkili kalan değişkenler de faktör olarak adlandırılabilir.
Regresyon analizi, başka bir değişkene (örneğin, eğitim düzeyine bağlı olarak geleneksel olmayan politik davranış eğilimi) veya birkaç değişkene bağlı olarak bir veya daha fazla değişkenin değerlerini tahmin etmeyi mümkün kılar. PC'de hesaplanır. Kontrol edilen özelliğin faktör olanlara bağımlılık derecesini ölçmenizi sağlayan bir regresyon denklemi derlemek için profesyonel matematikçi-programcıları dahil etmek gerekir. Regresyon analizi, siyasi bir durumun gelişimi için tahmin modelleri oluşturmada, sosyal gerilimin nedenlerini değerlendirmede ve teorik deneyler yürütmede paha biçilmez bir hizmet sağlayabilir. Regresyon analizi, bir dizi sosyo-demografik parametrenin vatandaşların seçim davranışları üzerindeki etkisini incelemek için aktif olarak kullanılır: cinsiyet, yaş, meslek, ikamet yeri, uyruk, gelir düzeyi ve niteliği.
Regresyon analizi ile ilgili olarak, kavramlar bağımsız ve bağımlı değişkenler. Bağımsız değişken, başka bir değişkende bir değişikliği açıklayan veya buna neden olan bir değişkendir. Bağımlı değişken, değeri ilk değişkenin etkisiyle açıklanan bir değişkendir. Örneğin 2004 yılında yapılan cumhurbaşkanlığı seçimlerinde belirleyici olan, yani; bağımsız değişkenler, ülke nüfusunun mali durumunun istikrarı, adayların popülerlik düzeyi ve faktör gibi göstergelerdi. görev Bu durumda adaylara verilen oy yüzdesi bağımlı değişken olarak kabul edilebilir. Benzer şekilde “seçmenin yaşı” ve “seçim faaliyetinin düzeyi” değişken çiftinde de birincisi bağımsız, ikincisi bağımlıdır.
Regresyon analizi, aşağıdaki sorunları çözmenizi sağlar:
- 1) Ci arasında istatistiksel olarak anlamlı bir ilişkinin varlığının veya yokluğunun gerçekliğini tespit etmek x;
- 2) regresyon fonksiyonunun en iyi (istatistiksel anlamda) tahminlerini oluşturun;
- 3) verilen değerlere göre X bilinmeyen için bir tahmin oluşturmak -de
- 4) her faktörün etkisinin özgül ağırlığını değerlendirin Xüzerinde -de ve buna göre önemsiz özellikleri modelden hariç tutun;
- 5) tanımlayarak nedensellik değişkenler arasında kısmen açıklayıcı değişkenlerin değerlerini ayarlayarak P değerlerini kontrol eder x.
Regresyon analizi, incelenen göstergenin değerini etkileyen karşılıklı olarak bağımsız değişkenleri seçme, regresyon denkleminin şeklini belirleme ve birincil sosyolojik verileri işlemek için istatistiksel yöntemler kullanarak parametreleri değerlendirme ihtiyacı ile ilişkilidir. Bu tür analiz, ilişkinin biçimi, yönü ve yakınlığı (yoğunluğu) fikrine dayanır. Ayırt etmek buhar odası ve çoklu regresyon Çalışılan özelliklerin sayısına bağlı olarak. Uygulamada, regresyon analizi genellikle korelasyon analizi ile birlikte gerçekleştirilir. Regresyon Denklemi Bir artma veya azalma eğilimi olarak ifade edilen nicelikler arasındaki sayısal ilişkiyi tanımlar. değişken diğerini artırırken veya azaltırken. Aynı zamanda razl ve h a yut l don ve doğrusal olmayan regresyon. Politik süreçleri tarif ederken, gerilemenin her iki çeşidi de eşit olarak bulunur.
Siyasi makalelerdeki ilgi bağımlılığının dağılımı için dağılım grafiği ( sen) ve katılımcıların eğitimi (X) doğrusal bir regresyondur (Şekil 30).
Pirinç. otuz.
Seçim faaliyeti seviyesinin dağılımı için dağılım grafiği ( sen) ve yanıtlayanın yaşı (A) (koşullu örnek) doğrusal olmayan bir regresyondur (Şekil 31).
Pirinç. 31.
Eşleştirilmiş bir regresyon modelinde iki özelliğin (A "ve Y) ilişkisini açıklamak için şunu kullanın: Doğrusal Denklem
burada a, özelliklerin değişimi ile denklem hatasının rastgele bir değeridir, yani denklemin "doğrusallıktan" sapması.
Katsayıları değerlendirmek için a ve b yöntemi kullan en küçük kareler, saçılım grafiğindeki her noktanın regresyon çizgisinden sapmalarının karelerinin toplamının minimum olması gerektiğini varsayan. Oranlar bir hb denklem sistemi kullanılarak hesaplanabilir:
En küçük kareler tahmini yöntemi, katsayıların bu tür tahminlerini verir. a ve b,çizginin koordinatlı noktadan geçtiği X ve y,şunlar. bir ilişki var de = balta + b. Regresyon denkleminin grafik gösterimi denir teorik regresyon çizgisi. Doğrusal bir bağımlılıkla, regresyon katsayısı grafikte teorik regresyon çizgisinin eğiminin x eksenine teğetini temsil eder. Katsayıdaki işaret, bağlantının yönünü gösterir. Sıfırdan büyükse ilişki doğrudan, küçükse terstir.
"Political Petersburg-2006" (Tablo 56) çalışmasından alınan aşağıdaki örnek, vatandaşların şu andaki yaşamlarından memnuniyet derecesine ilişkin algıları ile gelecekteki yaşam kalitesindeki değişikliklere ilişkin beklentileri arasında doğrusal bir ilişki göstermektedir. Bağlantı doğrudan, doğrusaldır (standartlaştırılmış regresyon katsayısı 0,233, anlamlılık düzeyi 0,000'dir). Bu durumda regresyon katsayısı yüksek olmamakla birlikte istatistiksel olarak anlamlı göstergenin alt sınırını (Pearson katsayısının istatistiksel olarak anlamlı göstergesinin karesinin alt sınırını) aşmaktadır.
Tablo 56
Vatandaşların şimdiki yaşam kalitesinin beklentiler üzerindeki etkisi
(St.Petersburg, 2006)
* Bağımlı değişken: "Önümüzdeki 2-3 yılda hayatınızın nasıl değişeceğini düşünüyorsunuz?"
Siyasi yaşamda, incelenen değişkenin değeri çoğu zaman aynı anda birkaç özelliğe bağlıdır. Örneğin, siyasi faaliyetin düzeyi ve niteliği aynı anda devletin siyasi rejimi, siyasi gelenekler, belirli bir bölgedeki insanların siyasi davranışlarının özellikleri ve yanıt verenin sosyal mikro grubu, yaşı, eğitimi, geliri tarafından etkilenir. seviye, siyasi yönelim vb. Bu durumda, denklemi kullanmanız gerekir. çoklu regresyon, aşağıdaki forma sahiptir:
nerede katsayı b.- kısmi regresyon katsayısı. Her bağımsız değişkenin bağımsız (çıktı) değişkenin değerlerini belirlemeye katkısını gösterir. Kısmi regresyon katsayısı 0'a yakınsa, bağımsız ve bağımlı değişkenler arasında doğrudan bir ilişki olmadığı sonucuna varabiliriz.
Böyle bir modelin hesaplanması, matris cebiri kullanılarak bir bilgisayarda gerçekleştirilebilir. Çoklu regresyon, sosyal bağların çok faktörlü doğasını yansıtmanıza ve her bir faktörün sonuçta ortaya çıkan özellik üzerindeki etki derecesini ayrı ayrı ve hep birlikte netleştirmenize olanak tanır.
katsayı belirtilen b, katsayı denir doğrusal regresyon ve faktör özelliğinin değişimi arasındaki ilişkinin gücünü gösterir. X ve etkili özelliğin varyasyonu Y Bu katsayı, özelliklerin mutlak ölçüm birimlerinde ilişkinin gücünü ölçer. Bununla birlikte, özelliklerin korelasyonunun yakınlığı, ortaya çıkan özelliğin standart sapması cinsinden de ifade edilebilir (böyle bir katsayıya korelasyon katsayısı denir). Regresyon katsayısının aksine b korelasyon katsayısı, özelliklerin kabul edilen ölçüm birimlerine bağlı değildir ve bu nedenle, herhangi bir özellik için karşılaştırılabilir. Genellikle, /> 0,7, orta sızdırmazlık - 0,5 g 0,5 ise bağlantı güçlü kabul edilir.
Bildiğiniz gibi, en yakın bağlantı işlevsel bir bağlantıdır, her bir değer Y değere benzersiz bir şekilde atanabilir x. Bu nedenle, korelasyon katsayısı 1'e ne kadar yakınsa, ilişki işlevsel olana o kadar yakındır. Regresyon analizi için anlamlılık düzeyi 0.001'i geçmemelidir.
Korelasyon katsayısı uzun zamandır özelliklerin ilişkisinin yakınlığının ana göstergesi olarak kabul edilmektedir. Ancak daha sonra belirleme katsayısı böyle bir gösterge haline geldi. Bu katsayının anlamı şu şekildedir - ortaya çıkan özelliğin toplam varyansının payını yansıtır. -de, özelliğin varyansıyla açıklanır x. Basitçe korelasyon katsayısının (0'dan 1'e değişen) karesini alarak bulunur ve doğrusal bir ilişki için payı 0'dan (%0) 1 (%100) karakteristik değerler Y,özelliğin değerleri tarafından belirlenir x. olarak kaydedilir ben 2 , ve SPSS paketindeki sonuçta ortaya çıkan regresyon analizi tablolarında - karesiz.
Çoklu regresyon denklemini oluşturmanın ana problemlerini gösterelim.
- 1. Regresyon denkleminde yer alan faktörlerin seçimi. Bu aşamada, araştırmacı önce teoriye göre incelenen olguyu belirleyen ana nedenlerin genel bir listesini derler. Daha sonra regresyon denklemindeki özellikleri seçmesi gerekir. Ana seçim kuralı, analize dahil edilen faktörlerin birbirleriyle mümkün olduğunca az korelasyon göstermesidir; sadece bu durumda, belirli bir faktör özelliğine nicel bir etki ölçüsü atfetmek mümkündür.
- 2. Çoklu Regresyon Denkleminin Formunun Seçilmesi(pratikte, doğrusal veya doğrusal-logaritmik daha sık kullanılır). Bu nedenle, çoklu regresyon kullanmak için, araştırmacı önce birkaç bağımsız değişkenin ortaya çıkan değişken üzerindeki etkisinin varsayımsal bir modelini oluşturmalıdır. Elde edilen sonuçların güvenilir olabilmesi için modelin gerçek süreçle birebir örtüşmesi yani değişkenler arasındaki ilişki doğrusal olmalıdır, tek bir anlamlı bağımsız değişken göz ardı edilemez, aynı şekilde incelenen süreçle doğrudan ilişkili olmayan tek bir değişken de analize dahil edilemez. Ek olarak, değişkenlerin tüm ölçümleri son derece doğru olmalıdır.
Yukarıdaki açıklamadan, bu yöntemin uygulanması için, çoklu regresyon analizi (MRA) prosedürüne ilerlemenin imkansız olduğu bir dizi koşul izlenir. Yalnızca aşağıdaki noktaların tümüne uyulması, regresyon analizini doğru bir şekilde yapmanızı sağlar.
Faktör ve sonuçtaki işaretler arasında bir korelasyonun varlığında, doktorlar genellikle bir işaretin değerinin, araştırmacının kendisi tarafından genel olarak kabul edilen veya kurulan bir ölçü birimi tarafından değiştirildiğinde ne kadar değişebileceğini belirlemek zorundadır.
Örneğin 1. sınıftaki okul çocuklarının (kız veya erkek) boyları 1 cm artarsa vücut ağırlıkları nasıl değişecektir Bu amaçla regresyon analizi yöntemi kullanılır.
Çoğu zaman, normatif ölçekler ve standartlar geliştirmek için regresyon analizi yöntemi kullanılır. fiziksel Geliştirme.
- regression'un tanımı. Regresyon, bir özelliğin ortalama değerine bağlı olarak, birincisi ile ilişkili olan başka bir özelliğin ortalama değerini belirlemeye izin veren bir fonksiyondur.
Bu amaçla, regresyon katsayısı ve bir dizi başka parametre kullanılır. Örneğin, sonbahar-kış döneminde ortalama aylık hava sıcaklığının belirli değerlerinde ortalama soğuk algınlığı sayısını hesaplayabilirsiniz.
- Regresyon katsayısının tanımı. Regresyon katsayısı, bir özelliğin değerinin, kendisiyle ilişkili başka bir özellik yerleşik ölçü birimine göre değiştiğinde ortalama olarak değiştiği mutlak değerdir.
- Regresyon katsayısı formülü. R y / x \u003d r xy x (σ y / σ x)
nerede R y / x - regresyon katsayısı;
r xy - x ve y özellikleri arasındaki korelasyon katsayısı;
(σ y ve σ x) - x ve y özelliklerinin standart sapmaları.Örneğimizde;
σ x = 4.6 (sonbahar-kış döneminde hava sıcaklığının standart sapması;
σ y = 8.65 (bulaşıcı soğuk algınlığı sayısının standart sapması).
Böylece, R y/x regresyon katsayısıdır.
R y / x \u003d -0,96 x (4,6 / 8,65) \u003d 1,8, yani aylık ortalama hava sıcaklığında (x) 1 derecelik bir düşüşle, sonbahar-kış döneminde ortalama bulaşıcı soğuk algınlığı sayısı (y) 1,8 vaka değişecektir. - Regresyon Denklemi. y \u003d M y + R y / x (x - M x)
burada y, başka bir özelliğin (x) ortalama değeri değiştiğinde belirlenmesi gereken özelliğin ortalama değeridir;
x - başka bir özelliğin bilinen ortalama değeri;
R y/x - regresyon katsayısı;
M x, M y - x ve y özelliklerinin bilinen ortalama değerleri.Örneğin, ortalama bulaşıcı soğuk algınlığı sayısı (y), aylık ortalama hava sıcaklığının (x) herhangi bir ortalama değerinde özel ölçümler yapılmadan belirlenebilir. Yani, x \u003d - 9 °, R y / x \u003d 1.8 hastalık, M x \u003d -7 °, M y \u003d 20 hastalık ise, o zaman y \u003d 20 + 1,8 x (9-7) \u003d 20 + 3,6 = 23,6 hastalık.
Bu denklem, iki özellik (x ve y) arasındaki düz çizgi ilişkisi durumunda uygulanır. - Regresyon denkleminin amacı. Regresyon denklemi, regresyon çizgisini çizmek için kullanılır. İkincisi, özel ölçümler olmaksızın, başka bir özelliğin değeri (x) değişirse, bir özelliğin herhangi bir ortalama değerini (y) belirlemeye izin verir. Bu verilere dayanarak bir grafik oluşturulur - regresyon hattı, ortalama soğuk algınlığı sayısını belirlemek için kullanılabilecek olan, aylık ortalama sıcaklığın herhangi bir değerinde, soğuk algınlığı sayısının hesaplanan değerleri arasındaki aralık dahilinde.
- Regresyon sigması (formül).
burada σ Ru/x - regresyonun sigması (standart sapma);
σ y, y özelliğinin standart sapmasıdır;
r xy - x ve y özellikleri arasındaki korelasyon katsayısı.Yani, σ y soğuk algınlığı sayısının standart sapması = 8,65 ise; r xy - sonbahar-kış döneminde (x) soğuk algınlığı sayısı (y) ile ortalama aylık hava sıcaklığı arasındaki korelasyon katsayısı - 0.96, o zaman
- sigma regresyonunun amacı. Ortaya çıkan özelliğin (y) çeşitliliğinin ölçüsünün bir özelliğini verir.
Örneğin, sonbahar-kış döneminde ortalama aylık hava sıcaklığının belirli bir değerinde soğuk algınlığı sayısının çeşitliliğini karakterize eder. Bu nedenle, x 1 \u003d -6 ° hava sıcaklığında ortalama soğuk algınlığı sayısı 15.78 hastalık ile 20.62 hastalık arasında değişebilir.
x 2 = -9°'de ortalama soğuk algınlığı sayısı 21,18 hastalıktan 26,02 hastalığa vb. kadar değişebilir.Regresyon sigma, etkili özelliğin değerlerinin regresyon çizgisinde çizilen ortalama değerinden sapmasını yansıtan bir regresyon ölçeğinin yapımında kullanılır.
- Regresyon ölçeğini hesaplamak ve çizmek için gerekli veriler
- regresyon katsayısı - Ry/x;
- regresyon denklemi - y \u003d M y + R y / x (x-M x);
- regresyon sigması - σ Rx/y
- Regresyon ölçeğinin hesaplama sırası ve grafik gösterimi.
- regresyon katsayısını formülle belirleyin (3. paragrafa bakın). Örneğin ortalama boy 1 cm değişirse vücut ağırlığının ortalama (cinsiyete göre belli bir yaşta) ne kadar değişeceği belirlenmelidir.
- regresyon denkleminin formülüne göre (4. paragrafa bakın), ortalamanın ne olacağını belirleyin, örneğin belirli bir büyüme değeri için vücut ağırlığı (y, y2, y3 ...) * (x, x2, x3 ...) .
________________
* "x" in bilinen en az üç değeri için "y" değeri hesaplanmalıdır.Aynı zamanda, belirli bir yaş ve cinsiyet için ortalama vücut ağırlığı ve boy (Mx ve M y) değerleri bilinmektedir.
- σ y ve r xy'nin karşılık gelen değerlerini bilerek ve bunların değerlerini formülde değiştirerek regresyonun sigmasını hesaplayın (6. paragrafa bakın).
- bilinen x 1, x 2, x 3 değerlerine ve bunlara karşılık gelen y 1, y 2 y 3 ortalama değerlerine ve ayrıca en küçük (y - σ ru / x) ve en büyüğüne (y + σ ru) dayalı / x) değerleri (y) bir regresyon ölçeği oluşturur.
Regresyon ölçeğinin grafik gösterimi için, x, x2 , x3 (y ekseni) değerleri önce grafikte işaretlenir, yani. örneğin vücut ağırlığının (y) boya (x) bağımlılığı gibi bir gerileme çizgisi oluşturulur.
Daha sonra karşılık gelen noktalarda y 1 , y 2 , y 3 işaretlenir Sayısal değerler regresyon sigması, yani grafikte en küçük olanı bulun ve en büyük değer y 1 , y 2 , y 3 .
- Regresyon ölçeğinin pratik kullanımı. Özellikle fiziksel gelişim için normatif ölçekler ve standartlar geliştirilmektedir. Standart ölçeğe göre, çocukların gelişiminin bireysel bir değerlendirmesini yapmak mümkündür. Aynı zamanda, örneğin, belirli bir yükseklikte, çocuğun vücut ağırlığı, belirli bir boy için (x) () vücut ağırlığının hesaplanan ortalama birimine bir regresyon sigma içindeyse, fiziksel gelişim uyumlu olarak değerlendirilir (x) ( y ± 1 σ Ry / x).
Çocuğun belirli bir boy için vücut ağırlığı ikinci regresyon sigması içindeyse, fiziksel gelişim vücut ağırlığı açısından uyumsuz kabul edilir: (y ± 2 σ Ry/x)
Belirli bir boy için vücut ağırlığı regresyonun üçüncü sigması (y ± 3 σ Ry/x) içindeyse, fiziksel gelişim hem aşırı hem de yetersiz vücut ağırlığı nedeniyle keskin bir şekilde uyumsuz olacaktır.
5 yaşındaki erkek çocukların fiziksel gelişimlerine ilişkin istatistiksel bir çalışmanın sonuçlarına göre, ortalama boylarının (x) 109 cm ve ortalama vücut ağırlıklarının (y) 19 kg olduğu bilinmektedir. Boy ve vücut ağırlığı arasındaki korelasyon katsayısı +0,9'dur, standart sapmalar tabloda gösterilmiştir.
Gerekli:
- regresyon katsayısını hesaplamak;
- regresyon denklemini kullanarak, x1 = 100 cm, x2 = 110 cm, x3 = 120 cm boyuna sahip 5 yaşındaki erkek çocukların beklenen vücut ağırlığının ne olacağını belirleyin;
- regresyon sigmasını hesaplayın, bir regresyon ölçeği oluşturun, çözümünün sonuçlarını grafiksel olarak sunun;
- uygun sonuçları çıkarmak.
Sorunun durumu ve çözümünün sonuçları özet tabloda sunulmuştur.
tablo 1
Sorunun koşulları | Problem çözümü sonuçları | ||||||||
regresyon denklemi | sigma regresyonu | regresyon ölçeği (beklenen canlı ağırlık (kg cinsinden)) | |||||||
M | σ | rxy | R y/x | X | -de | σRx/y | y - σ Rу/х | y + σ Rу/х | |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Yükseklik (x) | 109 santimetre | ± 4,4 cm | +0,9 | 0,16 | 100cm | 17,56 kilo | ± 0,35 kilo | 17,21 kilo | 17,91 kilo |
Vücut ağırlığı (y) | 19 kilo | ± 0,8 kilo | 110cm | 19,16 kilo | 18,81 kilo | 19,51 kilo | |||
120cm | 20,76 kilo | 20,41 kilo | 21,11 kilo |
Çözüm.
Çözüm. Böylece, vücut ağırlığının hesaplanan değerleri içindeki regresyon ölçeği, başka herhangi bir büyüme değeri için belirlemenize veya değerlendirmenize olanak tanır. kişisel Gelişimçocuk. Bunu yapmak için, regresyon çizgisine dikey olarak geri yükleyin.
- Vlasov V.V. epidemiyoloji. - M.: GEOTAR-MED, 2004. - 464 s.
- Lisitsin Yu.P. Halk sağlığı ve sağlık. Liseler için ders kitabı. - M.: GEOTAR-MED, 2007. - 512 s.
- Medik V.A., Yuriev V.K. Halk sağlığı ve sağlık hizmetleri üzerine bir ders dersi: Bölüm 1. Halk sağlığı. - M.: Tıp, 2003. - 368 s.
- Minyaev V.A., Vishnyakov N.I. ve diğerleri Sosyal tıp ve sağlık kuruluşu (2 ciltlik kılavuz). - St.Petersburg, 1998. -528 s.
- Kucherenko V.Z., Agarkov N.M. vb. Sosyal hijyen ve sağlık hizmetlerinin organizasyonu ( Öğretici) - Moskova, 2000. - 432 s.
- S. Glantz. Tıbbi-biyolojik istatistikler. İngilizce'den Per. - M., Uygulama, 1998. - 459 s.
Regresyon ve korelasyon analizi - istatistiksel araştırma yöntemleri. Bunlar, bir parametrenin bir veya daha fazla bağımsız değişkene bağımlılığını göstermenin en yaygın yollarıdır.
Aşağıda, somut pratik örnekler kullanarak, iktisatçılar arasında çok popüler olan bu iki analizi ele alacağız. Birleştirildiğinde sonuç elde edilmesine de bir örnek vereceğiz.
Excel'de Regresyon Analizi
Bazı değerlerin (bağımsız, bağımsız) bağımlı değişken üzerindeki etkisini gösterir. Örneğin, ekonomik olarak aktif nüfus sayısının işletme sayısına, ücretlere ve diğer parametrelere nasıl bağlı olduğu. Veya: yabancı yatırımlar, enerji fiyatları vb. GSYİH seviyesini nasıl etkiler?
Analiz sonucu önceliklendirme yapmanızı sağlar. Ve ana faktörlere dayanarak, gelişimi tahmin etmek, planlamak öncelikli alanlar yönetsel kararlar almak.
Gerileme olur:
- doğrusal (y = a + bx);
- parabolik (y = a + bx + cx 2);
- üstel (y = a * exp(bx));
- güç (y = a*x^b);
- hiperbolik (y = b/x + a);
- logaritmik (y = b * 1n(x) + a);
- üstel (y = a * b^x).
İnşaat örneğini düşünün Regresyon modeli Excel'de ve sonuçların yorumlanması. Doğrusal bir regresyon türü ele alalım.
Bir görev. 6 işletmede aylık ortalama maaş ve işten ayrılan çalışan sayısı analiz edildi. Emekli çalışan sayısının ortalama maaşa bağımlılığının belirlenmesi gerekmektedir.
Doğrusal regresyon modeli aşağıdaki forma sahiptir:
Y \u003d 0 + a 1 x 1 + ... + a k x k.
Burada a, regresyon katsayılarıdır, x, etkileyen değişkenlerdir ve k, faktörlerin sayısıdır.
Örneğimizde Y işten ayrılanların göstergesidir. Etkileyen faktör ücretlerdir (x).
Excel, bir doğrusal regresyon modelinin parametrelerini hesaplamak için kullanılabilecek yerleşik işlevlere sahiptir. Ancak Analysis ToolPak eklentisi bunu daha hızlı yapacaktır.
Güçlü bir analitik aracı etkinleştirin:
Etkinleştirildiğinde, eklenti Veri sekmesi altında bulunacaktır.
Şimdi doğrudan regresyon analizi ile ilgileneceğiz.
Öncelikle R-kare ve katsayılarına dikkat ediyoruz.
R-kare belirleme katsayısıdır. Örneğimizde, 0,755 veya %75,5'tir. Bu, modelin hesaplanan parametrelerinin çalışılan parametreler arasındaki ilişkiyi %75,5 oranında açıkladığı anlamına gelmektedir. Belirleme katsayısı ne kadar yüksek olursa, model o kadar iyi olur. İyi - 0,8'in üzerinde. Zayıf - 0,5'ten az (böyle bir analiz pek makul kabul edilemez). Örneğimizde - "fena değil".
64.1428 katsayısı, incelenen modeldeki tüm değişkenlerin 0'a eşit olması durumunda Y'nin ne olacağını gösterir. Yani, modelde açıklanmayan diğer faktörler de analiz edilen parametrenin değerini etkiler.
-0,16285 katsayısı, X değişkeninin Y üzerindeki ağırlığını gösterir. Yani, bu modeldeki ortalama aylık maaş, -0,16285 ağırlıkla işten ayrılanların sayısını etkiler (bu, küçük bir etki derecesidir). "-" işareti gösterir Kötü etkisi: maaş ne kadar yüksekse, işten ayrılma o kadar az olur. Hangisi adil.
Excel'de korelasyon analizi
Korelasyon analizi, bir veya iki örnekteki göstergeler arasında bir ilişki olup olmadığını belirlemeye yardımcı olur. Örneğin, makinenin çalışma süresi ile onarım maliyeti arasında, ekipman fiyatı ile çalışma süresi arasında, çocukların boy ve kiloları vb.
Bir ilişki varsa, o zaman bir parametredeki artışın diğerinde bir artışa (pozitif korelasyon) veya azalmaya (negatif) yol açması. Korelasyon analizi, analistin bir göstergenin değerinin diğerinin olası değerini tahmin edip edemeyeceğini belirlemesine yardımcı olur.
Korelasyon katsayısı r ile gösterilir. +1 ile -1 arasında değişir. Farklı alanlar için korelasyonların sınıflandırılması farklı olacaktır. Katsayı değeri 0 olduğunda, örnekler arasında doğrusal bir ilişki yoktur.
Korelasyon katsayısını bulmak için Excel'i nasıl kullanacağınızı düşünün.
CORREL fonksiyonu eşleştirilmiş katsayıları bulmak için kullanılır.
Görev: Bir torna tezgahının çalışma süresi ile bakım maliyeti arasında bir ilişki olup olmadığını belirleyin.
İmleci herhangi bir hücreye getirin ve fx düğmesine basın.
- "İstatistik" kategorisinde CORREL işlevini seçin.
- Argüman "Dizi 1" - ilk değer aralığı - makinenin süresi: A2: A14.
- Argüman "Dizi 2" - ikinci değer aralığı - onarım maliyeti: B2:B14. Tamam'ı tıklayın.
Bağlantı türünü belirlemek için, katsayının mutlak sayısına bakmanız gerekir (her faaliyet alanının kendi ölçeği vardır).
Birkaç parametrenin (2'den fazla) korelasyon analizi için "Veri Analizi" ("Analiz Paketi" eklentisi) kullanmak daha uygundur. Listede bir korelasyon seçmeniz ve bir dizi belirlemeniz gerekir. Herşey.
Ortaya çıkan katsayılar korelasyon matrisinde görüntülenecektir. Bunun gibi:
korelasyon-regresyon analizi
Pratikte bu iki teknik sıklıkla birlikte kullanılmaktadır.
Örnek:
Artık regresyon analizi verileri görülebilir.
Çalışmaları sırasında, öğrenciler çok sık olarak çeşitli denklemlerle karşılaşırlar. Bunlardan biri - regresyon denklemi - bu makalede ele alınmaktadır. Bu tür bir denklem, özellikle matematiksel parametreler arasındaki ilişkinin özelliklerini tanımlamak için kullanılır. Bu eşitlik türü istatistik ve ekonometride kullanılır.
regression'un tanımı
Matematikte regresyon, bir veri kümesinin ortalama değerinin başka bir niceliğin değerlerine bağımlılığını tanımlayan belirli bir nicelik olarak anlaşılır. Regresyon denklemi, belirli bir özelliğin fonksiyonu olarak başka bir özelliğin ortalama değerini gösterir. Regresyon fonksiyonu şu şekildedir: basit denklem y \u003d x, burada y bağımlı değişkendir ve x bağımsız değişkendir (özellik faktörü). Aslında, regresyon y = f (x) şeklinde ifade edilir.
Değişkenler arasındaki ilişki türleri nelerdir?
Genel olarak, iki karşıt ilişki türü ayırt edilir: korelasyon ve regresyon.
Birincisi, koşullu değişkenlerin eşitliği ile karakterize edilir. Bu durumda hangi değişkenin diğerine bağlı olduğu kesin olarak bilinmemektedir.
Değişkenler arasında eşitlik yoksa ve koşullar hangi değişkenin açıklayıcı hangisinin bağımlı olduğunu söylüyorsa o zaman ikinci tip bir bağlantının varlığından söz edebiliriz. Doğrusal bir regresyon denklemi oluşturmak için, ne tür bir ilişkinin gözlemlendiğini bulmak gerekli olacaktır.
Regresyon türleri
Bugüne kadar 7 farklı regresyon türü vardır: hiperbolik, doğrusal, çoklu, doğrusal olmayan, ikili, ters, logaritmik doğrusal.
Hiperbolik, doğrusal ve logaritmik
Doğrusal regresyon denklemi, denklemin parametrelerini açık bir şekilde açıklamak için istatistiklerde kullanılır. y = c + m * x + E gibi görünüyor. Hiperbolik denklem normal bir hiperbol y \u003d c + m / x + E şeklindedir. Logaritmik olarak doğrusal denklem, logaritmik işlevi kullanarak ilişkiyi ifade eder: In y \u003d In c + m * In x + In E.
Çoklu ve doğrusal olmayan
iki tane daha karmaşık tipler regresyonlar çokludur ve doğrusal değildir. Çoklu regresyon denklemi, y \u003d f (x 1, x 2 ... x c) + E işleviyle ifade edilir. Bu durumda y bağımlı değişken ve x açıklayıcı değişkendir. E değişkeni stokastiktir ve denklemdeki diğer faktörlerin etkisini içerir. Doğrusal olmayan regresyon denklemi biraz tutarsızdır. Bir yandan dikkate alınan göstergeler açısından doğrusal değildir, diğer yandan göstergeleri değerlendirme rolünde doğrusaldır.
Ters ve İkili Regresyonlar
Ters, doğrusal bir forma dönüştürülmesi gereken bir tür fonksiyondur. En geleneksel uygulama programlarında, y \u003d 1 / c + m * x + E işlevi biçimindedir. Eşleştirilmiş regresyon denklemi, veriler arasındaki ilişkiyi y = f(x) + E'nin bir fonksiyonu olarak gösterir. Tıpkı diğer denklemler gibi, y de x'e bağlıdır ve E stokastik bir parametredir.
korelasyon kavramı
Bu, iki fenomen veya süreç arasında bir ilişkinin varlığını gösteren bir göstergedir. İlişkinin gücü bir korelasyon katsayısı olarak ifade edilir. Değeri [-1;+1] aralığında dalgalanır. Negatif bir gösterge varlığını gösterir geri bildirim, pozitif - düz bir çizgi hakkında. Katsayı 0'a eşit bir değer alıyorsa, ilişki yoktur. Değer 1'e ne kadar yakınsa - parametreler arasındaki ilişki ne kadar güçlüyse, 0'a o kadar yakın - zayıf.
Yöntemler
Korelasyon parametrik yöntemleri, ilişkinin sıkılığını tahmin edebilir. Normal dağılım yasasına uyan parametreleri incelemek için dağılım tahminlerine dayalı olarak kullanılırlar.
Doğrusal regresyon denkleminin parametreleri, bağımlılık türünü, regresyon denkleminin işlevini belirlemek ve seçilen ilişki formülünün göstergelerini değerlendirmek için gereklidir. Korelasyon alanı, bir ilişkiyi tanımlamak için bir yöntem olarak kullanılır. Bunu yapmak için, mevcut tüm verilerin grafiksel olarak gösterilmesi gerekir. Dikdörtgen iki boyutlu bir koordinat sisteminde, bilinen tüm veriler çizilmelidir. Korelasyon alanı bu şekilde oluşur. Açıklayıcı faktörün değeri apsis boyunca işaretlenirken, bağımlı faktörün değerleri ordinat boyunca işaretlenir. Parametreler arasında işlevsel bir ilişki varsa, bir çizgi şeklinde sıralanırlar.
Bu tür verilerin korelasyon katsayısı% 30'dan azsa, bağlantının neredeyse tamamen yokluğundan bahsedebiliriz. %30 ile %70 arasında ise orta sıkılıkta bağlantıların varlığına işaret eder. %100 göstergesi, işlevsel bir bağlantının kanıtıdır.
Doğrusal olmayan bir regresyon denklemi, tıpkı doğrusal bir denklem gibi, bir korelasyon indeksi (R) ile desteklenmelidir.
Çoklu Regresyon için Korelasyon
Belirleme katsayısı, çoklu korelasyonun karesinin bir göstergesidir. Sunulan göstergeler dizisinin incelenen özellikle ilişkisinin sıkılığından bahsediyor. Parametrelerin sonuç üzerindeki etkisinin doğası hakkında da konuşabilir. Çoklu regresyon denklemi bu gösterge kullanılarak değerlendirilir.
Çoklu korelasyon indeksini hesaplamak için indeksini hesaplamak gerekir.
en küçük kareler yöntemi
Bu yöntem, regresyon faktörlerini tahmin etmenin bir yoludur. Özü, faktörün fonksiyona bağımlılığı nedeniyle elde edilen kare sapmaların toplamını en aza indirmekte yatmaktadır.
Böyle bir yöntem kullanılarak bir eşleştirilmiş doğrusal regresyon denklemi tahmin edilebilir. Bu tür denklemler, ikili bir doğrusal ilişkinin göstergeleri arasında tespit edilmesi durumunda kullanılır.
Denklem Seçenekleri
Doğrusal regresyon fonksiyonunun her parametresinin belirli bir anlamı vardır. Eşleştirilmiş doğrusal regresyon denklemi iki parametre içerir: c ve m. t parametresi, x değişkenindeki bir geleneksel birim azalmaya (artışa) bağlı olarak y fonksiyonunun son göstergesindeki ortalama değişimi gösterir. x değişkeni sıfırsa, fonksiyon c parametresine eşittir. x değişkeni sıfır değilse, c faktörü ekonomik olarak anlamlı değildir. Fonksiyon üzerindeki tek etki c faktörünün önündeki işarettir. Eksi varsa, faktöre kıyasla sonuçta yavaş bir değişiklik olduğunu söyleyebiliriz. Bir artı varsa, bu, sonuçta hızlandırılmış bir değişikliği gösterir.
Regresyon denkleminin değerini değiştiren her parametre bir denklem cinsinden ifade edilebilir. Örneğin, c faktörü c = y - mx şeklindedir.
Gruplanmış veriler
Tüm bilgilerin x özelliğine göre gruplandırıldığı, ancak aynı zamanda belirli bir grup için bağımlı göstergenin karşılık gelen ortalama değerlerinin gösterildiği görev koşulları vardır. Bu durumda, ortalama değerler, göstergenin x'e nasıl bağlı olduğunu karakterize eder. Böylece, gruplanmış bilgiler regresyon denkleminin bulunmasına yardımcı olur. Bir ilişki analizi olarak kullanılır. Ancak, bu yöntemin sakıncaları vardır. Ne yazık ki, ortalamalar genellikle dış dalgalanmalara tabidir. Bu dalgalanmalar, ilişkinin kalıplarının bir yansıması değil, sadece onun "gürültüsünü" maskeliyor. Ortalamalar, doğrusal bir regresyon denkleminden çok daha kötü ilişki kalıpları gösterir. Ancak, bir denklem bulmak için bir temel olarak kullanılabilirler. Belirli bir popülasyonun büyüklüğünü karşılık gelen ortalamayla çarparak, grup içindeki y'nin toplamını elde edebilirsiniz. Ardından, alınan tüm miktarları devre dışı bırakmanız ve son y göstergesini bulmanız gerekir. Toplam göstergesi xy ile hesaplama yapmak biraz daha zordur. Aralıkların küçük olması durumunda, koşullu olarak tüm birimler için (grup içindeki) x göstergesini aynı alabiliriz. x ve y'nin çarpımlarının toplamını bulmak için y'nin toplamı ile çarpın. Ayrıca, tüm toplamlar bir araya getirilir ve toplam xy toplamı elde edilir.
Çoklu Çiftli Denklem Regresyonu: Bir İlişkinin Önemini Değerlendirmek
Daha önce tartışıldığı gibi, çoklu regresyonun y \u003d f (x 1, x 2, ..., x m) + E şeklinde bir işlevi vardır. Çoğu zaman, böyle bir denklem, mallar için arz ve talep problemini çözmek, geri alınan hisse senetleri üzerindeki faiz gelirini çözmek, üretim maliyeti fonksiyonunun nedenlerini ve türünü incelemek için kullanılır. Ayrıca çok çeşitli makroekonomik çalışmalarda ve hesaplamalarda aktif olarak kullanılmaktadır, ancak mikroekonomi düzeyinde bu denklem biraz daha az kullanılmaktadır.
Çoklu regresyonun ana görevi, faktörlerin her birinin bireysel olarak ve bütün olarak modellenecek gösterge ve katsayıları üzerindeki etkisinin ne olduğunu daha fazla belirlemek için büyük miktarda bilgi içeren bir veri modeli oluşturmaktır. Regresyon denklemi çeşitli değerler alabilir. Bu durumda, ilişkiyi değerlendirmek için genellikle iki tür fonksiyon kullanılır: doğrusal ve doğrusal olmayan.
Doğrusal bir fonksiyon, böyle bir ilişki biçiminde tasvir edilir: y \u003d a 0 + a 1 x 1 + a 2 x 2, + ... + a m x m. Bu durumda a2, a m , "saf" regresyonun katsayıları olarak kabul edilir. Diğer göstergelerin sabit bir değerinin olması koşuluyla, y parametresindeki ortalama değişikliği, karşılık gelen her bir x parametresindeki bir değişiklikle (azalma veya artış) bir birim olarak karakterize etmek gerekir.
Doğrusal olmayan denklemler, örneğin, y=ax 1 b1 x 2 b2 ...x m bm güç fonksiyonu biçimindedir. Bu durumda, göstergeler b 1, b 2 ..... b m - esneklik katsayıları olarak adlandırılır, karşılık gelen x göstergesinde% 1'lik bir artış (azalma) ile sonucun nasıl (% ne kadar) değişeceğini gösterirler. ve diğer faktörlerin istikrarlı bir göstergesi ile.
Çoklu regresyon oluştururken hangi faktörler dikkate alınmalıdır?
Doğru bir çoklu regresyon oluşturmak için hangi faktörlere özel dikkat gösterilmesi gerektiğini bulmak gerekir.
Ekonomik faktörler ile modellenen arasındaki ilişkinin doğası hakkında biraz anlayışa sahip olmak gereklidir. Dahil edilecek faktörler aşağıdaki kriterleri karşılamalıdır:
- Ölçülebilir olmalıdır. Bir nesnenin kalitesini tanımlayan bir faktörün kullanılabilmesi için her halükarda niceliksel bir formun verilmesi gerekir.
- Faktörler arası korelasyon veya fonksiyonel ilişki olmamalıdır. Bu tür eylemler çoğu zaman geri dönüşü olmayan sonuçlara yol açar - sıradan denklemler sistemi koşulsuz hale gelir ve bu, güvenilmezliğini ve bulanık tahminlerini gerektirir.
- Büyük bir korelasyon göstergesi durumunda, faktörlerin göstergenin nihai sonucu üzerindeki izole etkisini bulmanın bir yolu yoktur, bu nedenle katsayılar yorumlanamaz hale gelir.
İnşaat Yöntemleri
var büyük miktar denklem için faktörleri nasıl seçebileceğinizi açıklayan yöntem ve teknikler. Ancak, tüm bu yöntemler, korelasyon indeksini kullanarak katsayıların seçimine dayanmaktadır. Aralarında:
- Dışlama yöntemi.
- Yöntemi açın.
- Aşamalı regresyon analizi.
İlk yöntem, toplam kümeden tüm katsayıların elenmesini içerir. İkinci yöntem, birçok ek faktörün dahil edilmesini içerir. Üçüncüsü, daha önce denkleme uygulanan faktörlerin ortadan kaldırılmasıdır. Bu yöntemlerin her birinin var olma hakkı vardır. Artıları ve eksileri var, ancak gereksiz göstergeleri eleme sorununu kendi yöntemleriyle çözebilirler. Kural olarak, her bir yöntemle elde edilen sonuçlar oldukça yakındır.
Çok değişkenli analiz yöntemleri
Faktörleri belirlemeye yönelik bu tür yöntemler, birbiriyle ilişkili özelliklerin bireysel kombinasyonlarının dikkate alınmasına dayanır. Bunlar, ayırt edici analiz, örüntü tanıma, temel bileşen analizi ve küme analizini içerir. Ayrıca faktör analizi de vardır ancak bileşen yönteminin gelişmesi sonucunda ortaya çıkmıştır. Hepsi belirli koşullarda, belirli koşullar ve faktörler altında uygulanır.