Processing math: 100%


Regresi Nonparametrik Spline Truncated


Pada halaman ini akan dibahas mengenai Regresi Nonparametrik Spline Truncated. Semua informasi ini kami rangkum dari berbagai sumber. Semoga memberikan faedah bagi kita semua.
Regresi spline merupakan suatu regresi polinomial dimana segmen-segmen polinomial yang berbeda digabungkan bersama pada titik-titik knot λ1,λ2,,λq dan kontinu sehingga bersifat fleksibel dibandingkan polinomial biasa. Kurva regresi spline mempunyai titik knot yang maksudnya adalah titik perpaduan bersama dimana terjadi perubahan perilaku kurva.

Apa itu Regresi Nonparametrik?
Simak ulasannya di artikel: Analisis Regresi: Parametrik, Nonparametrik dan Semiparametrik

Kurva regresi spline dapat menyesuaikan diri secara efektif terhadap perubahan perilaku data, sehingga didapatkan hasil yang mendekati kebenaran (Eubank, 1999). Menurut Cox & O'Sullivan (1996), Kurva regresi spline memiliki kemampuan yang sangat baik untuk menangani data yang perilakunya berubah-ubah pada sub-sub interval tertentu. Menurut Budiantara (2009), model regresi spline mempunyai interpretasi statistik dan interpretasi visual yang sangat khusus dan sangat baik.
Diberikan data berpasangan (xi,yi), i=1,2,,n, dimana yi adalah variabel respon dan xi adalah variabel prediktor. Pola hubungan yi dan xi dapat dinyatakan dalam model regresi yi=f(xi)+εi . Selanjutnya jika kurva regresi f(xi) dihampiri dengan kurva regresi spline truncated, maka f(xi)=β0+β1xi++βpxpi+λ1(xiλ1)p+++λq(xiλq)p+=pk=0βkxki+ql=1λl(xiλl)p+, dimana (xiλl)p+={(xiλl)p    , xiλl  0                    , xi<λl . Kurva regresi f(xi) merupakan kurva regresi nonparametrik spline truncated derajat p dengan banyaknya titik knot q. Derajat p merupakan derajat pada p
Diberikan data berpasangan (xi,yi), i=1,2,,n, dimana yi adalah variabel respon dan xi adalah variabel prediktor. Pola hubungan yi dan xi dapat dinyatakan dalam model regresi yi=f(xi)+εi . Selanjutnya jika kurva regresi f(xi) dihampiri dengan kurva regresi spline truncated, maka f(xi)=β0+β1xi++βpxpi+λ1(xiλ1)p+++λq(xiλq)p+=pk=0βkxki+ql=1λl(xiλl)p+, dimana (xiλl)p+={(xiλl)p    , xiλl  0                    , xi<λl . Kurva regresi f(xi) merupakan kurva regresi nonparametrik spline truncated derajat p dengan banyaknya titik knot q. Derajat p merupakan derajat pada persamaan polinomial. Biasanya digunakan p = 1, 2 atau 3, karena untuk derajat kurva regresi di atasnya (lebih dari 3) bisa didekati dengan bentuk kurva polinomial tersebut. Kurva regresi polinomial derajat 1 biasa disebut dengan kurva regresi linier, kurva regresi polinomial derajat 2 biasa disebut dengan kurva regresi kuadratik, sedangkan kurva regresi polinomial derajat 3 biasa disebut dengan kurva regresi kubik. Titik-titik knot λ1,λ2,,λq adalah titik-titik knot yang menunjukkan pola perilaku dari kurva pada sub-sub interval yang berbeda, dimana λ1<λ2<<λq. Jika pendekatan regresi spline truncated memiliki derajat p = 1, maka akan menjadi regresi spline linier truncated, dimana bentuk model regresinya akan menjadi f(xi)=β0+β1xi+λ1(xiλ1)+++λq(xiλq)+=β0+β1xi+ql=1λl(xiλl)+. Jika persamaan kurva regresi nonparametrik spline truncated untuk i=1 sampai dengan i=n digabungkan ke dalam bentuk persamaan vektor dan matriks akan menjadi [f(x1)f(x2)f(xn)]=[1x1xp1(x1λ1)p+(x1λq)p+1x2xp2(x2λ1)p+(x2λq)p+1xnxpn(xnλ1)p+(xnλq)p+][β0β1βpλ1λ2λq]  Dalam notasi matriks dapat ditulis menjadi f(x)=X(λ)θ , dimana f(x)=[f(x1)f(x2)f(xn)] ,          θ=[β0β1βpλ1λ2λq] , X(λ)=[1x1xp1(x1λ1)p+(x1λq)p+1x2xp2(x2λ1)p+(x2λq)p+1xnxpn(xnλ1)p+(xnλq)p+]. Vektor f(x) berukuran n×1, matriks X(λ) berukuran n×(p+q+1), sedangkan vektor θ berukuran (p+q+1)×1. Sebelum estimasi terhadap kurva regresi f(x), terlebih dahulu dilakukan estimasi terhadap parameter θ. Estimasi parameter θ dilakukan dengan menggunakan metode MLE. Fungsi likelihood yang diberikan adalah L(θ,σ2|λ)=ni=112πσ2exp(12σ2ε2i)=(2πσ2)n2exp(12σ2λ2)=(2πσ2)n2exp(12σ2yG(λ)θ2). Estimator MLE yang dihasilkan adalah ˆθ(λ)=[(X(λ))TX(λ)]1(X(λ))Ty. Dengan demikian, estimasi dari kurva regresi f(x) adalah ˆfλ(x)=X(λ)[(X(λ))TX(λ)]1(X(λ))Ty=S(λ)y, dimana: S(λ)=X(λ)[(X(λ))TX(λ)]1(X(λ))T . Vektor ˆfλ(x) dan ˆθ(λ) memiliki ukuran yang sama dengan vektor parameternya. Sedangkan matriks S(λ) berukuran n×(p+q+1).

Titik-titik knot merupakan pengontrol keseimbangan antara kemulusan kurva dan kesesuaian kurva terhadap data. Pemilihan banyaknya titik knot, lokasi titik-titik knot optimum dapat dilakukan salah satunya dengan metode Generalized Cross Validation atau GCV (Eubank, 1999). GCV(λ)=MSE(λ)(n1tr(IS(λ)))2, dimana MSE(λ)=n1ni=1(yiˆg(xi))2. Pemilihan banyaknya titik knot dan lokasi titik-titik knot optimum dilakukan dengan melihat nilai GCV yang minimum.

Baca Regresi Nonparametrik yang lain: Regresi Nonparametrik Kernel

Referensi:
  • Budiantara, I. N. (2009). Spline dalam Regresi Nonparametrik dan Semiparametrik: Sebuah Pemodelan Statistika Masa Kini dan Masa Mendatang. Surabaya: ITS Press.
  • Cox, D. D., & O'Sullivan, F. (1996). "Penalized Type Estimator for Generalized Nonparametric Regression". Journal of Multivariate Analysis, Vol. 56, No. 10, hal. 185-206.
  • Eubank, R. L. (1999). Nonparametric Regression and Spline Smoothing. New York: Marcel Dekker, Inc.
Dalam:

Share:


Anda Juga Bisa Baca

Tidak ada komentar:

Posting Komentar