Σελίδα 7 από 15
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Παρ Ιαν 22, 2010 5:54 pm
από sfod
αχα!μαλιστα θα τη ξεκινήσω από αυριο την εργασία-πιστεύω θα δουλέψει έτσι..thanks!
παντως δεν ακούγεται μπακάλικο αυτό..anyway
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Παρ Ιαν 22, 2010 5:59 pm
από O kanenas
Μπακάλικος τρόπος είναι να το κάνεις με το χέρι, όπως έκανε η maria_20, ενώ μπορείς να γράψεις μερικές γραμμές κώδικα που να κάνει τη δουλειά.
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Παρ Ιαν 22, 2010 7:40 pm
από 1/2rizax
Απορία: Πώς γίνεται ο έλεγχος γραμμικότητας αν η επεξηγηματική μεταβλητή είναι κατηγορική? Το γράφημα προφανώς έχει σημεία μόνο πάνω στις ευθείες x=0 και x=1!
Δείξε ότι οι μεταβλητές σου είναι ασυσχέτιστες πχ. cor(X4,X1) κλπ. Ύστερα εφάρμοσε αυτό που λέει στη σελ. 60, ότι δηλαδή αφού οι μεταβλητές είναι ασυσχέτιστες μας αρκεί να ελέγξουμε τα υπόλοιπα του γενικού μοντέλου.
Υπάρχει νόημα στον έλεγχο γραμμικότητας μεταξύ μιας ποσοτικής και μιας ποιοτικής μεταβλητής?
Όχι, αφού στην ουσία το αποτέλεσμά σου δεν είναι ευθεία, αλλά 2 αναμενόμενες τιμές, μία για την ομάδα 0 και μία για την ομάδα 1. Μπορείς να ελέγξεις τη γραμμικότητα της Υ ως προς τις ποσοτικές μεταβλητές και ύστερα να περάσεις κατευθείαν στον έλεγχο υπολοίπων.
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Σάβ Ιαν 23, 2010 3:22 pm
από O kanenas
1/2rizax έγραψε:Δείξε ότι οι μεταβλητές σου είναι ασυσχέτιστες πχ. cor(X4,X1) κλπ. Ύστερα εφάρμοσε αυτό που λέει στη σελ. 60, ότι δηλαδή αφού οι μεταβλητές είναι ασυσχέτιστες μας αρκεί να ελέγξουμε τα υπόλοιπα του γενικού μοντέλου.
Δεν μου βγαίνουν ασυσχέτιστες οι μεταβλητές. Αυτό που σκέφτομαι να κάνω είναι να ελέγξω τη γραμμικότητα των μερικών υπολοίπων των ποσοτικών μεταβλητών και από κει και πέρα να του γράψω ότι δεν έχει νόημα να ελέγξω τη γραμμικότητα μεταξύ μιας ποσοτικής και μιας ποιοτικής μεταβλητής. Το προχωράω καλά?
Μετά θα κάνω και τους υπόλοιπους ελέγχους.
Το ξέρω ότι σας έχω πρήξει στις ερωτήσεις, αλλά προσπαθώ να κάνω ό,τι μπορώ για να ανταποδώσω απαντώντας κι εγώ σε άλλες απορίες που μπορώ να απαντήσω.
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Σάβ Ιαν 23, 2010 4:02 pm
από aeriko
Σχετικά με τη γραμμικότητα.....
Με τα residuals.....
'Οπως κάνει στη σελ.69 στις σημειώσεις του......
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Σάβ Ιαν 23, 2010 4:19 pm
από 1/2rizax
Και εγώ αυτό έκανα. Δεν μπορώ να σκεφτώ κάτι παραπάνω που να μπορείς να κάνεις.
Αν μπορεί κάποιος να παραθέσει ένα κώδικα για το τελευταιο ερωτημα γιατί τα χω μπλέξει με τα if και τα else και ακρη δν βγάζω θα το εκτιμούσα ιδιαιτέρως!
Όταν λέω με το χέρι, εννοώ:
> x<-rep(1:68)
> x<-sample(x,3)
> x
[1] 35 65 18
> Y<-Y[-65,]
> Y<-Y[-35,]
> Y<-Y[-18,]
Δεν πρόκειται να στο πάρει λάθος αν το γράψεις έτσι και δε θα μπλέξεις και με κάποιον κώδικα.
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Κυρ Ιαν 24, 2010 11:27 pm
από mojo-jojo
mipws mporei kapoios na voithisei sto erwtima ix????xrisimopoioumai tin predict??pws orizoume oti tha vriskete voreiodutika??
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Κυρ Ιαν 24, 2010 11:36 pm
από aeriko
'Ολες τις προυποθέσεις που ζητάει μπορείς να τις βάλεις σε παρένθεση μετά το predict....Δες και στις σημειώσεις, σελ.40..
Βορειοδυτικά, είναι ΝΕ=1 ...
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Δευ Ιαν 25, 2010 1:20 pm
από mojo-jojo
ok..thanks!!
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Τρί Ιαν 26, 2010 12:11 am
από maria_20
Eυχαριστώ παιδιά για τη βοήθεια πριν αν κ κρατησα τον μπακαλιστικό μου τρόπο(:P)
Όσον αφορά το x ερωτημα εχω χρησιμοποιήσει τον εξής κώδικα:
AGE_NEW<-rep(1,65)
AGE_NEW[AGE<=10]<-0
AGE_NEW[AGE>10&AGE<=20]<-1
AGE_NEW[AGE>20]<-3
AGE_NEW<-factor(AGE_NEW)
resultsnew1<-lm(data$PRICE~data$SQFT+AGE_NEW+data$NE+data$COR)
resultsnew1
όμως μου πετάει κάτι κουλά.. εκει με το AGE_NEW1 AGE_NEW3 εννοώ αντι να έχει απλά AGE_NEW μήπως κάνω κάποιο λάθος ή απλά βγαίνει έτσι λόγω του ορισμού της AGE_NEW;
Call:
lm(formula = data$PRICE ~ data$SQFT + AGE_NEW + data$NE + data$COR)
Coefficients:
(Intercept) data$SQFT AGE_NEW1 AGE_NEW3 data$NE data$COR
80.5032 0.6408 -173.0334 -209.3358 95.1811 -66.6147
E
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Τρί Ιαν 26, 2010 12:30 am
από 1/2rizax
Όχι σωστό είναι. Αφού η μεταβλητή έχει 3 στάθμες η R θα πάρει την μία ώς κατηγορία αναφοράς, και θα σου εμφανίσει τις άλλες δύο. Μονάχα άλλαξε το 3 σε 2 εδώ:
AGE_NEW[AGE>20]<-3
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Τρί Ιαν 26, 2010 12:51 am
από maria_20
Σ ευχαριστω ρε συ να σαι καλα!
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Τετ Ιαν 27, 2010 2:58 am
από maria_20
Όσον αφορά το ερώτημα (xi) εκεί που ελέγχω τις προϋποθέσεις του μοντέλου,
εφόσον η AGE_NEW είναι κατηγορική μεταβλητή θα έλεγξω μόνο μ' ένα διάγραμμα διασποράς μεταξύ της PRICE και της SQFT τη γραμμικότητα?
Ουσιαστικά η μόνη ποσοτική μεταβλητή πλέον είναι SQFT και δεν έχει νόημα ο έλεγχος γραμμικότητας μεταξύ ποσοτικών και κατηγορικών μεταβλητών λέω εγώ τώρα...
thnx in advance!!!

))
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Τετ Ιαν 27, 2010 5:15 pm
από O kanenas
Εγώ πάντως κάπως έτσι όπως λες το έκανα.
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Πέμ Ιαν 28, 2010 2:08 am
από maria_20
εστειλα κ mail στο Φουσκακη. ελεγχο γραμμικότητας μονο μεταξυ ποσοτικων μεταβλητων κανουμε αρα σωστα πιστευω τα καναμε! (

συγκίνιση... χαχαχα)