Σελίδα 8 από 15
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Σάβ Ιαν 30, 2010 9:27 pm
από sfod
κάτι γενικό για τον συμβολισμό στην εργασία: θα ήταν λάθος αν χρησιμοποιούσα τα ονόματα των μεταβλητών αντί για Y ,x1,x2 κλπ? και στο τέλος να γράψω το μοντέλο μ με τα y,x ορίζοντας τι είναι το καθένα?
Επίδης maria20 εντέλει έχει διαφορά το na.omit από το na.exclude που χρησιμοποίησες?
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Σάβ Ιαν 30, 2010 10:46 pm
από 1/2rizax
Δηλαδή κάτι του στυλ lm(PRICE~AGE+SQFT) ; Γιατί να στο πάρει λάθος; Μάλιστα το ζητάει στο 1ο ερώτημα να δώσουμε ονόματα στις μεταβλητές, οπότε πιο φυσιολογικό θα ήταν να τις αφήσεις με τα ονόματα αυτά.
Νομίζω η διαφορά μεταξύ na.omit και na.exclude είναι ότι η 1η αφαιρεί τα ΝΑ εντελώς, ενώ η 2η τα αφαιρεί μεν, αλλά θυμάται ότι υπάρχουν. Έτσι αν γράψεις πχ.
> options(na.action=na.exclude)
> fitted(lm(Y[,1]~Y[,3]))
θα πάρεις στο αποτέλεσμα και μερικά ΝΑ όταν του ζητήσεις να σου γράψει εκτίμηση σε missing value. Στη συγκεκριμένη άσκηση δεν πρέπει να έχει διαφορά.
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Σάβ Ιαν 30, 2010 11:20 pm
από maria_20
όπως τα λεει για την exclude.
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Κυρ Ιαν 31, 2010 12:13 am
από sfod
Ναι 1/2 rizax αυτό εννούσα!
thanks-επομένως δεν θα το πάρει λάθος και με omit..οκ ευχαριστώ παιδιά

Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Κυρ Ιαν 31, 2010 8:57 pm
από sfod
Στο vi που ζητάει το γενικό γραμμικό μοντέλο-δεν πρέπει να σκεφτούμε και το οτι δυο απο τις 4 επεξηγ.μετ.είναι ποιοτικές?
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Κυρ Ιαν 31, 2010 9:11 pm
από O kanenas
Είναι κατηγορικές, αλλά έχουν μόνο δύο κατηγορίες, οπότε είτε τις ορίσεις ως κατηγορικές στην R (ne<-as.factor(ne)) είτε όχι, το ίδιο αποτέλεσμα θα έχεις. Οι εικονικές μεταβλητές έχουν κάποιο νόημα όταν η κατηγορική σου μεταβλητή έχει πάνω από δύο κατηγορίες, αν αυτό εννοείς με την ερώτησή σου.
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Κυρ Ιαν 31, 2010 10:05 pm
από sfod
το ξέρω ότι δεν θα εχει διαφορά το αποτέλεσμα-το τσέκαρα
ρωτάω αν είμαστε θεωρητικά σωστοί συμπεριλαμβάνοντας τις 2 κατηγορικές μεταβλητές χωρίς να ορίσουμε ne<-as.factor(ne) κλπ..

Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Κυρ Ιαν 31, 2010 10:22 pm
από O kanenas
Πιστεύω πως αν εξηγήσεις τους λόγους για τους οποίους δεν δίνεις την εντολή as.factor σ'αυτή τη περίπτωση, είσαι από κάθε άποψη σωστός και καλυμμένος.
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Κυρ Ιαν 31, 2010 11:01 pm
από sfod
οκ αυτο εκανα..thanks anyway kanenas
πολυ μεγάλη εργασία πάντως-όσον αφορά τα σχόλια..τις ήθελε τις μερούλες τις
να ρωτήσω και κατι τελευταίο? η κατηγορία αναφοράς της μετ.AGE_NEW δεν είναι η price? (ερ. χ)
πρέπει να χρησιμοποιήσουμε την εντολή model.matrix(results)?
όπου matrix όμως θα πρέπει να περάσουμε πάλι τα δεδομένα μας?
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Κυρ Ιαν 31, 2010 11:20 pm
από O kanenas
Όντως μεγάλη εργασία...
Η κατηγορία αναφοράς μιας κατηγορικής μεταβλητής μπορεί να είναι μόνο μία από τις κατηγορίες της. Δηλαδή, αν έχεις μια κατηγορική μεταβλητή που παίρνει τιμές 0, 1 και 2, τότε οι κατηγορίες της είναι η 0, η 1 και η 2. Η κατηγορία αναφοράς της θα είναι όποια ορίσεις εσύ ή από default η R θα βάλει την μικρότερη (δηλαδή την 0). Θέλω να πω ότι η ερώτηση αν η κατηγορία αναφοράς της AGE_NEW είναι η PRICE δεν βγάζει νόημα.
Συγκεκριμένα για το ερώτημα (x), η κατηγορία αναφοράς της AGE_NEW είναι η 0, που αντιστοιχεί στην κατάσταση "το σπίτι είναι έως και 10 ετών".
Όσον αφορά τις άλλες απορίες, δε θυμάμαι τι κάνει η model.matrix(), αλλά δεν την χρειάστηκα στην εργασία μου. Μπορεί να έκανα και λάθος, δεν ξέρω...
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Δευ Φεβ 01, 2010 12:26 am
από o_apolytos
Αυτή η εργασία όντως είναι υπερτεράστια ή εντύπωσή μου είναι; Πρέπει να εξηγήσεις μέχρι και το κενό μεταξύ των αποτελεσμάτων των summary μου φαίνεται...
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Κυρ Φεβ 07, 2010 7:17 pm
από congi
Μπορεί κάποιος να μου εξηγήσει τι είναι το qqplot και το qqline. Καταλαβαίνω πως τα χρησιμοποιούμε αλλά δεν καταλαβαίνω πως θα μπορούσα να τα υπολογίσει κάποιος...
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Κυρ Φεβ 07, 2010 8:43 pm
από 1/2rizax
Δεν υπάρχει περίπτωση να μας βάλει να σχεδιάσουμε μόνοι μας ένα qq plot, το μόνο που χρειάζεται να ξέρουμε είναι να ερμηνεύουμε ένα qq plot που θα μας δώσει.
Πάντως αν θες να δεις χοντρικά πως το σχεδιάζεις, στην ουσία στους άξονες x και y έχεις τις αντίστροφες των αθροιστικών συναρτήσεων πιθανότητας, δηλ. τις
)
για τα διάφορα
)
. Οι συναρτήσεις αυτές σου δίνουν εκείνο το

για το οποίο
=q)
Στον χ'χ βάζεις την θεωρητική κατανομή πχ. την Ν(0,1), στον ψ'ψ αυτή που προκύπτει από τα πειραματικά σου δεδομένα. Τώρα έχεις 2 προβλήματα. Το ένα είναι να βρεις τα
)
της θεωρητικής σου κατανομής, κάτι το οποίο εν γένει δεν είναι εύκολο, λίγες κατανομές αντιστρέφονται εύκολα, συνήθως χρειάζεσαι υπολογιστή. Το άλλο είναι να εκτιμήσεις τα
)
για τα πειραματικά σου δεδομένα. Μια τέτοια εκτίμηση μπορεί πχ. να προκύψει από το πολύ απλό και προφανές
=\frac{k}{n})
, όπου

το πλήθος των δεδομένων μας και

το πλήθος των δεδομένων που είναι μικρότερα ή ισα του

, ή μέχρι πολύ δυσκολότερων εκφράσεων που δίνουν καλύτερες εκτιμήσεις για τα

. Ύστερα για κάθε q σημείο των πειραματικών σου δεδομένων φέρνεις μια οριζόντια, φέρνεις μια κάθετη από το αντίστοιχο q σημείο της θεωρητικής, και το σημείο τομής τους το σχεδιάζεις. κ.ο.κ. Αν οι κατανομές είναι ίδιες, θα έχουν q περίπου στα ίδια σημεία και συνεπώς τα σημεία που σχεδίασες θα πρέπει να βρίσκονται πάνω στην 1η διχοτόμο.
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Κυρ Φεβ 07, 2010 9:08 pm
από congi
Σε ευχαριστώ πολύ!
Re: Ανάλυση δεδομένων με Η/Υ
Δημοσιεύτηκε: Δευ Φεβ 08, 2010 4:09 pm
από riemann69
Θα ανεβάσει κάποιος τα θέματα πλιζ?