Ανάλυση Δεδομένων με Η/Υ
Συντονιστές: Ryu, markelos, meleneemil, Nasia!
Re: Ανάλυση δεδομένων με Η/Υ
κάτι γενικό για τον συμβολισμό στην εργασία: θα ήταν λάθος αν χρησιμοποιούσα τα ονόματα των μεταβλητών αντί για Y ,x1,x2 κλπ? και στο τέλος να γράψω το μοντέλο μ με τα y,x ορίζοντας τι είναι το καθένα?
Επίδης maria20 εντέλει έχει διαφορά το na.omit από το na.exclude που χρησιμοποίησες?
Επίδης maria20 εντέλει έχει διαφορά το na.omit από το na.exclude που χρησιμοποίησες?
"Η ομορφιά είναι το μεγαλείο της αλήθειας!" -Laurent Lafforgue
Re: Ανάλυση δεδομένων με Η/Υ
Δηλαδή κάτι του στυλ lm(PRICE~AGE+SQFT) ; Γιατί να στο πάρει λάθος; Μάλιστα το ζητάει στο 1ο ερώτημα να δώσουμε ονόματα στις μεταβλητές, οπότε πιο φυσιολογικό θα ήταν να τις αφήσεις με τα ονόματα αυτά.
Νομίζω η διαφορά μεταξύ na.omit και na.exclude είναι ότι η 1η αφαιρεί τα ΝΑ εντελώς, ενώ η 2η τα αφαιρεί μεν, αλλά θυμάται ότι υπάρχουν. Έτσι αν γράψεις πχ.
> options(na.action=na.exclude)
> fitted(lm(Y[,1]~Y[,3]))
θα πάρεις στο αποτέλεσμα και μερικά ΝΑ όταν του ζητήσεις να σου γράψει εκτίμηση σε missing value. Στη συγκεκριμένη άσκηση δεν πρέπει να έχει διαφορά.
Νομίζω η διαφορά μεταξύ na.omit και na.exclude είναι ότι η 1η αφαιρεί τα ΝΑ εντελώς, ενώ η 2η τα αφαιρεί μεν, αλλά θυμάται ότι υπάρχουν. Έτσι αν γράψεις πχ.
> options(na.action=na.exclude)
> fitted(lm(Y[,1]~Y[,3]))
θα πάρεις στο αποτέλεσμα και μερικά ΝΑ όταν του ζητήσεις να σου γράψει εκτίμηση σε missing value. Στη συγκεκριμένη άσκηση δεν πρέπει να έχει διαφορά.
no es sueño la vida
y al que le duele su dolor le dolerá sin descanso
y el que teme la muerte la llevará sobre los hombros
y al que le duele su dolor le dolerá sin descanso
y el que teme la muerte la llevará sobre los hombros
-
maria_20
- Δημοσιεύσεις: 105
- Εγγραφή: Τρί Δεκ 05, 2006 11:46 pm
- Real Name: Μαρία
- Facebook ID: 0
- Τοποθεσία: Λαύριο
Re: Ανάλυση δεδομένων με Η/Υ
όπως τα λεει για την exclude.
Re: Ανάλυση δεδομένων με Η/Υ
Ναι 1/2 rizax αυτό εννούσα!
thanks-επομένως δεν θα το πάρει λάθος και με omit..οκ ευχαριστώ παιδιά
thanks-επομένως δεν θα το πάρει λάθος και με omit..οκ ευχαριστώ παιδιά
"Η ομορφιά είναι το μεγαλείο της αλήθειας!" -Laurent Lafforgue
Re: Ανάλυση δεδομένων με Η/Υ
Στο vi που ζητάει το γενικό γραμμικό μοντέλο-δεν πρέπει να σκεφτούμε και το οτι δυο απο τις 4 επεξηγ.μετ.είναι ποιοτικές?
- O kanenas
- Δημοσιεύσεις: 3244
- Εγγραφή: Κυρ Νοέμ 05, 2006 3:26 pm
- Real Name: Αφροξυλάνθη
- Facebook ID: 0
- Τοποθεσία: Within search engines that search engines that search
- Επικοινωνία:
Re: Ανάλυση δεδομένων με Η/Υ
Είναι κατηγορικές, αλλά έχουν μόνο δύο κατηγορίες, οπότε είτε τις ορίσεις ως κατηγορικές στην R (ne<-as.factor(ne)) είτε όχι, το ίδιο αποτέλεσμα θα έχεις. Οι εικονικές μεταβλητές έχουν κάποιο νόημα όταν η κατηγορική σου μεταβλητή έχει πάνω από δύο κατηγορίες, αν αυτό εννοείς με την ερώτησή σου.
R.I.P.
Life is so vain, but death equals pain
So let's make one more attempt and live with nothing to gain
So let's make one more attempt and live with nothing to gain
Re: Ανάλυση δεδομένων με Η/Υ
το ξέρω ότι δεν θα εχει διαφορά το αποτέλεσμα-το τσέκαρα
ρωτάω αν είμαστε θεωρητικά σωστοί συμπεριλαμβάνοντας τις 2 κατηγορικές μεταβλητές χωρίς να ορίσουμε ne<-as.factor(ne) κλπ..
ρωτάω αν είμαστε θεωρητικά σωστοί συμπεριλαμβάνοντας τις 2 κατηγορικές μεταβλητές χωρίς να ορίσουμε ne<-as.factor(ne) κλπ..
- O kanenas
- Δημοσιεύσεις: 3244
- Εγγραφή: Κυρ Νοέμ 05, 2006 3:26 pm
- Real Name: Αφροξυλάνθη
- Facebook ID: 0
- Τοποθεσία: Within search engines that search engines that search
- Επικοινωνία:
Re: Ανάλυση δεδομένων με Η/Υ
Πιστεύω πως αν εξηγήσεις τους λόγους για τους οποίους δεν δίνεις την εντολή as.factor σ'αυτή τη περίπτωση, είσαι από κάθε άποψη σωστός και καλυμμένος.
R.I.P.
Life is so vain, but death equals pain
So let's make one more attempt and live with nothing to gain
So let's make one more attempt and live with nothing to gain
Re: Ανάλυση δεδομένων με Η/Υ
οκ αυτο εκανα..thanks anyway kanenas
πολυ μεγάλη εργασία πάντως-όσον αφορά τα σχόλια..τις ήθελε τις μερούλες τις
να ρωτήσω και κατι τελευταίο? η κατηγορία αναφοράς της μετ.AGE_NEW δεν είναι η price? (ερ. χ)
πρέπει να χρησιμοποιήσουμε την εντολή model.matrix(results)?
όπου matrix όμως θα πρέπει να περάσουμε πάλι τα δεδομένα μας?
πολυ μεγάλη εργασία πάντως-όσον αφορά τα σχόλια..τις ήθελε τις μερούλες τις
να ρωτήσω και κατι τελευταίο? η κατηγορία αναφοράς της μετ.AGE_NEW δεν είναι η price? (ερ. χ)
πρέπει να χρησιμοποιήσουμε την εντολή model.matrix(results)?
όπου matrix όμως θα πρέπει να περάσουμε πάλι τα δεδομένα μας?
"Η ομορφιά είναι το μεγαλείο της αλήθειας!" -Laurent Lafforgue
- O kanenas
- Δημοσιεύσεις: 3244
- Εγγραφή: Κυρ Νοέμ 05, 2006 3:26 pm
- Real Name: Αφροξυλάνθη
- Facebook ID: 0
- Τοποθεσία: Within search engines that search engines that search
- Επικοινωνία:
Re: Ανάλυση δεδομένων με Η/Υ
Όντως μεγάλη εργασία...
Η κατηγορία αναφοράς μιας κατηγορικής μεταβλητής μπορεί να είναι μόνο μία από τις κατηγορίες της. Δηλαδή, αν έχεις μια κατηγορική μεταβλητή που παίρνει τιμές 0, 1 και 2, τότε οι κατηγορίες της είναι η 0, η 1 και η 2. Η κατηγορία αναφοράς της θα είναι όποια ορίσεις εσύ ή από default η R θα βάλει την μικρότερη (δηλαδή την 0). Θέλω να πω ότι η ερώτηση αν η κατηγορία αναφοράς της AGE_NEW είναι η PRICE δεν βγάζει νόημα.
Συγκεκριμένα για το ερώτημα (x), η κατηγορία αναφοράς της AGE_NEW είναι η 0, που αντιστοιχεί στην κατάσταση "το σπίτι είναι έως και 10 ετών".
Όσον αφορά τις άλλες απορίες, δε θυμάμαι τι κάνει η model.matrix(), αλλά δεν την χρειάστηκα στην εργασία μου. Μπορεί να έκανα και λάθος, δεν ξέρω...
Η κατηγορία αναφοράς μιας κατηγορικής μεταβλητής μπορεί να είναι μόνο μία από τις κατηγορίες της. Δηλαδή, αν έχεις μια κατηγορική μεταβλητή που παίρνει τιμές 0, 1 και 2, τότε οι κατηγορίες της είναι η 0, η 1 και η 2. Η κατηγορία αναφοράς της θα είναι όποια ορίσεις εσύ ή από default η R θα βάλει την μικρότερη (δηλαδή την 0). Θέλω να πω ότι η ερώτηση αν η κατηγορία αναφοράς της AGE_NEW είναι η PRICE δεν βγάζει νόημα.
Συγκεκριμένα για το ερώτημα (x), η κατηγορία αναφοράς της AGE_NEW είναι η 0, που αντιστοιχεί στην κατάσταση "το σπίτι είναι έως και 10 ετών".
Όσον αφορά τις άλλες απορίες, δε θυμάμαι τι κάνει η model.matrix(), αλλά δεν την χρειάστηκα στην εργασία μου. Μπορεί να έκανα και λάθος, δεν ξέρω...
R.I.P.
Life is so vain, but death equals pain
So let's make one more attempt and live with nothing to gain
So let's make one more attempt and live with nothing to gain
-
o_apolytos
- Δημοσιεύσεις: 962
- Εγγραφή: Κυρ Οκτ 21, 2007 3:06 pm
- Real Name: Πραγματικό Όνομα
Re: Ανάλυση δεδομένων με Η/Υ
Αυτή η εργασία όντως είναι υπερτεράστια ή εντύπωσή μου είναι; Πρέπει να εξηγήσεις μέχρι και το κενό μεταξύ των αποτελεσμάτων των summary μου φαίνεται...
Re: Ανάλυση δεδομένων με Η/Υ
Μπορεί κάποιος να μου εξηγήσει τι είναι το qqplot και το qqline. Καταλαβαίνω πως τα χρησιμοποιούμε αλλά δεν καταλαβαίνω πως θα μπορούσα να τα υπολογίσει κάποιος...
Re: Ανάλυση δεδομένων με Η/Υ
Δεν υπάρχει περίπτωση να μας βάλει να σχεδιάσουμε μόνοι μας ένα qq plot, το μόνο που χρειάζεται να ξέρουμε είναι να ερμηνεύουμε ένα qq plot που θα μας δώσει.
Πάντως αν θες να δεις χοντρικά πως το σχεδιάζεις, στην ουσία στους άξονες x και y έχεις τις αντίστροφες των αθροιστικών συναρτήσεων πιθανότητας, δηλ. τις
για τα διάφορα
. Οι συναρτήσεις αυτές σου δίνουν εκείνο το
για το οποίο
Στον χ'χ βάζεις την θεωρητική κατανομή πχ. την Ν(0,1), στον ψ'ψ αυτή που προκύπτει από τα πειραματικά σου δεδομένα. Τώρα έχεις 2 προβλήματα. Το ένα είναι να βρεις τα
της θεωρητικής σου κατανομής, κάτι το οποίο εν γένει δεν είναι εύκολο, λίγες κατανομές αντιστρέφονται εύκολα, συνήθως χρειάζεσαι υπολογιστή. Το άλλο είναι να εκτιμήσεις τα
για τα πειραματικά σου δεδομένα. Μια τέτοια εκτίμηση μπορεί πχ. να προκύψει από το πολύ απλό και προφανές
, όπου
το πλήθος των δεδομένων μας και
το πλήθος των δεδομένων που είναι μικρότερα ή ισα του
, ή μέχρι πολύ δυσκολότερων εκφράσεων που δίνουν καλύτερες εκτιμήσεις για τα
. Ύστερα για κάθε q σημείο των πειραματικών σου δεδομένων φέρνεις μια οριζόντια, φέρνεις μια κάθετη από το αντίστοιχο q σημείο της θεωρητικής, και το σημείο τομής τους το σχεδιάζεις. κ.ο.κ. Αν οι κατανομές είναι ίδιες, θα έχουν q περίπου στα ίδια σημεία και συνεπώς τα σημεία που σχεδίασες θα πρέπει να βρίσκονται πάνω στην 1η διχοτόμο.
Πάντως αν θες να δεις χοντρικά πως το σχεδιάζεις, στην ουσία στους άξονες x και y έχεις τις αντίστροφες των αθροιστικών συναρτήσεων πιθανότητας, δηλ. τις
no es sueño la vida
y al que le duele su dolor le dolerá sin descanso
y el que teme la muerte la llevará sobre los hombros
y al que le duele su dolor le dolerá sin descanso
y el que teme la muerte la llevará sobre los hombros
Re: Ανάλυση δεδομένων με Η/Υ
Σε ευχαριστώ πολύ!
Re: Ανάλυση δεδομένων με Η/Υ
Θα ανεβάσει κάποιος τα θέματα πλιζ?