Ανάλυση Δεδομένων με Η/Υ

Συζητήσεις για μαθήματα του 3ου έτους στην κατεύθυνση Μαθηματικού Εφαρμογών.

Συντονιστές: Ryu, markelos, meleneemil, Nasia!

Απάντηση
Άβαταρ μέλους
sfod
Δημοσιεύσεις: 345
Εγγραφή: Δευ Μάιος 07, 2007 5:19 pm

Re: Ανάλυση δεδομένων με Η/Υ

Δημοσίευση από sfod »

κάτι γενικό για τον συμβολισμό στην εργασία: θα ήταν λάθος αν χρησιμοποιούσα τα ονόματα των μεταβλητών αντί για Y ,x1,x2 κλπ? και στο τέλος να γράψω το μοντέλο μ με τα y,x ορίζοντας τι είναι το καθένα?
Επίδης maria20 εντέλει έχει διαφορά το na.omit από το na.exclude που χρησιμοποίησες?
"Η ομορφιά είναι το μεγαλείο της αλήθειας!" -Laurent Lafforgue
Άβαταρ μέλους
1/2rizax
Δημοσιεύσεις: 231
Εγγραφή: Δευ Δεκ 04, 2006 3:39 pm

Re: Ανάλυση δεδομένων με Η/Υ

Δημοσίευση από 1/2rizax »

Δηλαδή κάτι του στυλ lm(PRICE~AGE+SQFT) ; Γιατί να στο πάρει λάθος; Μάλιστα το ζητάει στο 1ο ερώτημα να δώσουμε ονόματα στις μεταβλητές, οπότε πιο φυσιολογικό θα ήταν να τις αφήσεις με τα ονόματα αυτά.
Νομίζω η διαφορά μεταξύ na.omit και na.exclude είναι ότι η 1η αφαιρεί τα ΝΑ εντελώς, ενώ η 2η τα αφαιρεί μεν, αλλά θυμάται ότι υπάρχουν. Έτσι αν γράψεις πχ.

> options(na.action=na.exclude)
> fitted(lm(Y[,1]~Y[,3]))

θα πάρεις στο αποτέλεσμα και μερικά ΝΑ όταν του ζητήσεις να σου γράψει εκτίμηση σε missing value. Στη συγκεκριμένη άσκηση δεν πρέπει να έχει διαφορά.
no es sueño la vida
y al que le duele su dolor le dolerá sin descanso
y el que teme la muerte la llevará sobre los hombros
maria_20
Δημοσιεύσεις: 105
Εγγραφή: Τρί Δεκ 05, 2006 11:46 pm
Real Name: Μαρία
Facebook ID: 0
Τοποθεσία: Λαύριο

Re: Ανάλυση δεδομένων με Η/Υ

Δημοσίευση από maria_20 »

όπως τα λεει για την exclude.
Άβαταρ μέλους
sfod
Δημοσιεύσεις: 345
Εγγραφή: Δευ Μάιος 07, 2007 5:19 pm

Re: Ανάλυση δεδομένων με Η/Υ

Δημοσίευση από sfod »

Ναι 1/2 rizax αυτό εννούσα!
thanks-επομένως δεν θα το πάρει λάθος και με omit..οκ ευχαριστώ παιδιά :)
"Η ομορφιά είναι το μεγαλείο της αλήθειας!" -Laurent Lafforgue
Άβαταρ μέλους
sfod
Δημοσιεύσεις: 345
Εγγραφή: Δευ Μάιος 07, 2007 5:19 pm

Re: Ανάλυση δεδομένων με Η/Υ

Δημοσίευση από sfod »

Στο vi που ζητάει το γενικό γραμμικό μοντέλο-δεν πρέπει να σκεφτούμε και το οτι δυο απο τις 4 επεξηγ.μετ.είναι ποιοτικές?
Άβαταρ μέλους
O kanenas
Δημοσιεύσεις: 3244
Εγγραφή: Κυρ Νοέμ 05, 2006 3:26 pm
Real Name: Αφροξυλάνθη
Facebook ID: 0
Τοποθεσία: Within search engines that search engines that search
Επικοινωνία:

Re: Ανάλυση δεδομένων με Η/Υ

Δημοσίευση από O kanenas »

Είναι κατηγορικές, αλλά έχουν μόνο δύο κατηγορίες, οπότε είτε τις ορίσεις ως κατηγορικές στην R (ne<-as.factor(ne)) είτε όχι, το ίδιο αποτέλεσμα θα έχεις. Οι εικονικές μεταβλητές έχουν κάποιο νόημα όταν η κατηγορική σου μεταβλητή έχει πάνω από δύο κατηγορίες, αν αυτό εννοείς με την ερώτησή σου.
R.I.P.
Life is so vain, but death equals pain
So let's make one more attempt and live with nothing to gain
Άβαταρ μέλους
sfod
Δημοσιεύσεις: 345
Εγγραφή: Δευ Μάιος 07, 2007 5:19 pm

Re: Ανάλυση δεδομένων με Η/Υ

Δημοσίευση από sfod »

το ξέρω ότι δεν θα εχει διαφορά το αποτέλεσμα-το τσέκαρα
ρωτάω αν είμαστε θεωρητικά σωστοί συμπεριλαμβάνοντας τις 2 κατηγορικές μεταβλητές χωρίς να ορίσουμε ne<-as.factor(ne) κλπ.. :roll:
Άβαταρ μέλους
O kanenas
Δημοσιεύσεις: 3244
Εγγραφή: Κυρ Νοέμ 05, 2006 3:26 pm
Real Name: Αφροξυλάνθη
Facebook ID: 0
Τοποθεσία: Within search engines that search engines that search
Επικοινωνία:

Re: Ανάλυση δεδομένων με Η/Υ

Δημοσίευση από O kanenas »

Πιστεύω πως αν εξηγήσεις τους λόγους για τους οποίους δεν δίνεις την εντολή as.factor σ'αυτή τη περίπτωση, είσαι από κάθε άποψη σωστός και καλυμμένος.
R.I.P.
Life is so vain, but death equals pain
So let's make one more attempt and live with nothing to gain
Άβαταρ μέλους
sfod
Δημοσιεύσεις: 345
Εγγραφή: Δευ Μάιος 07, 2007 5:19 pm

Re: Ανάλυση δεδομένων με Η/Υ

Δημοσίευση από sfod »

οκ αυτο εκανα..thanks anyway kanenas
πολυ μεγάλη εργασία πάντως-όσον αφορά τα σχόλια..τις ήθελε τις μερούλες τις

να ρωτήσω και κατι τελευταίο? η κατηγορία αναφοράς της μετ.AGE_NEW δεν είναι η price? (ερ. χ)
πρέπει να χρησιμοποιήσουμε την εντολή model.matrix(results)?
όπου matrix όμως θα πρέπει να περάσουμε πάλι τα δεδομένα μας?
"Η ομορφιά είναι το μεγαλείο της αλήθειας!" -Laurent Lafforgue
Άβαταρ μέλους
O kanenas
Δημοσιεύσεις: 3244
Εγγραφή: Κυρ Νοέμ 05, 2006 3:26 pm
Real Name: Αφροξυλάνθη
Facebook ID: 0
Τοποθεσία: Within search engines that search engines that search
Επικοινωνία:

Re: Ανάλυση δεδομένων με Η/Υ

Δημοσίευση από O kanenas »

Όντως μεγάλη εργασία...

Η κατηγορία αναφοράς μιας κατηγορικής μεταβλητής μπορεί να είναι μόνο μία από τις κατηγορίες της. Δηλαδή, αν έχεις μια κατηγορική μεταβλητή που παίρνει τιμές 0, 1 και 2, τότε οι κατηγορίες της είναι η 0, η 1 και η 2. Η κατηγορία αναφοράς της θα είναι όποια ορίσεις εσύ ή από default η R θα βάλει την μικρότερη (δηλαδή την 0). Θέλω να πω ότι η ερώτηση αν η κατηγορία αναφοράς της AGE_NEW είναι η PRICE δεν βγάζει νόημα.

Συγκεκριμένα για το ερώτημα (x), η κατηγορία αναφοράς της AGE_NEW είναι η 0, που αντιστοιχεί στην κατάσταση "το σπίτι είναι έως και 10 ετών".

Όσον αφορά τις άλλες απορίες, δε θυμάμαι τι κάνει η model.matrix(), αλλά δεν την χρειάστηκα στην εργασία μου. Μπορεί να έκανα και λάθος, δεν ξέρω...
R.I.P.
Life is so vain, but death equals pain
So let's make one more attempt and live with nothing to gain
o_apolytos
Δημοσιεύσεις: 962
Εγγραφή: Κυρ Οκτ 21, 2007 3:06 pm
Real Name: Πραγματικό Όνομα

Re: Ανάλυση δεδομένων με Η/Υ

Δημοσίευση από o_apolytos »

Αυτή η εργασία όντως είναι υπερτεράστια ή εντύπωσή μου είναι; Πρέπει να εξηγήσεις μέχρι και το κενό μεταξύ των αποτελεσμάτων των summary μου φαίνεται...
Άβαταρ μέλους
congi
Δημοσιεύσεις: 290
Εγγραφή: Πέμ Νοέμ 22, 2007 6:29 pm
Real Name: CG
Gender: Male

Re: Ανάλυση δεδομένων με Η/Υ

Δημοσίευση από congi »

Μπορεί κάποιος να μου εξηγήσει τι είναι το qqplot και το qqline. Καταλαβαίνω πως τα χρησιμοποιούμε αλλά δεν καταλαβαίνω πως θα μπορούσα να τα υπολογίσει κάποιος...
Άβαταρ μέλους
1/2rizax
Δημοσιεύσεις: 231
Εγγραφή: Δευ Δεκ 04, 2006 3:39 pm

Re: Ανάλυση δεδομένων με Η/Υ

Δημοσίευση από 1/2rizax »

Δεν υπάρχει περίπτωση να μας βάλει να σχεδιάσουμε μόνοι μας ένα qq plot, το μόνο που χρειάζεται να ξέρουμε είναι να ερμηνεύουμε ένα qq plot που θα μας δώσει.

Πάντως αν θες να δεις χοντρικά πως το σχεδιάζεις, στην ουσία στους άξονες x και y έχεις τις αντίστροφες των αθροιστικών συναρτήσεων πιθανότητας, δηλ. τις για τα διάφορα . Οι συναρτήσεις αυτές σου δίνουν εκείνο το για το οποίο Στον χ'χ βάζεις την θεωρητική κατανομή πχ. την Ν(0,1), στον ψ'ψ αυτή που προκύπτει από τα πειραματικά σου δεδομένα. Τώρα έχεις 2 προβλήματα. Το ένα είναι να βρεις τα της θεωρητικής σου κατανομής, κάτι το οποίο εν γένει δεν είναι εύκολο, λίγες κατανομές αντιστρέφονται εύκολα, συνήθως χρειάζεσαι υπολογιστή. Το άλλο είναι να εκτιμήσεις τα για τα πειραματικά σου δεδομένα. Μια τέτοια εκτίμηση μπορεί πχ. να προκύψει από το πολύ απλό και προφανές , όπου το πλήθος των δεδομένων μας και το πλήθος των δεδομένων που είναι μικρότερα ή ισα του , ή μέχρι πολύ δυσκολότερων εκφράσεων που δίνουν καλύτερες εκτιμήσεις για τα . Ύστερα για κάθε q σημείο των πειραματικών σου δεδομένων φέρνεις μια οριζόντια, φέρνεις μια κάθετη από το αντίστοιχο q σημείο της θεωρητικής, και το σημείο τομής τους το σχεδιάζεις. κ.ο.κ. Αν οι κατανομές είναι ίδιες, θα έχουν q περίπου στα ίδια σημεία και συνεπώς τα σημεία που σχεδίασες θα πρέπει να βρίσκονται πάνω στην 1η διχοτόμο.
no es sueño la vida
y al que le duele su dolor le dolerá sin descanso
y el que teme la muerte la llevará sobre los hombros
Άβαταρ μέλους
congi
Δημοσιεύσεις: 290
Εγγραφή: Πέμ Νοέμ 22, 2007 6:29 pm
Real Name: CG
Gender: Male

Re: Ανάλυση δεδομένων με Η/Υ

Δημοσίευση από congi »

Σε ευχαριστώ πολύ!
riemann69
Δημοσιεύσεις: 76
Εγγραφή: Παρ Ιουν 20, 2008 3:15 pm
Real Name: Ριμανία

Re: Ανάλυση δεδομένων με Η/Υ

Δημοσίευση από riemann69 »

Θα ανεβάσει κάποιος τα θέματα πλιζ?
Απάντηση

Επιστροφή στο “Μαθηματικού Εφαρμογών”