Bei der Berechnung eines laufenden gleitenden Durchschnittes ist die Platzierung des Mittelwertes in der mittleren Zeitspanne sinnvoll. Im vorigen Beispiel haben wir den Durchschnitt der ersten 3 Zeiträume berechnet und als nächstes in die Periode 3 gestellt. Wir hätten den Mittelpunkt in der Mitte des Zeitintervall von drei Perioden, also neben Periode 2. Das funktioniert gut mit ungeraden Zeiträumen, aber nicht so gut für gleichzeitige Zeiträume. Also, wo würden wir den ersten gleitenden Durchschnitt platzieren, wenn M 4 Technisch, würde der Moving Average bei t 2,5, 3,5 fallen. Um dieses Problem zu vermeiden, glätten wir die MAs mit M 2. Damit glätten wir die geglätteten Werte. Wenn wir eine gerade Anzahl von Begriffen beurteilen, müssen wir die geglätteten Werte glätten. Die folgende Tabelle zeigt die Ergebnisse mit M 4.David, ja, MapReduce ist Beabsichtigt, auf einer großen Menge von Daten zu arbeiten. Und die Idee ist, dass im Allgemeinen die Karte und die reduzierten Funktionen nicht darauf achten sollten, wie viele Mapper oder wie viele Reduzierstücke es gibt, das ist nur Optimierung. Wenn Sie sorgfältig über den Algorithmus nachdenken, den ich gepostet habe, können Sie sehen, dass es nicht wichtig ist, welcher Mapper bekommt, welche Teile der Daten. Jeder Eingabedatensatz steht jedem zur Verfügung, um den Betrieb zu reduzieren. Ndash Joe K Sep 18 12 um 22:30 Im besten meiner Verständnis gleitenden Durchschnitt ist nicht schön Karten zu MapReduce Paradigma, da seine Berechnung im Wesentlichen Schiebefenster über sortierte Daten, während MR Verarbeitung von nicht geschnittenen Bereichen von sortierten Daten ist. Lösung, die ich sehe, ist wie folgt: a) Um benutzerdefinierte Partitionierer zu implementieren, um zwei verschiedene Partitionen in zwei Läufen machen zu können. In jedem Durchlauf werden Ihre Reduzierstücke unterschiedliche Datenbereiche berechnen und gleitenden Durchschnitt berechnen, wo es angemessen ist, zu veranschaulichen: Im ersten Lauf werden Daten für Reduzierstücke sein: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 . Hier wirst du gleitender Durchschnitt für einige Qs cacluate. Im nächsten Lauf sollten deine Reduzierer Daten wie: R1: Q1 bekommen. Q6 R2: Q6 Q10 R3: Q10..Q14 Und caclulate den Rest der gleitenden Durchschnitte. Dann müssen Sie die Ergebnisse zusammenfassen. Idee der benutzerdefinierten Partitionierer, dass es zwei Betriebsarten haben wird - jedes Mal in gleiche Bereiche, aber mit einigen Verschiebung. In einem Pseudocode sieht es so aus. Partition (keySHIFT) (MAXKEYnumOfPartitions) wobei: SHIFT aus der Konfiguration entnommen wird. MAXKEY Maximalwert des Schlüssels. Ich gehe aus der Einfachheit, dass sie mit Null beginnen. RecordReader, IMHO ist keine Lösung, da es auf bestimmte Split begrenzt ist und kann nicht über Splits Grenze gleiten. Eine andere Lösung wäre, um die benutzerdefinierte Logik der Aufteilung der Eingangsdaten (es ist Teil der InputFormat) zu implementieren. Es kann getan werden, um 2 verschiedene Dias zu tun, ähnlich wie Partitionierung.4 Punkt bewegte Durchschnitte und zentrierte gleitende Durchschnitte Mein Gehirn ist wirklich scheitern mir heute - oh lieb. 001unsure: Ich mache eine Unit 7 Simulation Praxis Papier und es ist eine Frage, die mich bitten, die Umsatzentwicklung in den letzten 3 Jahren mit gleitenden Durchschnitten zu berechnen. Ich bekomme 3 Jahre im Wert von Verkaufszahlen, die jeweils in die 4 Quartale aufgeteilt sind. Mein Studienbuch nur Details 3 Punkt bewegte Durchschnitte, aber zum Glück habe ich bereits 4 Punkte bewegte Durchschnitte auf Tech-Ebene studiert - ich möchte nur klären, dass das, was ich tue, richtig ist. Die Vorlage, die ich gegeben habe, zeigt die Verkaufszahlen in einer Spalte, dann eine Spalte für 4 Periode gleitenden Durchschnitt und eine letzte Spalte für zentrierten gleitenden Durchschnitt. Also, was ich tue, ist die Summe des Jahres 1 (alle 4 Quartale) und teilt sich um 4 - dieser Durchschnitt geht zwischen y Q 1 und Q3, dann fahre ich fort, diese Berechnung zu machen, aber diese Spalte zu bewegen, dh die nächste Berechnung ist Jahr 1 Q1, Q2 und Q3 plus yr 2 Q1, die durch 4 dividiert sind, und dies geht zwischen yr 1 Q3 und Q4 usw. Dann in der zentrierten gleitenden durchschnittlichen Spalte, gäbe ich die 2 Mittelwerte und teile mit 2 und setze die Figur gegen y Q 1 und So weiter die Säule hinunterziehen Klingt das richtigVerfahren von Moving Averages Kommentare sind aus Angenommen, es gibt Zeiten, die mit und die entsprechenden Werte der Variablen angegeben sind. Zuerst müssen wir die Zeit der gleitenden Durchschnitte entscheiden. Für kurze Zeitreihen verwenden wir Perioden von 3 oder 4 Werten. Für lange Zeitreihen kann die Periode 7, 10 oder mehr sein. Für vierteljährliche Zeitreihen berechnen wir immer durchschnittlich 4-Quartale. In monatlichen Zeitreihen werden 12-monatlich bewegte Durchschnitte berechnet. Angenommen, die vorgegebene Zeitreihe ist in Jahren und wir haben uns entschlossen, den durchschnittlichen 3-Jahres-Durchschnitt zu berechnen. Die bewegten Durchschnitte werden wie folgt berechnet:
No comments:
Post a Comment