Tuesday, 24 January 2017

Gleitender Durchschnittlicher Data Mining

Smoothing Daten entfernt zufällige Variation und zeigt Trends und zyklische Komponenten Inhärent in der Sammlung von Daten im Laufe der Zeit übernommen wird, ist eine Form der zufälligen Variation. Es gibt Methoden zur Verringerung der Annullierung der Wirkung aufgrund zufälliger Variation. Eine häufig verwendete Technik in der Industrie ist Glättung. Diese Technik zeigt, wenn sie richtig angewendet wird, deutlicher den zugrunde liegenden Trend, saisonale und zyklische Komponenten. Es gibt zwei verschiedene Gruppen von Glättungsmethoden Mittelungsmethoden Exponentielle Glättungsmethoden Mittelwertbildung ist der einfachste Weg, um Daten zu glätten Wir werden zunächst einige Mittelungsmethoden untersuchen, z. B. den einfachen Mittelwert aller vergangenen Daten. Ein Manager eines Lagers möchte wissen, wie viel ein typischer Lieferant in 1000-Dollar-Einheiten liefert. Heshe nimmt eine Stichprobe von 12 Lieferanten, die zufällig die folgenden Ergebnisse erhalten: Der berechnete Mittelwert oder Mittelwert der Daten 10. Der Manager entscheidet, diese als Schätzung der Ausgaben eines typischen Lieferanten zu verwenden. Ist dies eine gute oder schlechte Schätzung Mittel quadratischen Fehler ist eine Möglichkeit, zu beurteilen, wie gut ein Modell ist Wir berechnen die mittlere quadratische Fehler. Der Fehler true Betrag verbraucht minus die geschätzte Menge. Der Fehler quadriert ist der Fehler oben, quadriert. Die SSE ist die Summe der quadratischen Fehler. Die MSE ist der Mittelwert der quadratischen Fehler. MSE Ergebnisse zum Beispiel Die Ergebnisse sind: Fehler und quadratische Fehler Die Schätzung 10 Die Frage stellt sich: Können wir das Mittel verwenden, um Einkommen zu prognostizieren, wenn wir einen Trend vermuten Ein Blick auf die Grafik unten zeigt deutlich, dass wir dies nicht tun sollten. Durchschnittliche Gewichtungen alle früheren Beobachtungen gleich In Zusammenfassung, wir sagen, dass die einfache Mittelwert oder Mittelwert aller früheren Beobachtungen ist nur eine nützliche Schätzung für die Prognose, wenn es keine Trends. Wenn es Trends, verwenden Sie verschiedene Schätzungen, die den Trend berücksichtigen. Der Durchschnitt wiegt alle früheren Beobachtungen gleichermaßen. Zum Beispiel ist der Durchschnitt der Werte 3, 4, 5 4. Wir wissen natürlich, dass ein Durchschnitt berechnet wird, indem alle Werte addiert werden und die Summe durch die Anzahl der Werte dividiert wird. Ein anderer Weg, den Durchschnitt zu berechnen, besteht darin, daß jeder Wert durch die Anzahl von Werten geteilt wird, oder 33 43 53 1 1.3333 1.6667 4. Der Multiplikator 13 wird das Gewicht genannt. Allgemein: bar frac sum links (frac rechts) x1 links (frac rechts) x2,. ,, Links (frac rechts) xn. Die (von links (Frac rechts)) sind die Gewichte und, natürlich, sie zu 1.Forecasting Data Mining und Forecasting Services mit Data Mining, Unternehmen und Organisationen zusammenfassen können die Rentabilität ihrer Unternehmen zu erhöhen, indem sie Möglichkeiten der Aufdeckung und potenzielle Risiken zu erkennen. Unsere Data-Mining - und Analysenberatung hilft Ihnen, wertvolle Informationen aus Ihren Daten herauszuholen, indem Sie die Prognosemodellierung (Regression und Zeitreihenanalyse) nutzen. Wir können Ihre Daten analysieren und Ihnen Prognoseberichte zur Verfügung stellen, die Ihrem Bedarf entsprechen. Prognosemodelle und Projektlebenszyklus Die Prognose ist Bestandteil des Data Mining. Es ist der Prozess der Schätzung in unbekannten Situationen und wird häufig in der Diskussion von Zeitreihen-Daten verwendet. Regression Modelle können am besten mit Zeitreihen-Daten verwendet werden, um Trends und Saisonalitäten zu erkennen (auch wenn die Modelle auch für Querschnittsdaten nützlich sind). Sie können helfen, Fragen wie zu beantworten, was unsere Verkäufe im folgenden Viertel sein werden und wie überzeugt sind wir in der Vorhersage Regressionsmodelle sind auch sehr gut für das Interpolieren und das Extrapolieren von Daten in den linearen und nichtlinearen Ansätzen. Unsere Excel-Beratungsdienstleistungen können Sie mit Prognoseberichten versorgen, indem Sie Ihre Daten durch verschiedene Modelle testen und das beste Modell, das ermittelt wird, implementieren. Wir haben ein Team von Business Analysten, statistischen Modellierer und IT-Profis, die Tools wie Prognose Pro, SPSS, Statistica, Access und Excel verwenden, um die Analyse durchzuführen. Unsere Regressionsmodelle umfassen, sind aber nicht beschränkt auf: Lineare und nichtlineare Regression Multiple Regression Exponentielle Glättung mit additive Saisonalität Einfache exponentielle Glättung mit multiplikativer Saisonalität Halt Winters exponentielle Glättung Halt Winters einfache exponentielle Glättung mit additiver Saisonalität Halt Winters einfache exponentielle Glättung mit multiplikativer Saisonalität Gedämpfte exponentiellen Glättung Simple Moving Average Analyse Centered Durchschnitt Analyse ARIMA (autoregressiven Integrated Moving Average) bewegen Hier sind zwei Beispiele von Prognose Plot: Abb 1. Third (3) verwendet Polynommodells Lineare Regression die lineare Regression ist, um den Wert einer abhängigen metrischen variablen zu modellieren Basis Auf seine lineare Beziehung zu einem oder mehreren Prädiktoren. Sie schätzt die Koeffizienten der linearen Gleichung mit einer oder mehreren unabhängigen Variablen ab, die den Wert der abhängigen Variablen am besten vorhersagen. Zum Beispiel können Sie versuchen, einen Verkäufer Jahresumsatz (die abhängige Variable) von unabhängigen Variablen wie Alter, Bildung und Jahre der Erfahrung vorherzusagen. Eine Automobilindustrie Gruppe verfolgt den Verkauf für eine Vielzahl von persönlichen Kraftfahrzeugen. Um in der Lage zu sein, über - und unterdurchschnittliche Modelle zu identifizieren, möchten Sie eine Beziehung zwischen Fahrzeugverkäufen und Fahrzeugmerkmalen herstellen. Wir können lineare Regression verwenden, um Modelle zu identifizieren, die nicht gut verkaufen. Ist die Anzahl der von einer Basketballmannschaft gewonnenen Spiele in einer Saison bezogen auf die durchschnittliche Punktzahl, die das Team pro Spiel erzielt hat? Ein Streudiagramm zeigt an, dass diese Variablen linear verwandt sind. Die Anzahl der gewonnenen Spiele und die durchschnittliche Punktzahl des Gegners sind ebenfalls linear verknüpft. Diese Variablen haben eine negative Beziehung. Wenn die Anzahl der gewonnenen Spiele ansteigt, nimmt die durchschnittliche Anzahl der Punkte, die der Gegner erzielt hat, ab. Mit einer linearen Regression können Sie die Beziehung dieser Variablen modellieren. Ein gutes Modell kann verwendet werden, um vorherzusagen, wie viele Spielteams gewinnen werden. Die Firma Nambe Mills hat eine Reihe von Metall-Geschirr-Produkte, die einen Polierschritt im Herstellungsprozess erfordern. Um die Produktionsplanung zu planen, wurden die Polierzeiten für 59 Produkte zusammen mit dem Produkttyp und den relativen Größen dieser Produkte gemessen, gemessen in ihren Durchmessern. Wir können lineare Regression verwenden, um zu bestimmen, ob die Polierzeit durch Produktgröße vorhergesagt werden kann. Nichtlineare Regression Die nichtlineare Regression ist eine Methode, ein nichtlineares Modell der Beziehung zwischen der abhängigen Variablen und einem Satz von unabhängigen Variablen zu finden. Im Gegensatz zur herkömmlichen linearen Regression, die auf die Schätzung linearer Modelle beschränkt ist, kann die nichtlineare Regression Modelle mit beliebigen Beziehungen zwischen unabhängigen und abhängigen Variablen abschätzen. Dies geschieht unter Verwendung von iterativen Schätzalgorithmen. Beachten Sie, dass dieses Verfahren nicht für einfache Polynommodelle der Form Y A BX2 erforderlich ist. Durch die Definition von W X2 erhalten wir ein einfaches lineares Modell, Y A BW, das mit herkömmlichen Methoden wie dem linearen Regressionsverfahren abgeschätzt werden kann. Kann die Population aufgrund der Zeit vorhergesagt werden Ein Scatter-Diagramm zeigt, dass es eine starke Beziehung zwischen Population und Zeit gibt, aber die Beziehung ist nichtlinear, so dass es die speziellen Schätzmethoden der nichtlinearen Regression erfordert. Durch Einrichten einer geeigneten Gleichung, wie z. B. eines logistischen Bevölkerungswachstumsmodells, können wir eine gute Schätzung des Modells erhalten, was es uns ermöglicht, Vorhersagen über die Bevölkerung für Zeiten vorzunehmen, die nicht tatsächlich gemessen wurden. Ein Internet Service Provider (ISP) bestimmt die Auswirkungen eines Virus auf seine Netzwerke. Als Teil dieser Bemühungen haben sie den (ungefähre) Prozentsatz des infizierten E-Mail-Verkehrs in ihren Netzwerken über die Zeit verfolgt, vom Moment der Entdeckung bis zur Bedrohung. Wir können nichtlineare Regression verwenden, um den Anstieg und die Abnahme der Infektion zu modellieren. Vorhersageanalyse Diese Prozedur erzeugt fertige Werte und Residuen für eine oder mehrere Zeitreihen, wobei ein Algorithmus verwendet wird, der unregelmäßige Komponenten von Zeitreihendaten glättet. Eine Vielzahl von Modellen, die sich im Trend unterscheiden (keine, lineare oder exponentielle) und Saisonalität (keine, additive oder multiplikative) sind verfügbar. Inventar-intensive Unternehmen beschäftigen oft statistische Techniken für die Projektion von künftigen Inventar. Das Exponential-Glättungsverfahren kann sowohl zum Entwickeln eines Modells der Inventur-Zeitreihen als auch zum Erzeugen schneller Prognosen, die auf diesem Modell basieren, verwendet werden. ARIMA (Box-Jenkins) Beispiel dieser Prozedur werden nicht saisonal und saisonale univariate ARIMA (Autoregressiven Integrated Moving Average) Modelle mit oder ohne feste Regressorvariablen (auch als Box-Jenkins-Modelle bekannt). Das Verfahren erzeugt Maximum-Likelihood-Schätzungen und kann Zeitreihen mit fehlenden Beobachtungen verarbeiten. Sie sind für die Qualitätskontrolle in einem Produktionsbetrieb verantwortlich und müssen wissen, ob und wann zufällige Schwankungen der Produktqualität ihre üblichen akzeptablen Werte übersteigen. Sie haben die Modellierung von Produktqualitäts-Scores mit einem exponentiellen Glättungsmodell versucht, aber - vermutlich wegen der stark erratischen Natur der Daten - gefunden, dass das Modell wenig mehr als das Gesamtmittel vorhersagt und daher wenig Gebrauch macht. ARIMA-Modelle eignen sich hervorragend für die Beschreibung komplexer Zeitreihen. Nach dem Erstellen eines geeigneten ARIMA-Modells können Sie die Produktqualitätswerte zusammen mit den oberen und unteren Konfidenzintervallen des Modells darstellen. Scores, die außerhalb der Konfidenzintervalle liegen, können auf einen wahren Rückgang der Produktqualität hindeuten. Eine Katalogfirma, die an der Entwicklung eines Prognosemodells interessiert ist, hat Daten über die monatlichen Verkäufe von Herrenbekleidung zusammen mit mehreren Serien gesammelt, die verwendet werden könnten, um einige der Variation in den Verkäufen zu erklären. Mögliche Prädiktoren sind die Anzahl der verschickten Kataloge und die Anzahl der Seiten im Katalog, die Anzahl der für die Bestellung offenen Telefonleitungen, der Betrag für die Druckwerbung und die Anzahl der Kundendienstmitarbeiter. Sind irgendwelche der Prädiktoren nützlich für die Prognose mit Prädiktoren ein Modell ist wirklich besser als eine ohne Verwendung der Prozedur ARIMA Prognosemodelle mit und ohne Prädiktoren zu schaffen, und sehen, ob es einen signifikanten Unterschied in Prognosefähigkeit ist. Der Einzelhandelsmarkt in einer mittelgroßen Metropolregion wird von zwei Supermarktketten dominiert: Nortons und EdMart. Nortons wurde vor kurzem von einer großen nationalen Lebensmittelkette gekauft, die dann seine eigene Marke von Produkten eingeführt, von denen die meisten für wesentlich weniger als die Namen Marke Produkte bei EdMart angeboten. Für eine Reihe von Jahren hat EdMart über eine 5 Rand im Marktanteil über Nortons, vor allem wegen seiner überlegenen Kundenservice beibehalten. In den ersten beiden Monaten des Eigentums startete die neue Muttergesellschaft von Nortons eine aggressive Kampagne, die ihre eigene Produktlinie ankündigte. Das Ergebnis war ein rascher und dramatischer Anstieg der Marktanteile. War der Anstieg der Marktanteil nur auf Kosten der EdMarts Aktie oder ein Teil der Zunahme ist auf Verluste durch die kleinen Tante-Emma-Lebensmittel, die den Rest des lokalen Marktes Saisonale Zerlegung Beispiel Die Saisonale Zerlegung Verfahren ein Make-up zerfällt Serie in eine saisonale Komponente, eine kombinierte Trend - und Zykluskomponente sowie eine Fehlerkomponente. Das Verfahren ist eine Implementierung der Census-Methode I, die ansonsten als Verhältnis-zu-gleitende Durchschnittsmethode bekannt ist. Ein Wissenschaftler interessiert sich für die Analyse monatlicher Messungen des Ozonpegels an einer bestimmten Wetterstation. Das Ziel ist es, festzustellen, ob es irgendeinen Trend in den Daten. Um einen wirklichen Trend aufzudecken, muss der Wissenschaftler zunächst die Veränderung der Messwerte durch saisonale Effekte berücksichtigen. Das saisonale Zersetzungsverfahren kann verwendet werden, um systematische saisonale Schwankungen zu beseitigen. Die Trendanalyse erfolgt dann saisonbereinigt. Ein Katalog-Unternehmen interessiert sich für die Modellierung der Aufwärtstrend der Verkäufe seiner Herren Kleidung Linie auf eine Reihe von Vorhersage-Variablen wie die Anzahl der Kataloge verschickt und die Anzahl der Telefonleitungen offen für die Bestellung. Zu diesem Zweck sammelte das Unternehmen monatliche Verkäufe von Herrenkleidung für einen Zeitraum von 10 Jahren. Um eine Trendanalyse durchzuführen (z. B. mit einem Autoregressionsverfahren), ist es notwendig, alle in den Daten vorhandenen saisonalen Variationen zu entfernen. Dies ist leicht mit der saisonalen Zersetzung Verfahren erreicht. Wie verwenden Sie einen beweglichen Durchschnitt, um Aktien zu kaufen Der gleitende Durchschnitt (MA) ist ein einfaches technisches Analyse-Tool, das Preisdaten durch die Schaffung eines ständig aktualisierten Durchschnittspreis glättet. Der Durchschnitt wird über einen bestimmten Zeitraum, wie 10 Tage, 20 Minuten, 30 Wochen oder jede Zeitdauer, die der Händler wählt, übernommen. Es gibt Vorteile mit einem gleitenden Durchschnitt in Ihrem Trading, sowie Optionen auf welche Art von gleitenden Durchschnitt zu verwenden. Moving durchschnittliche Strategien sind auch beliebt und kann auf jeden Zeitrahmen angepasst werden, sowohl langfristige Investoren und kurzfristige Händler passen. (Siehe Die Top Four Technical Indicators Trend Trader müssen wissen.) Warum ein Moving Average Ein gleitender Durchschnitt kann dazu beitragen, reduzieren die Menge an Lärm auf einer Preis-Chart. Schauen Sie sich die Richtung der gleitenden Durchschnitt, um eine grundlegende Vorstellung davon, wie der Preis bewegt wird. Abgewinkelt und der Preis ist nach oben (oder war vor kurzem) insgesamt, abgewinkelt und der Preis verschiebt sich insgesamt, bewegte sich seitwärts und der Preis ist wahrscheinlich in einer Reihe. Ein gleitender Durchschnitt kann auch als Unterstützung oder Widerstand dienen. In einem Aufwärtstrend kann ein 50-Tage-, 100-Tage - oder 200-Tage-Bewegungsdurchschnitt als Stützpegel dienen, wie in der folgenden Abbildung gezeigt. Dies ist, weil der Durchschnitt fungiert wie ein Boden (Unterstützung), so dass der Preis springt von ihm aus. In einem Abwärtstrend kann ein gleitender Durchschnitt als Widerstand wie eine Decke wirken, der Preis schlägt ihn und fängt wieder an, wieder zu fallen. Der Preis nicht immer respektieren die gleitenden Durchschnitt auf diese Weise. Der Preis kann durch ihn leicht oder stoppen und rückwärts laufen, bevor er es erreicht. Als allgemeine Richtlinie, wenn der Preis über einem gleitenden Durchschnitt ist der Trend ist. Wenn der Preis unter einem gleitenden Durchschnitt ist der Trend nach unten. Bewegungsdurchschnitte können jedoch unterschiedliche Längen haben (kurz erörtert), so kann man einen Aufwärtstrend angeben, während ein anderer einen Abwärtstrend anzeigt. Arten von Bewegungsdurchschnitten Ein gleitender Durchschnitt kann auf unterschiedliche Weise berechnet werden. Ein fünf Tage einfacher gleitender Durchschnitt (SMA) addiert einfach die fünf letzten täglichen Schlusspreise und teilt sie durch fünf, um einen neuen Durchschnitt jeden Tag zu verursachen. Jeder Durchschnitt ist mit dem nächsten verbunden, wodurch die singuläre fließende Linie. Eine andere populäre Art von gleitendem Durchschnitt ist der exponentielle gleitende Durchschnitt (EMA). Die Berechnung ist komplexer, erfordert aber grundsätzlich mehr Gewichtung auf die jüngsten Preise. Plot ein 50-Tage-SMA und eine 50-Tage-EMA auf dem gleichen Chart, und Sie werden bemerken, dass die EMA reagiert schneller auf Preisänderungen als die SMA, aufgrund der zusätzlichen Gewichtung auf aktuelle Preisdaten. Charting-Software und Handelsplattformen tun die Berechnungen, so dass keine manuelle Mathematik erforderlich ist, um eine MA zu verwenden. Eine Art von MA ist nicht besser als eine andere. Eine EMA kann in einer Aktie oder einem Finanzmarkt für eine Zeit besser funktionieren, und manchmal kann ein SMA besser funktionieren. Der Zeitrahmen, der für einen gleitenden Durchschnitt gewählt wird, wird auch eine bedeutende Rolle spielen, wie effektiv er ist (unabhängig vom Typ). Durchschnittliche durchschnittliche Länge Durchschnittliche durchschnittliche Längen sind 10, 20, 50, 100 und 200. Diese Längen können je nach Handelshorizont auf einen beliebigen Chartzeitrahmen (eine Minute, täglich, wöchentlich usw.) angewendet werden. Der Zeitrahmen oder die Länge, die Sie für einen gleitenden Durchschnitt wählen, der auch Rückblickzeit genannt wird, kann eine große Rolle spielen, wie effektiv er ist. Ein MA mit einem kurzen Zeitrahmen reagiert viel schneller auf Preisänderungen als ein MA mit einem langen Blick zurück Zeitraum. In der unten stehenden Grafik zeigt der 20-Tage-Gleitkurs den tatsächlichen Preis näher als der 100-Tage-Kurs. Der 20-tägige Tag kann für einen kürzerfristigen Trader von analytischem Nutzen sein, da er dem Preis enger folgt und daher weniger Verzögerungen verursacht als der längerfristige gleitende Durchschnitt. Lag ist die Zeit, die für einen gleitenden Durchschnitt benötigt wird, um eine mögliche Umkehr zu signalisieren. Als eine allgemeine Richtlinie, wenn der Preis über einem gleitenden Durchschnitt liegt, wird der Trend betrachtet. Also, wenn der Preis sinkt unter dem gleitenden Durchschnitt es signalisiert eine potenzielle Umkehr auf der Grundlage dieser MA. Ein 20-Tage gleitender Durchschnitt liefert viel mehr Umkehrsignale als ein 100-Tage gleitender Durchschnitt. Ein gleitender Durchschnitt kann jede beliebige Länge, 15, 28, 89 usw. sein. Die Anpassung des gleitenden Durchschnitts, so dass es genauere Signale auf historischen Daten liefert, kann dazu beitragen, bessere Zukunftssignale zu erzeugen. Handelsstrategien - Crossovers Crossovers sind eine der wichtigsten gleitenden Durchschnittsstrategien. Der erste Typ ist ein Preis-Crossover. Dies wurde früher diskutiert und ist, wenn der Kurs über oder unter einem gleitenden Durchschnitt kreuzt, um eine mögliche Trendveränderung zu signalisieren. Eine andere Strategie ist es, zwei gleitende Durchschnitte auf ein Diagramm anzuwenden, ein längeres und ein kürzeres. Wenn die kürzere MA über die längerfristige MA geht, ist sie ein Kaufsignal, wie es den Trend anzeigt, sich zu verschieben. Dies wird als goldenes Kreuz bezeichnet. Wenn die kürzere MA-Kreuzung unterhalb der längerfristigen MA ist ein Verkaufssignal, wie es zeigt den Trend nach unten verschiebt. Dies wird als Totentodeskreuz bezeichnet. Bewegungsdurchschnitte werden auf der Grundlage von historischen Daten berechnet, und nichts über die Berechnung ist prädiktiv in der Natur. Daher können Ergebnisse mit gleitenden Durchschnitten zufällig sein - manchmal scheint der Markt die Resistenz und Handelssignale von MA zu respektieren. Und andere Male zeigt es keinen Respekt. Ein Hauptproblem besteht darin, dass, wenn die Preisaktion choppy wird, der Preis hin und her wechselt und mehrere Trend-Reversaltrade-Signale erzeugt. Wenn dies geschieht, sein bestes, um beiseite zu treten oder einen anderen Indikator zu verwenden, um zu helfen, den Trend zu erklären. Dasselbe kann bei MA-Crossover auftreten, wo die MAs für eine Zeitspanne verwirren, die mehrere (magere Verlierenden) Trades auslöst. Gleitende Mittelwerte arbeiten sehr gut in starken Trending-Bedingungen, aber oft schlecht in choppy oder ranging Bedingungen. Das Anpassen des Zeitrahmens kann dies vorübergehend unterstützen, obwohl es an einem gewissen Punkt wahrscheinlich ist, dass diese Probleme ungeachtet des für die MA (s) gewählten Zeitrahmens auftreten. Ein gleitender Durchschnitt vereinfacht die Preisdaten durch Glätten und Erzeugen einer fließenden Linie. Dadurch können Trenntrends vereinfacht werden. Exponentielle gleitende Mittelwerte reagieren schneller auf Preisänderungen als ein einfacher gleitender Durchschnitt. In einigen Fällen kann dies gut sein, und in anderen kann es zu falschen Signalen führen. Auch die Wechselkurse mit einer kürzeren Rückblickperiode (z. B. 20 Tage) reagieren schneller auf Preisänderungen als ein Durchschnitt mit einer längeren Blickperiode (200 Tage). Moving Durchschnitt Crossovers sind eine beliebte Strategie für die Ein-und Ausgänge. MAs können auch Bereiche der potenziellen Unterstützung oder Widerstand. Während dies kann prädiktiv erscheinen, sind gleitende Durchschnittswerte immer auf historischen Daten basieren und zeigen einfach den durchschnittlichen Preis über einen bestimmten Zeitraum.


No comments:

Post a Comment