Thursday 23 November 2017

Forex Data Mining Verktøy


Introduksjon til FX Data Mining Vi gjør en enkel og rask introduksjon til et av de mest interessante feltene i dag - Data Mining. Det finnes et bredt spekter av data mining applikasjoner. Vi bør integrere Data Mining i vår FX trading. FX, FOREX eller Foreign Exchange FX er det største markedet når det gjelder daglig handlet volum. Den har tre hovednivåer av deltakere: de store guttene, mellomplanet og enkle handelsmenn som deg og meg. Det har en spekulativ natur, noe som betyr at vi ikke bytter varer mesteparten av tiden. Vi bryr oss bare om forskjellen og ønsker å kjøpe lavt og selge høyt eller selge høyt og kjøpe lavt. Ved korte eller lange operasjoner kan vi få pips. Avhengig av volumet ditt, kan pipverdien variere fra en cent til 10 og mer. Dette er den viktigste måten å tjene penger på valutamarkedet (sammen med Carry Trade, Brokering, Arbitrage og mer). Legg merke til at valutamarkedet er stort, men passer for alle nivåer av spillere. Tenk på valutamarkedet som et uendelig supermarked med uendelig antall produkter og kunder, men det har også et uendelig antall kasserere. Det betyr at det er like mange muligheter for alle. Data Mining og Machine Learning Data Mining er et modent delfelt i datalogi. Det handler om mye data og ikke trivial utvinning av brukbar kunnskap fra massive datamengder. Det er gjort av Intelligent databehandling ved hjelp av Machine Learning-algoritmer. Data Mining er ikke bare CRUD (Lag, Les, Oppdater og Slett). Vi har flere data mining metoder. Herav metodene og noen applikasjoner. Klassifisering - klassifisering av e-post som spam, klassifisering av en transaksjon som svindel. Forening - YouTube foreslår oss nye videoer basert på vår historie. Amazon foreslår oss flere varer under kassen. Clustering - analyse av ustrukturerte data som økonomiske nyheter og meninger for å finne felles grupper. Process Mining - undersøk logger av samtaleoperatører for å finne ineffektive operasjoner. Text Mining - gruvedrift eller teknisk analyse for mønstergenkjenning. Algoritmisk handel er en automatisert utførelse av en handelsalgoritme. I vårt tilfelle kommer handelsalgoritmen fra gruvedriften. Den automatiserte handel er utført av noen konge av programmeringsspråk. Hastighet og robusthet er viktige punkter her: Menneskelig næringsdrivende kan ikke slå dataprogrammet om disse egenskapene. Det kan være HFT (High Frequency Trading) og lavt nivå programmering (som C) eller langsiktig handel og høyt nivå programmering (som Java). Bland Algoritmisk Trading med Data Mining Blanding Data Mining i Algoritmic Trading er viktig. Det viktigste er data. Et enkelt prinsipp sier at hvis dine data ikke er gode nok, vil modellene dine ikke være gode nok (GIGO). Det handler om å lage en modell, implementere den og teste den (som alltid). For tiden er denne strømmen for det meste manuell. Data Mining Software Det er mange muligheter for åpen kildekode programvare innen Data Mining. WEKA er et Data Mining-rammeverk som stammer fra University of Waikato, Hamilton, New Zealand. WEKA er skrevet i Java og har en flott API. Du har også implementeringer for de fleste kjente maskinlæringsalgoritmer. Blanding av gode verktøy er avgjørende. Det er for mange mulige handelsmodeller. Å kaste en mynt er et dumt handelssystem, men det er et handelssystem. Vi trenger Data Mining for å finne gullet. Gode ​​verktøy er enkle å få så lykke til med gruvedrift. Hvis du er på utkikk etter mer informasjon om vitenskapelig FX-handel, er ditt neste trinn å utforske data mining verktøy og historiske data. Besøk algonell for mer informasjon. Du finner oss på twitter. facebook. Google. LinkedIn og WordPress. De beste data mining verktøyene du kan bruke gratis i din bedrift fredag ​​8 mars 2013 kl 02:01. Data mining eller 8220Knowledge Discovery i Databases8221 er prosessen med å oppdage mønstre i store datasett med kunstig intelligens, maskinlæring, statistikk og databasesystemer. Det overordnede målet med en data mining prosess er å trekke ut informasjon fra et datasett og omdanne det til en forståelig struktur for videre bruk. Her er et enkelt, men fascinerende eksempel på hvordan datautvinning bidro til å forkaste feilforutsetninger og konklusjoner om jenter og handle med enorm samfunnsmessig innvirkning. I lang tid ble den høye utsendelsen av jentene i skolene i utviklingsland forklart med sosiologisk og kulturell hypotese: jenter er ikke oppmuntret av urfolkssamfunn, foreldre behandler jenter annerledes, jenter presses til å gifte seg tidligere eller lastet med mye mer arbeid enn gutter. Noen andre som bruker økonomiske teorier, spekulerte på at jenterutdanning ikke er sett av disse samfunnene som en god investering. Så i årene 90-tallet kom en gruppe unge datavinnere som plugget inn i flere skoleregister på fravær, og oppdaget langsomt at jenter savnet skoler for få dager hver måned, med fantastisk regelmessighet og forutsigbarhet. Litt mer analyse avslører at jenter savnet skoler hovedsakelig i løpet av menstruasjonsperioden, og fordi det ikke var noen trygg måte for dem å føle seg rene og komfortable å komme i skole i den perioden. Konsekvensen, 8220millioner av jenter som bor i utviklingsland som Uganda, hopper opp til 20 av skoleåret, bare fordi de ikke har råd til å kjøpe vanlige sanitære produkter når de menstruerer. Denne bevisste fraværet har enorme konsekvenser for girls8217 utdanning og akademisk potensial.8221 8211 Afripads I vestlige land og i Asia bruker bedrifter og regjeringer datautvinning for å gjøre gode funn. Vi kan gjøre det samme i Afrika. Det finnes mange gratis verktøy for å gjøre det. Jeg har samlet det beste av dem her for deg. Prøv det, start sakte, men fortsett med tålmodighet. Det kan gi fantastiske og transformasjonsresultater som Afripads hjelper nå afrikanske jenter til å bli på skolen. (Du kan også laste ned MIT Open kursmateriale på Data Mining her) 1. RapidMiner RapidMiner er utvilsomt det verdensledende open source-systemet for data mining. Den er tilgjengelig som en frittstående applikasjon for dataanalyse og som datautvinningsmotor for integrering i egne produkter. Tusenvis av applikasjoner av RapidMiner i mer enn 40 land gir brukerne en konkurransefortrinn. 2. RapidAnalytics Bygget rundt RapidMiner som en kraftig motor for analytisk ETL, dataanalyse og prediktiv rapportering, er den nye forretningsanalyseserveren RapidAnalytics nøkkelproduktet for alle forretningskritiske dataanalyser og en milepæl for forretningsanalyse. Weka er en samling av maskinlæringsalgoritmer for data mining oppgaver. Algoritmene kan enten brukes direkte på et datasett eller kalt fra din egen Java-kode. Weka inneholder verktøy for forhåndsbehandling av data, klassifisering, regresjon, clustering, foreningsregler og visualisering. Det er også godt egnet for å utvikle nye maskinlæringssystemer. PSPP er et program for statistisk analyse av samplede data. Den har et grafisk brukergrensesnitt og konvensjonelle kommandolinjegrensesnitt. Den er skrevet i C, bruker GNU Scientific Library for sine matematiske rutiner, og plotutiler for generering av grafer. Det er en gratis erstatning for det proprietære programmet SPSS (fra IBM) forutsi med tillit hva som vil skje neste, slik at du kan ta smartere beslutninger, løse problemer og forbedre resultatene. KNIME er en brukervennlig grafisk arbeidsbenk for hele analyseprosessen: datatilgang, datatransformasjon, innledende undersøkelse, kraftig prediktiv analyse, visualisering og rapportering. Den åpne integrasjonsplattformen gir over 1000 moduler (noder) Orange er en åpen kildekode data visualisering og analyse for nybegynnere og eksperter. Data mining gjennom visuell programmering eller Python scripting. Komponenter for maskinlæring. Add-ons for bioinformatikk og tekstutvinning. Pakket med funksjoner for dataanalyse. 7. Apache Mahout Apache Mahout er et Apache-prosjekt for å produsere gratis implementeringer av distribuerte eller ellers skalerbare maskinlæringsalgoritmer på Hadoop-plattformen. For tiden støtter Mahout hovedsakelig fire brukstilfeller: Anbefaling gruvedrift tar brukerne8217 oppførsel, og fra det forsøker å finne elementer som brukerne kanskje vil like. Clustering tar f. eks. tekstdokumenter og grupperer dem i grupper av lokalt relaterte dokumenter. Klassifisering lærer av å utgjøre kategoriserte dokumenter hvilke dokumenter av en bestemt kategori som ser ut og kan tildele umerkede dokumenter til (forhåpentligvis) riktig kategori. Hyppig itemet mining tar et sett med varegrupper (vilkår i en spørringsøkt, innhold i handlekurv) og identifiserer hvilke individuelle elementer som regel vises sammen. 8. jHepWork jHepWork (eller 8220jWork8221) er et miljø for vitenskapelig beregning, dataanalyse og datavisualisering designet for forskere, ingeniører og studenter. Programmet inneholder mange programvarepakker med åpen kildekode til et sammenhengende grensesnitt ved hjelp av begrepet skripting, i stedet for bare GUI eller makrobasert konsept. jHepWork kan brukes overalt hvor en analyse av store numeriske datavolum, datautvinning, statistisk analyse og matematikk er avgjørende (naturvitenskap, engineering, modellering og analyse av finansmarkeder). Rattle (R-analytisk verktøy som lærer enkelt) presenterer statistiske og visuelle oppsummeringer av data, forvandler data til former som lett kan modelleres, bygger både uovervåtte og overvåkede modeller fra dataene, presenterer modellens ytelse grafisk og skårer nye datasett. Det er en gratis og åpen kildekode data mining toolkit skrevet i det statistiske språket R ved hjelp av Gnome grafisk grensesnitt. Den kjører under GNULinux, Macintosh OS X og MSWindows. Rattle brukes i virksomheten, regjeringen, forskningen og for å undervise datautvinning i Australia og internasjonalt. MetaTrader Expert Advisor På grunn av de unike egenskapene til ulike valutapar, er mange kvantitative Forex-strategier designet med et bestemt valutapar i tankene. Selv om dette kan produsere mange lønnsomme handelsstrategier, er det også fordeler med å utvikle strategier som kan handles på tvers av flere valutapar. Dette introduserer et element av diversifisering som kan gi et ekstra nivå på nedsidebeskyttelse. Daniel Fernandez publiserte nylig et system som han designet for å handle på hver av de fire Forex-majors. Målet hans var å finne et system som ville ha produsert en 20 års oversikt over lønnsom handel på EURUSD, GBPUSD, USDJPY og USDCHF. Daniel bruker en data mining tilnærming til å utvikle en strategi for handel av de fire Forex majors. For å konstruere sitt system brukte Daniel sin data mining programvare for å definere inngangs - og utgangssignaler som ville ha produsert en lønnsom handelsstrategi på hvert av de fire valutaparene de siste 20 årene. Det han møter er en kombinasjon av tre prisbaserte regler som danner grunnlaget for sin Forex Majors-strategi. Daniel8217s Forex Majors Strategi Daniel8217s Forex Majors strategi er veldig enkel fordi den alltid har en stilling, enten lang eller kort, i hver av de fire valutaparene som den handler. Den baserer alle sine handler på daglige diagrammer. Strategien går lang når følgende tre betingelser er oppfylt: Strategien går kort når følgende tre betingelser er oppfylt: Som du kan se er strategien i utgangspunktet en optimal trendstrategi. Dette gir mening fordi Daniel sier i begynnelsen av sin artikkel at langsiktig trend etter strategier generelt er de beste strategiene for handel med flere markeder. En ekstra regel som Daniel8217s strategi bruker, er et ATR-basert stoppested. Det faste stoppet er satt til 180 av 20-dagers ATR. Hvis stoppet utløses, forblir strategien ute av markedet til et signal genereres i motsatt retning. Testing indikerer at re-enter på et signal i samme retning negativt påvirket ytelse. Backtesting Performance De backtesting resultatene som Daniel inkluderte i hans innlegg viser at strategien var ganske lønnsom. Det ga et vinnerforhold på 45, en fortjenestefaktor på 1,38, og en belønning til risikoforhold på 1,68. Daniel8217s største bekymring for strategien var at den maksimale uttrekningstiden utgjorde svært lang tid. Ifølge Daniel8217s tall var gjennomsnittlig årlig avkastning 9,67. Dette besto av 16 lønnsomme år, 4 tapende år og ett år som i utgangspunktet brøt til og med. Det beste året var en avkastning på 37,76, og det verste året var et tap på 20,2. Daniel bemerker at dette systemet ikke ville utgjøre en god frittstående strategi på grunn av avkastningen i forhold til maksimale drawdowns. Imidlertid foreslår han at det kan være et interessant stykke av en større, multi-systemstrategi. Følgende er noen gratis og eller åpne kildeverktøy for data mining applikasjoner. Noen av dem er gratis for ikke-kommersiell bruk. Vennligst sjekk tilsvarende nettsteder for lisensdetaljer. R IDEEditors R - et gratis programvaremiljø for statistisk databehandling og grafikk RStudio - en IDE for R Tinn-R - en gratis GUI for R språk og miljø. Data Mining Software Weka - en åpen kildekode programvare for data mining RapidMiner - et åpent kilde system for data og tekst mining KNIME - en åpen kildekode data integrasjon, prosessering, analyse og lete plattform Mahout maskin læring bibliotek - gruve store data settene. Den støtter anbefaling gruvedrift, clustering, klassifisering og hyppige elementet mining. Rattle - en GUI for data mining ved hjelp av R Clustering CLUTO - en programvarepakke for klyping av lav - og høydimensjonale datasett fastcluster - raske hierarkiske clusteringrutiner for R - og Python Association Regelsekvensanalyse TraMineR - en R-pakke for gruvedrift og visualisering av sekvensdata Sosiale Nettverksanalyse Gephi - En interaktiv visualiserings - og utforskningsplattform for nettverk og komplekse systemer, dynamiske og hierarkiske grafer Pajek - et gratis verktøy for stor nettverksanalyse og visualisering CFinder - en gratis programvare for å finne og visualisere overlappende tette grupper av noder i nettbaserte på CPC-prosessminnet Spatial Data Analysis GeoDa - en gratis programvare for romlig dataanalyse CLAVIN - en åpen kildekode programvarepakke for dokument geotagging og geoparsing som bruker kontekstbasert geografisk enhetoppløsning

No comments:

Post a Comment