Vorming, Sekondêre onderwys en skole
Naaste metode: voorbeeld van werk
die naaste metode is die maklikste metrieke klassifiseerder wat gebaseer is op die evaluering van die ooreenkoms van verskillende voorwerpe.
Ontleed voorwerp behoort aan die klas waartoe hulle behoort vakke van opleiding monster. Kom ons vind uit wat is die naaste. Probeer om die ingewikkelde saak, voorbeelde van verskillende tegnieke te verstaan.
hipotese metode
naaste metode kan beskou word as die mees algemene algoritme wat gebruik word vir klassifikasie. Voorwerp ondergaan klassifikasie behoort aan die klas y_i, waaraan die naaste voorwerp leer x_i monster.
Spesifisiteit van metodes naaste bure
k naaste metode kan die akkuraatheid van klassifikasie te verbeter. Ontleed voorwerp behoort aan dieselfde klas as die grootste deel van sy bure, dit wil sê, k naby daaraan voorwerpe van die ontleed monster x_i. In die oplossing van probleme met twee klasse van die aantal bure sal vreemd om 'n situasie van dubbelsinnigheid te vermy, indien dieselfde aantal bure sal behoort aan verskillende klasse.
Die tegniek van geskors bure
-Postgresql ontleed metode tsvector naaste bure is wat gebruik word wanneer die aantal klasse ten minste drie, en jy kan nie 'n onewe getal te gebruik. Maar dubbelsinnigheid ontstaan selfs in hierdie gevalle. Dan, die i-de buurman kry w_i gewig, wat neem af met die naaste rang i. Dit verwys na die klas van die voorwerp, wat 'n maksimum totale gewig onder naby bure sal hê.
Die hipotese van kompaktheid
Aan die hart van al die bogenoemde metodes is die hipotese van kompaktheid. Dit dui op 'n verband tussen die mate van die ooreenkoms van voorwerpe en hul deel uitmaak van dieselfde klas. In hierdie situasie, die grens tussen die verskillende tipes is 'n eenvoudige vorm, en klasse van voorwerpe te skep in ruimte kompakte mobiele area. Onder sulke gebiede in wiskundige analise geneem om 'n geslote begrensde set beteken. Hierdie hipotese is nie verband hou met die alledaagse persepsie van die woord.
Die basiese formule
Kom ons kyk na meer naaste buurman. As die voorgestelde opleiding monster tipe "voorwerp-reaksie» X ^ m = \ {(x_1, y_1), \ dots, (x_m, y_m) \}; As 'n pluraliteit van voorwerpe om die afstand funksie \ rho (x, x ') te definieer, wat verteenwoordig word in die vorm van 'n voldoende model ooreenkoms van voorwerpe deur die verhoging van die waarde van die funksie daal ooreenkoms tussen voorwerpe x, x'.
Vir enige voorwerp, sal u bou 'n opleiding monster x_i voorwerpe met 'n toenemende afstande na u:
\ Rho (u, x_ {1; u}) \ Leq \ rho (u, x_ {2; u}) \ Leq \ cdots \ Leq \ rho (u, x_ {m; u}),
waar x_ {i; u} kenmerkend van die voorwerp leer monster, wat i-de naaste bron voorwerp u. Sulke notasie en gebruik om te antwoord op i-de buurman: y_ {i; u}. As gevolg hiervan, vind ons dat enige voorwerp u ontlok hernommer eie monster.
Bepaling van die aantal k van bure
naaste metode wanneer k = 1 in staat is om 'n foutiewe klassifikasie, nie net op voorwerpe-uitstoot, maar ook vir ander klasse wat naby is, is.
As ons k = m, sal die algoritme as stabiel wees en sal ontaard in 'n konstante waarde. Dit is waarom betroubaarheid is belangrik om te verhoed dat uiterste indekse k.
In die praktyk, as die optimale indeks k gebruik maatstaf gly beheer.
vertonings uitstoot
Die oogmerke van studie is grootliks ongelyk, maar onder hulle is daar diegene wat die eienskappe van 'n klas en word verwys na as standaarde. Op nabyheid van die onderwerp om die ideale model van sy hoë waarskynlikheid van wat deel uitmaak van hierdie klas.
Hoe rezultativen metode van naaste bure? 'N Voorbeeld kan gesien word op die basis van perifere en nie-insiggewende kategorieë voorwerpe. Daar word aanvaar digte omgewing van die voorwerp ander verteenwoordigers van hierdie klas. Wanneer jy verwyder hulle uit die klassifikasie van die monsterneming van die gehalte sal ly nie.
Kry in 'n sekere aantal monsters kan geraas bars wat "op die grond" van 'n klas is. Verwydering aansienlik positiewe impak op die gehalte van die klassifikasie.
As die monster geneem van die leersaam en uit te skakel geraas voorwerpe, kan jy reken op 'n paar positiewe resultate op dieselfde tyd.
Die eerste interpolasie metode van die naaste buurman klassifikasie toelaat om die gehalte te verbeter, die bedrag van data wat gestoor word verminder, verminder die tyd van klassifikasie, wat bestee word op die keuse van die volgende standaarde.
Die gebruik van ultra-groot monsters
naaste metode is gebaseer op die werklike stoor van leer voorwerpe. Om baie grootskaalse monsters met behulp van 'n tegniese probleem skep. Die doel is nie net om 'n beduidende hoeveelheid inligting te red nie, maar ook in die minimum bedrag van tyd tot tyd aan enige voorwerp u k onder die naaste bure vind het.
Om te gaan met hierdie taak, is twee metodes gebruik:
- uitgedun monster via 'n ontslag nie-data voorwerpe;
- effektiewe gebruik spesiale datastruktuur en kodes vir direkte soek na die naaste bure.
Reëls van seleksie metodes
Die bogenoemde klassifikasie beskou. Naaste metode word gebruik in die oplossing van praktiese probleme, wat vooraf bekend is die afstand funksie \ rho (x, x '). In die beskrywing van voorwerpe numeriese vektore gebruik 'n Euklidiese metrieke. Hierdie keuse het geen spesiale motivering, maar behels die meting van alle tekens "in dieselfde skaal." As hierdie faktor nie in ag geneem word, dan sal die metrieke funksie met hoogste numeriese waardes oorheers.
As daar 'n aansienlike bedrag van funksies, die berekening van die afstand as die som van die afwykings op spesifieke simptome verskyn ernstige probleem dimensie.
In 'n hoë dimensionele ruimte ver van mekaar sal al die voorwerpe. Uiteindelik sal 'n monster wees langs die voorwerp wat bestudeer k bure. gekies om 'n klein aantal insiggewende kenmerke om hierdie probleem uit te skakel. Algoritmes vir die berekening van skattings te bou op die grondslag van verskillende stelle van tekens, en vir elke individu te bou hul nabyheid funksie.
gevolgtrekking
Wiskundige berekeninge behels dikwels die gebruik van 'n verskeidenheid van tegnieke wat hul eie kenmerkende eienskappe, voordele en nadele het. Beskou naaste metode kan nogal 'n ernstige probleem op te los, te danke aan die eienskappe van wiskundige voorwerpe. Die eksperimentele konsep, gebaseer op die ontleed metode word aktief gebruik in kunsmatige intelligensie.
In die deskundige stelsels is dit nodig nie net om voorwerpe te klassifiseer nie, maar ook wys die gebruiker 'n verduideliking van die klassifikasie in vraag. In hierdie metode, 'n verduideliking van hierdie verskynsel word uitgedruk in verhouding tot die voorwerp van 'n bepaalde klas sowel as sy ligging relatief tot die gebruik monster. Wetlike bedryf spesialiste, geoloë, dokters, neem hierdie "presedent" logika aktief gebruik dit in hul navorsing.
Ten einde te ontleed metode was die mees betroubare, doeltreffende, gee die gewenste resultate, moet jy 'n minimum figuur k neem, terwyl dit ook die uitstoot onder die ontleed voorwerpe te vermy. Dit is waarom die gebruik van standaarde en die seleksie metode, asook die optimalisering statistieke.
Similar articles
Trending Now