Najbliža susjedna metoda: primjer posla

Metoda najbližeg susjeda je najjednostavniji klasifikator metrike koji se temelji na procjeni sličnosti različitih objekata.

Analizirani objekt se odnosi na klasu kojoj pripadaju subjekti uzorka obuke. Otkrijmo koja je metoda najbližeg susjeda. Pokušajmo razumjeti ovo složeno pitanje, dati primjere različitih tehnika.

susjedna metoda

Hipoteza metode

Najbliža susjedna metoda može se smatrati najčešćim algoritmom koji se koristi za klasifikaciju. Objekt koji se podvrgava klasifikaciji pripada onoj klasi y_i, kojoj pripada najbliži objekt uzorka učenja x_i.

Specifičnost metodologije najbližih susjeda

Metoda k najbližih susjeda omogućuje povećanje pouzdanosti klasifikacije. Analizirani objekt pripada istoj klasi kao i većina njenih susjeda, tj. Blizu objekata analiziranog uzorka x_i. U rješavanju problema s dvije klase broja susjeda će biti čudno da se izbjegne situaciju dvosmislenosti, ako je isti broj susjeda će pripadati različitim klasama.

susjedni primjer

Tehnika izvaganja susjeda

Postgresql-metoda najbližih susjeda tsvector se koristi kada je broj klasa ne manji od tri, a neudobnost se ne može koristiti. No, u tim se slučajevima javlja i dvosmislenost. Onda i-taj susjed dobiva težinu w_i, koja se smanjuje s porastom poretka susjeda i. Objekt se odnosi na klasu koja će imati maksimalnu ukupnu težinu kod bliskih susjeda.

susjedni primjer

Kompaktna hipoteza

U srcu svih gore navedenih metoda je hipoteza o kompaktnosti. To uključuje vezu između mjere sličnosti objekata i njihove pripadnosti jednoj klasi. U ovoj situaciji, granica između različitih prikaza ima jednostavan oblik, a klase stvaraju kompaktna mobilna područja u prostoru objekata. Pod takvim domenama u matematičkoj analizi, obično se misli na zatvorene ograničene skupove. Ova hipoteza nije povezana s svakodnevnom percepcijom te riječi.

Osnovna formula

Dajmo detaljnije analizirati metodu najbližeg susjeda. Ako je predložena učenje tipa uzorak „objektno odgovor» X ^ m = {(x_1, y_1) točke (x_m, y_m) } - ako je postavljena udaljenost funkcije p (x, X), u više predmeta koji prikazan je u obliku adekvatnog modela sličnosti objekata, kao što povećava vrijednost ove funkcije, sličnost između objekata x, x `smanjuje.

Za bilo koji objekt u, mi konstruiramo objekte uzorka obuke x_i kao udaljenosti za u povećanje:

Rho (u, x_ {1 u}) leq p (u, x_ {2-} u) leq cdots ekv p (u, x_ {m- u}),

gdje x_ {i-u} obilježava objekt uzorka obuke, koji je i-taj susjed izvornog objekta u. Koristimo ovu notaciju za odgovor na i-taj susjed: y_ {i-u}. Kao rezultat toga dobivamo da proizvoljni objekt u izaziva promjenu u broju vlastitog uzorka.

najbliže susjedne metode

Određivanje broja susjeda k

Metoda najbližeg susjeda na k = 1 može dati pogrešnu klasifikaciju, ne samo na emisijske objekte, već i za druge klase koje se nalaze u blizini.

Ako uzmemo k = m, algoritam će biti što je moguće stabilniji i degenerirati u konstantnu vrijednost. Zato je za pouzdanost važno ne dopustiti ekstremne pokazatelje k.



U praksi, kriterij za kliznu kontrolu koristi se kao optimalni pokazatelj k.

najbliža susjedna klasifikacija

Ukidanje emisija

Predmeti treninga uglavnom su neravnopravni, ali među njima postoje i oni koji imaju karakteristične osobine klase i nazivaju se standardima. Uz bliskost subjekta s idealnim uzorkom, vjerojatnost pripadnosti određenoj klasi je visoka.

Koliko je učinkovita metoda najbližih susjeda? Primjer se može proučiti na temelju perifernih i neinformativnih kategorija objekata. Pretpostavlja se da je okolno okruženje gusto okruženo drugim predstavnicima ove klase. Ako ih uklonite iz uzorka, to neće utjecati na kvalitetu klasifikacije.

Ulazak u takav uzorak može biti određeni broj emisija buke koji su "u deblu" drugog razreda. Uklanjanje u osnovi ima pozitivan učinak na kvalitetu izvršene klasifikacije.

Ako se neobavijesni i objekti buke uklone iz uzorka, istodobno se može očekivati ​​nekoliko pozitivnih rezultata.

Prije svega interpolacija od strane najbliži susjed klasifikacija omogućuje poboljšati kvalitetu, smanjiti količinu pohranjenih podataka, smanjiti vrijeme klasifikacije, koji je proveo o izboru slijedećih standarda.

Korištenje ekstra velikih uzoraka

Najbliža susjedna metoda temelji se na stvarnoj pohrani objekata za obuku. Za izradu super velikih uzoraka koristite tehničke probleme. Zadatak nije samo očuvanje značajne količine informacija, nego i minimalnog vremenskog okvira za pronalaženje proizvoljnog objekta u među najbližim susjedima.

Kako bi se nosili s tim zadatkom, koriste se dvije metode:

  • izbaci uzorak bacanjem neinformativnih objekata;
  • primjenjuju se posebne učinkovite strukture i indekse podataka za trenutnu pretragu najbližih susjeda.

Pravila za odabir metodologije

Klasifikacija je razmatrana gore. Metoda najbližeg susjeda koristi se za rješavanje praktičnih problema u kojima je unaprijed poznata funkcija udaljenosti rho (x, x `). Pri opisivanju objekata numerički vektori koriste Euklidski mjerni podatak. Takav izbor nema posebnog opravdanja, ali podrazumijeva mjerenje svih znakova "na jednoj skali". Ako se ovaj faktor ne uzme u obzir, tada će mjerni podatak dominirati znakom koji ima najveće numeričke vrijednosti.

U nazočnosti značajnog broja značajki, računajući udaljenost kao zbroj odstupanja za određene karakteristike, pojavljuje se ozbiljan problem dimenzionalnosti.

U prostoru visoke dimenzije, svi objekti bit će daleko jedni od drugih. U konačnoj analizi, arbitrarni uzorak susjeda koji su najbliži predmetu koji se proučava k bit će proizvoljni. Kako bi se uklonili ovaj problem, odabran je mali broj informativnih znakova. Algoritmi za izračunavanje procjena temelje se na različitim skupovima karakteristika, a za svakog pojedinca grade svoju funkciju blizine.

postgresql najbliži susjedni metoda tsvector

zaključak

Matematički izračuni često uključuju uporabu različitih tehnika koje imaju svoje osobitosti, prednosti i nedostatke. Razmatrana metoda najbližih susjeda omogućuje rješavanje vrlo ozbiljnih problema vezanih uz karakterizaciju matematičkih objekata. Eksperimentalni koncepti, temeljeni na analiziranoj tehnici, sada se aktivno koriste u alatu za umjetnu inteligenciju.

U ekspertnim sustavima potrebno je ne samo svrstati objekte, već i pokazati korisniku objašnjenje predmetne klasifikacije. U ovoj metodi, objašnjenja za takav fenomen izražavaju se odnosom objekta prema određenoj klasi, kao i svojom lokacijom u odnosu na upotrijebljeni uzorak. Stručnjaci pravne industrije, geolozi, liječnici, prihvaćaju ovu "presedanu" logiku, aktivno ga koriste u svojim studijama.

Da bi analizirana metoda bila što pouzdanija, učinkovita, dala željeni rezultat, potrebno je uzeti minimalni pokazatelj k, a također ne dopustiti emisije iz analiziranih objekata. Zbog toga se primjenjuje metodologija odabira standarda, a metrika se optimizira.

Dijelite na društvenim mrežama:

Povezan
Kakve zadatke uključuje klasu matematike u pripremnoj skupini?Kakve zadatke uključuje klasu matematike u pripremnoj skupini?
Najučinkovitije sredstvo žohara, ili Rat s insekataNajučinkovitije sredstvo žohara, ili Rat s insekata
Kako saznati lozinku s Wi-Fi susjeda. Pronađite lozinku za Wi-Fi routerKako saznati lozinku s Wi-Fi susjeda. Pronađite lozinku za Wi-Fi router
Najbliža zvijezda na Zemlji je Proxima CentauriNajbliža zvijezda na Zemlji je Proxima Centauri
Kako mogu rotirati stavke u Sims 4? Kako rotirati objekte u "The Sims 4"?Kako mogu rotirati stavke u Sims 4? Kako rotirati objekte u "The Sims 4"?
Patuljasti planeti: Pluton, Eris, Makemake, HaumeaPatuljasti planeti: Pluton, Eris, Makemake, Haumea
Što je FAK, ili Vječna pitanja na World Wide WebuŠto je FAK, ili Vječna pitanja na World Wide Webu
Sažetak klasa i metoda: opis, karakteristike i značajke. Koja je razlika između apstraktne klase i…Sažetak klasa i metoda: opis, karakteristike i značajke. Koja je razlika između apstraktne klase i…
Filozofija i metodologija znanosti.Filozofija i metodologija znanosti.
Modeliranje kao metoda spoznaje, kao i druge metode istraživanja znanostiModeliranje kao metoda spoznaje, kao i druge metode istraživanja znanosti
» » Najbliža susjedna metoda: primjer posla
LiveInternet