PormasyonPangalawang edukasyon at mga paaralan

Pinakamalapit na paraan ng kapitbahay: halimbawa ng trabaho

ang pinakamalapit na paraan kapitbahay ay ang pinakamadaling metric classifier na kung saan ay batay sa mga pagsusuri ng ang pagkakapareho ng iba't ibang mga bagay.

Aralan na object ay kabilang sa klase kung saan sila nabibilang paksa ng pagsasanay sample. Ipaalam sa amin malaman kung saan ay ang pinakamalapit na kapit-bahay. Subukan upang maunawaan ang mga komplikadong bagay, mga halimbawa ng iba't ibang mga diskarte.

Ang pamamaraan hypothesis

pinakamalapit na paraan ng kapwa ay maaaring itinuturing bilang ang pinaka-karaniwang mga algorithm na ginagamit para sa pag-uuri. Bagay sumasailalim sa pag-uuri ay kabilang sa klase y_i, kung saan ang pinakamalapit na bagay sa pag-aaral x_i sample.

Pagtitiyak ng pamamaraan pinakamalapit na kapitbahay

k pinakamalapit na kapitbahay Ang pamamaraan ay maaaring mapabuti ang katumpakan ng pag-uuri. Pinag-aralan object pagmamay-ari ng parehong klase bilang ang bulk ng kanyang mga kapitbahay, iyon ay, k malapit sa ito bagay sa mga pinag-aralan ng sample x_i. Sa paglutas ng mga problema na may dalawang klase ng bilang ng mga kapitbahay ay kakaiba upang maiwasan ang isang sitwasyon ng kalabuan, kung ang parehong bilang ng mga kapitbahay ay nabibilang sa iba't ibang mga klase.

Ang pamamaraan ng suspendido kapitbahay

Postgresql-aralan na paraan tsvector pinakamalapit na kapitbahay ay ginagamit kapag ang bilang ng mga klase ng hindi bababa sa tatlong, at hindi ka maaaring gumamit ng isang kakaibang numero. Ngunit ambiguity arises kahit sa mga kasong ito. Pagkatapos, ang i-ika kapitbahay ay makakakuha ng w_i timbang, na kung saan ay nababawasan na may ranggong kapitbahay ko. Ito ay tumutukoy sa klase ng mga bagay, na kung saan ay magkakaroon ng isang maximum na kabuuang bigat sa gitna malapit kapitbahay.

Ang teorya ng pagiging masinsin

Sa gitna ng lahat ng mga pamamaraan sa itaas ay ang teorya ng limit. Ito ay nagpapahiwatig ng isang koneksyon sa pagitan ng mga sukatan ng pagkakapareho ng mga bagay at ang kanilang mga kabilang sa parehong klase. Sa situasyon na ito, ang hangganan sa pagitan ng iba't ibang mga uri ay isang simpleng form, at lumikha ng mga klase ng mga bagay sa espasyo compact mobile area. Sa ilalim ng naturang mga lugar sa matematikal na pagsusuri dadalhin sa ibig sabihin ng isang sarado bounded set. Teorya na ito ay walang kaugnayan sa mga araw-araw na pang-unawa ng salita.

Ang pangunahing formula

Ipaalam sa amin suriin ang higit pang mga pinakamalapit na kapitbahay. Kung ang ipinanukalang mga pagsasanay sample type ang "object-response» X ^ m = \ {(x_1, y_1), \ tuldok, (x_m, y_m) \}; kung ang isang mayorya ng mga bagay upang tukuyin ang distansya sa pag-andar \ rho (x, x '), na kung saan ay kinakatawan sa anyo ng isang sapat na model pagkakapareho ng mga bagay sa pamamagitan ng pagtaas ng halaga ng pag-andar ay nababawasan ng pagkakatulad sa pagitan ng mga bagay x, x'.

Para sa anumang bagay, u ay bumuo ng isang pagsasanay sample bagay x_i ng pagtaas distansya sa u:

\ Rho (u, X_ {1; u}) \ LEQ \ rho (u, X_ {2; u}) \ LEQ \ cdots \ LEQ \ rho (u, X_ {m; u}),

kung saan X_ {i; u} characterizes ang object ng pag-aaral sample, na kung saan ay i-ika kapitbahay source object u. Ang nasabing notation at gamitin upang tumugon sa i-ika kapitbahay: y_ {i; u}. Bilang isang resulta, nakita namin na ang anumang bagay u provokes renumbering sariling sample.

Ang pagpapasya sa bilang k ng kapitbahay

pinakamalapit na paraan ng kapitbahay kapag k = 1 ay may kakayahang pagbibigay ng isang maling pag-uuri, hindi lamang sa mga bagay-emissions, ngunit din para sa iba pang mga klase na malapit.

Kung tumagal kami ng k = m, ang algorithm ay magiging tulad ng matatag at ay sumama sa isang pare-pareho ang halaga. Iyon ay kung bakit sa pagiging maaasahan ay mahalaga upang maiwasan ang matinding indeks k.

Sa pagsasagawa, bilang ang optimal index k ginagamit criterion sliding control.

screening emissions

Ang mga bagay ng pag-aaral ay higit sa lahat ay hindi patas, ngunit kasama ng mga ito doon ay ang mga taong may mga katangian ng isang klase at ay tinukoy bilang pamantayan. Sa kalapitan ng napapailalim sa mga ideal na modelo ng kanyang mataas na posibilidad ng pag-aari sa klase na ito.

Paano rezultativen paraan ng pinakamalapit na kapitbahay? Ang isang halimbawa ay makikita sa batayan ng paligid at hindi nagbibigay ng kaalaman kategorya ng mga bagay. Ito ay ipinapalagay na siksik na kapaligiran ng mga object iba pang mga kinatawan ng klase. Kapag inalis mo ang mga ito mula sa pag-uuri ng pagsa-sample ang kalidad ay hindi magdusa.

Maramdaman ang isang tiyak na bilang ng mga sample ay maaaring ingay bursts na "sa lupa" ng isang klase. Inaalis malaki-laking positibong epekto sa ang kalidad ng mga pag-uuri.

Kung ang sample na kinuha mula sa uninformative at puksain ang mga bagay na ingay, maaari mong bilangin sa ilang mga positibong resulta sa parehong oras.

Ang unang agaw paraan ng ang pinakamalapit na kapit-uuri ay nagbibigay-daan upang mapabuti ang kalidad, bawasan ang halaga ng mga naka-imbak ng data, bawasan ang oras ng pag-uuri, na kung saan ay ginugol sa pagpili ng susunod na mga pamantayan.

Ang paggamit ng mga ultra-malaking sample

pinakamalapit na paraan kapitbahay ay batay sa mga tunay na storage ng pag-aaral na mga bagay. Upang lumikha ng napakalaking-scale mga halimbawa ng paggamit ng isang teknikal na problema. Ang layunin ay hindi lamang upang i-save ang isang makabuluhang halaga ng impormasyon, ngunit din sa minimum na halaga ng oras upang magkaroon ng oras upang makahanap ng anumang bagay u k kabilang sa mga pinakamalapit na kapitbahay.

Upang makaya sa gawaing ito, dalawang mga pamamaraan ay ginagamit:

  • thinned sample sa pamamagitan ng isang bagay discharge non-data;
  • epektibong paggamit ng espesyal na istraktura ng data at code para sa mga instant paghahanap ng pinakamalapit na kapitbahay.

Panuntunan ng pamamaraan sa pagpili

Ang pag-uuri sa itaas ay isinasaalang-alang. Pinakamalapit na paraan kapitbahay ay ginagamit sa paglutas ng mga praktikal na problema, na kung saan ay kilala nang maaga ang distansya function na \ rho (x, x '). Sa naglalarawan bagay numeric vectors gumamit ng Euclidean sukatan. Ang pagpipiliang ito ay walang mga espesyal na pagbibigay-katarungan, ngunit nagsasangkot ng pagsukat ng lahat ng mga palatandaan "sa parehong sukat." Kung ito kadahilanan ay hindi kinuha sa account, pagkatapos ay ang panukat ay mamayani tampok na pagkakaroon ng pinakamataas na numerong halaga.

Kung may isang malaking bilang ng mga tampok, pagkalkula ng distansya bilang ang kabuuan ng mga deviations sa mga tiyak na mga sintomas lilitaw malubhang problema dimensyon.

Sa mataas na dimensional space malayong mula sa isa't isa ay ang lahat ng bagay. Sa huli, ang anumang mga sample ay magiging sa tabi ng mga bagay na ini-aral k kapitbahay. pinili ng isang maliit na bilang ng mga nagbibigay-kaalaman na mga tampok upang puksain ang problemang ito. Algorithm para sa pagkalkula ng mga pagtatantya bumuo sa batayan ng iba't ibang mga hanay ng mga karatula, at para sa bawat indibidwal na bumuo ng kanilang kalapitan function.

konklusyon

Mathematical kalkulasyon ay madalas na kasangkot ang paggamit ng isang iba't ibang mga diskarte na mayroon ng kanilang sariling mga natatanging katangian, pakinabang at disadvantages. Tiningnan pinakamalapit na paraan ng kapwa ay maaaring malutas ang lubos na isang malubhang problema, dahil sa ang mga katangian ng matematika na bagay. Ang pang-eksperimentong konsepto, batay sa mga pinag-aralan paraan ay aktibong ginagamit sa artificial intelligence.

Sa sistema ng expert ito ay kinakailangan hindi lamang upang uriin ang mga bagay, ngunit ring ipakita sa gumagamit ang isang paliwanag ng mga pag-uuri sa tanong. Sa ganitong paraan, ang isang paliwanag ng mga ito kababalaghan ay ipinahayag na may kaugnayan sa ang bagay ng isang partikular na klase pati na rin ang lokasyon na nauugnay sa ang sample na ginagamit. Legal industriya espesyalista, geologists, mga doktor, dalhin ito "alinsunuran" logic aktibong gamitin ito sa kanilang pananaliksik.

Upang maisaalang-aralan na paraan ay ang pinaka-maaasahang, mahusay, na nagbibigay sa ang nais na resulta, kailangan mong kumuha ng isang minimum figure k, habang din maiwasan ang emissions kabilang sa mga pinag-aralan ng mga bagay. Iyon ay kung bakit ang paggamit ng mga pamantayan at mga pamamaraan sa pagpili, pati na rin ang mga sukatan ng pag-optimize.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 tl.atomiyme.com. Theme powered by WordPress.