Vraag:
Wat is een "kernel" in gewoon Engels?
Neil McGuigan
2010-09-09 05:15:08 UTC
view on stackexchange narkive permalink

Er zijn verschillende verschillende gebruiksmogelijkheden:

  • schatting van de dichtheid van de kernel
  • kerneltruc
  • gladmaken van de kernel

Leg uit wat de "kernel" erin betekent, in gewoon Engels, in uw eigen woorden.

Niet om grof te zijn, maar is dit niet een vraag die al ad misselijkheid wordt beantwoord op Wikipedia en dergelijke? Google gaf me het antwoord binnen 15 seconden ...
Ik haat absoluut wikipedia-antwoorden voor statistieken. Er zijn kruipende, symbolische rotzooi. Ik ben op zoek naar een juweeltje van een antwoord dat het antwoord in gewoon Engels kan uitleggen, omdat ik geloof dat dat een dieper niveau van begrip toont dan een wiskundige vergelijking. Er zijn hier veel populaire "gewoon Engelse" vragen, en daar is een goede reden voor.
Twee antwoorden:
#1
+44
Thylacoleo
2010-09-09 06:21:56 UTC
view on stackexchange narkive permalink

Er lijken ten minste twee verschillende betekenissen van "kernel" te zijn: een die vaker in statistieken wordt gebruikt; de andere in machine learning.

In statistieken wordt "kernel" meestal gebruikt om te verwijzen naar schatting van de kerneldichtheid en afvlakking van de kernel.

Een eenvoudige uitleg van kernels in dichtheidsschatting is te vinden ( hier).

In machine learning " kernel "wordt meestal gebruikt om te verwijzen naar de kerneltruc, een methode om een ​​lineaire classificator te gebruiken om een ​​niet-lineair probleem op te lossen" door de oorspronkelijke niet-lineaire waarnemingen in een hoger-dimensionale ruimte in kaart te brengen ".

Een eenvoudige visualisatie zou kunnen zijn om je voor te stellen dat alle klassen $ 0 $ binnen straal $ r $ van de oorsprong in een x, y-vlak liggen (klasse $ 0 $: $ x ^ 2 + y ^ 2 < r ^ 2 $); en alle klassen $ 1 $ zijn buiten straal $ r $ in dat vlak (klasse $ 1 $: $ x ^ 2 + y ^ 2 > r ^ 2 $). Er is geen lineaire scheidingsteken mogelijk, maar het is duidelijk dat een cirkel met een straal $ r $ de gegevens perfect zal scheiden. We kunnen de gegevens omzetten in een driedimensionale ruimte door drie nieuwe variabelen $ x ^ 2 $, $ y ^ 2 $ en $ \ sqrt {2} xy $ te berekenen. De twee klassen zijn nu te scheiden door een vlak in deze driedimensionale ruimte. De vergelijking van dat optimaal scheidende hypervlak waar $ z_1 = x ^ 2, z_2 = y ^ 2 $ en $ z_3 = \ sqrt {2} xy $ is $ z_1 + z_2 = 1 $, en in dit geval laat $ z_3 $ weg. (Als de cirkel verschoven is ten opzichte van de oorsprong, zal het optimale scheidende hypervlak ook in $ z_3 $ variëren.) De kernel is de mappingfunctie die de waarde berekent van de 2-dimensionale data in de 3-dimensionale ruimte.

In de wiskunde zijn er andere toepassingen van "kernels", maar dit lijken de belangrijkste te zijn in de statistieken.

Heel fijn! Ik ga je voorbeeld met de cirkel gebruiken om kernelmethoden uit te leggen, aangezien dit de beste visualisatie is die ik tot nu toe heb ontmoet. Bedankt!
De volgende video werd door een anonieme potentiële editor voorgesteld als "een geweldige visualisatie van wat Thylacoleo uitlegde:" http://www.youtube.com/watch?v=3liCbRZPrZA
Thylacoleo's voorbeeld opvolgen met behulp van de cirkel om de kerneltruc uit te leggen (ik heb niet genoeg reputatie om direct een opmerking aan zijn antwoord toe te voegen). Was er een simpele typefout in de vergelijking voor het scheidende hypervlak? en het zou z1 + z2 = r ^ 2 moeten zijn, in plaats van z1 + z2 = 1? Of begrijp ik het verkeerd? Ik ben het ermee eens dat het een mooi eenvoudig voorbeeld is om het concept te illustreren. Bedankt. Hoewel de definitie van z3 nog steeds een beetje een mysterie lijkt, maakt het blijkbaar niet uit voor het voorbeeld dat zich concentreert op de oorsprong.
Ja, er was een typefout. Bedankt daarvoor Alex. Ik lees niet altijd :-)
Gebruiken we inproducten om tweedimensionale gegevens in driedimensionale gegevens om te zetten?
#2
+39
ebony1
2010-09-09 11:09:24 UTC
view on stackexchange narkive permalink

In zowel statistieken (schatting van kerneldichtheid of kernel smoothing) als literatuur over machine learning (kernelmethoden), wordt kernel gebruikt als een maatstaf voor gelijkenis. In het bijzonder definieert de kernelfunctie $ k (x,.) $ De verdeling van overeenkomsten van punten rond een bepaald punt $ x $. $ k (x, y) $ geeft de gelijkenis aan van punt $ x $ met een ander gegeven punt $ y $.

Dit is een leuke manier om het te zeggen. Ik vraag me af of je deze beschrijving kunt generaliseren om ook van toepassing te zijn op de kern van 'kerneldichtheidsschatting'.
In zekere zin wel. Een manier om de schatting van de kerneldichtheid te begrijpen, is dat u de dichtheid van een punt uit een bepaalde distributie benadert als een gewogen gemiddelde van zijn overeenkomsten met een reeks punten uit de distributie. Het begrip gelijkenis speelt dus ook hier een rol.
Ik begrijp dat "kernel" in statistieken oorspronkelijk wordt ontleend aan jargon dat wordt gebruikt bij de bespreking van integrale vergelijkingen.


Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 2.0-licentie waaronder het wordt gedistribueerd.
Loading...