þekking Discovery
/ Knowledge Discovery >> þekking Discovery >> tækni >> tölva >> internet >> vefhönnun þróun >>

Expert Stuff: Googles Mike Cohen

vað við vitum um notkun tungumála í ensku

Hundar hlaupa meira en þeir gera hlutina með skálum, og svo með því að fóðra fullt af gögnum að þetta líkan -. Við köllum það Tungumál líkan. Það er tölfræðileg módel á orðinu röð, hversu líklegt mismunandi orð eru að eiga sér stað í ljósi þess sem að undanförnu orð hafa verið. Með því að fóðra líkan mikið af gögnum, reiknar það bara allar þessar tölfræði um hvað er líklegt að eiga sér stað á næsta, og það er málið sem fyrirmynd. Svo nú, þessir þrír módel, Acoustic líkan, eða líkan með öllum þeim grundvallar hljóðum, Lexicon, eða líkan af því hvernig öll orð fá áberandi, og að lokum tungumál líkan, eða hvernig allur þessi orð fá spenntur saman fá saman saman.

Svo lexical líkön eru byggð af stringing saman Acoustic módel, tungumál líkan er byggt af stringing saman orð módel, og það allt fær saman í einn gríðarlega framsetning talað ensku, við skulum segja, og sem verður líkan sem fær lært af gögnum, og sem viðurkennir eða leitar þegar sumir hljóðvistar koma inn og það þarf að finna út hvað er best Minn giska á hvað bara fékk sagði.
Hvernig taka tillit kommur og mállýskum þegar hanna ræðu recognizers ?

Eitt af grundvallar hlutum, miðað við hvers konar gögn-ekin nálgun sem við tökum, er við reynum að hafa mjög stór, breið setur þjálfun. Við höfum mikið magn af gögnum sem koma frá alls konar fólk með alls konar kommur, segja alls konar hluti, og svo framvegis og svo framvegis, og það mikilvægasta er að hafa góða umfjöllun í þjálfun þinni hóp hvað er að koma . í Við höfum nóg dæmi af Brooklyn kommur - og ekki bara takk fyrir mig - en við höfum fólk frá Brooklyn sem hafa talað til kerfi okkar þannig að við gerum gott starf þegar fólk með Brooklyn kommur tala við kerfið okkar

Á hinn bóginn, ef einhver kom með og hafði mjög einkennilegur og óvenjulegt leiðir borin það sem var ekki vel fjallað í gögnum okkar, viljum við hafa meiri vandræði viðurkenna þá.

Stundum framburður eru róttækan öðruvísi nóg, við skulum segja í breskri ensku móti bandaríska ensku, getur verið að við að byggja upp sérstakt líkan eða að hluta blandað líkan, eða hvað. Það er tegund af svæði rannsókna. Hvenær eigum við að byggja sérstakar gerðir móti sameina allt í eitt stórt líkan, eða málamiðlun á milli? Að breytileiki er eitt af stóru áskorunum, einn af mörgum stórum áskorunum á sviði sem gerir það erfiðara. Hafa gott sett þjálfun er ein af þeim leiðum sem við takast á við það, þegar það er þjálfun s

Page [1] [2] [3] [4] [5] [6]