þekking Discovery
/ Knowledge Discovery >> þekking Discovery >> tækni >> rafeindatækni >> græjur >>

Hvernig Mál Orðstír Works

oru. Hins vegar mannlegt mál hefur fjölmargir undanþágur eigin reglum, jafnvel þegar það er talað stöðugt. Kommur, mállýskur og framkoma getur miklu breytt því hvernig ákveðin orð eða orðasambönd eru töluð. Ímyndaðu þér að einhver frá Boston segja orðið ". Hlöðu " Hann vildi ekki dæma " r " yfirleitt, og orðið kemur út rhyming með " Jóh. " Eða íhuga setningu, " Ég ætla að sjá hafið. &Quot; Flest fólk enunciate ekki orð sín mjög vel. Niðurstaðan gæti komið út eins og " Ég ætla 'da sjá tha haf. &Quot; Þeir hlaupa nokkrum orðum saman án merkjanlegur brot, svo sem " Ég ætla '" og ". haf " Reglur-undirstaða kerfi voru misheppnaður vegna þess að þeir gætu ekki séð þessar breytingar. Þetta skýrir einnig hvers vegna fyrri kerfi gæti ekki séð stöðuga ræðu -. Þú þurfti að tala hvert orð fyrir sig, með stutta hlé á milli þeirra

talgreiningu kerfi í dag nota öflug og flókin tölfræðileg sitja kerfi. Þessi kerfi notað líkur og stærðfræði aðgerðir til að ákvarða líklegustu niðurstöðu. Samkvæmt John Garofolo, Speech Group Manager á upplýsingatækni Laboratory National Institute of Standards and Technology, á þessum tveimur gerðum sem ráða á sviði í dag eru Hidden Markov Model og tauga netkerfi. Þessar aðferðir fela flókin stærðfræði aðgerðir, en í raun, þeir taka upplýsingum til kerfi til að reikna út upplýsingar falið það.

The Hidden Markov Model er algengasta, þannig að við munum taka a loka líta á þeim ferli. Í þessu líkani, hver fónemi er eins og hlekkur í keðju, og lauk keðja er orð. Hins vegar keðja útibú burt í mismunandi áttir sem áætluninni er reynt að passa stafræna hljóð með fónemi sem er líklegast til að koma næst. Meðan á þessu ferli, the program úthlutar líkur muninn í hverju fónemi, byggt á þess innbyggður-í orðabók og þjálfun notenda

Þetta ferli er jafnvel flóknari fyrir orð og setningar -. Kerfið þarf að reikna út hvar hvert orð hættir og byrjar. Klassískt dæmi er setning " viðurkenna ræðu, " sem hljómar mikið eins " flak ágætur ströndinni " þegar þú segir það mjög fljótt. The program hefur til greina phonemes nota orðasambandið sem kom fyrir það í því skyni að fá það rétt. Hér er sundurliðun á tveimur setningum:

r eh k ao g n ay z s p iy ll

" viðurkenna ræðu "

r eh K BB n BB s b iy ll

" flak gott Beach "

Hvers vegna er þetta svo flókið? Ef forritið hefur orðaforða

Page [1] [2] [3] [4] [5] [6]