talgreiningu kerfi í dag nota öflug og flókin tölfræðileg sitja kerfi. Þessi kerfi notað líkur og stærðfræði aðgerðir til að ákvarða líklegustu niðurstöðu. Samkvæmt John Garofolo, Speech Group Manager á upplýsingatækni Laboratory National Institute of Standards and Technology, á þessum tveimur gerðum sem ráða á sviði í dag eru Hidden Markov Model og tauga netkerfi. Þessar aðferðir fela flókin stærðfræði aðgerðir, en í raun, þeir taka upplýsingum til kerfi til að reikna út upplýsingar falið það.
The Hidden Markov Model er algengasta, þannig að við munum taka a loka líta á þeim ferli. Í þessu líkani, hver fónemi er eins og hlekkur í keðju, og lauk keðja er orð. Hins vegar keðja útibú burt í mismunandi áttir sem áætluninni er reynt að passa stafræna hljóð með fónemi sem er líklegast til að koma næst. Meðan á þessu ferli, the program úthlutar líkur muninn í hverju fónemi, byggt á þess innbyggður-í orðabók og þjálfun notenda
Þetta ferli er jafnvel flóknari fyrir orð og setningar -. Kerfið þarf að reikna út hvar hvert orð hættir og byrjar. Klassískt dæmi er setning " viðurkenna ræðu, " sem hljómar mikið eins " flak ágætur ströndinni " þegar þú segir það mjög fljótt. The program hefur til greina phonemes nota orðasambandið sem kom fyrir það í því skyni að fá það rétt. Hér er sundurliðun á tveimur setningum:
r eh k ao g n ay z s p iy ll
" viðurkenna ræðu "
r eh K BB n BB s b iy ll
" flak gott Beach "
Hvers vegna er þetta svo flókið? Ef forritið hefur orðaforða