ప్రసంగాన్ని టెక్స్ట్‌గా మారుస్తుంది: సాధారణ డిక్టేషన్ అనువర్తనాన్ని ఎలా సృష్టించాలి

వీడియో: 🔉 ఆడియోని టెక్స్ట్‌గా మార్చడం ఎలా - ఉచిత & సమయ పరిమితులు లేవు

విషయము

స్పీచ్-టు-టెక్స్ట్ యూజర్ ఇంటర్ఫేస్ను నిర్మించడం
మీ Android అనువర్తనానికి ప్రసంగ గుర్తింపును జోడిస్తోంది
1. రికగ్నైజర్ ఇంటెంట్ ప్రారంభించండి
2. ప్రసంగ ప్రతిస్పందనను స్వీకరించడం
మీ ప్రాజెక్ట్‌ను పరీక్షిస్తోంది
చుట్టి వేయు

చాలా అనువర్తనాలు, సేవలు మరియు గృహ గాడ్జెట్లు మెరుగైన వినియోగదారు అనుభవాన్ని అందించడానికి మరియు ప్రాప్యతను మెరుగుపరచడానికి ప్రసంగ గుర్తింపును ఉపయోగిస్తాయి. స్పీచ్ రికగ్నిషన్‌ను ఉపయోగించుకునే లెక్కలేనన్ని ఆండ్రాయిడ్ అనువర్తనాలు ఉన్నాయి - వీటిలో ముఖ్యమైనవి గూగుల్ అసిస్టెంట్ - కాబట్టి దీన్ని అనుసరించండి మరియు మీ స్వంత Android అనువర్తనాలకు ఈ లక్షణాన్ని ఎందుకు జోడించకూడదు?

ఈ వ్యాసంలో, Android యొక్క స్పీచ్-టు-టెక్స్ట్ ఇంటెంట్‌తో ప్రారంభించడానికి నేను శీఘ్రంగా మరియు సులభమైన మార్గాన్ని పంచుకుంటాను, ఇది విస్తృత శ్రేణి అనువర్తనాలలో ఉపయోగపడుతుంది. ఉదాహరణకు, మీరు శ్రమతో కూడిన మాన్యువల్ డేటా ఎంట్రీని ఆటోమేట్ చేయడానికి, స్వయంచాలకంగా ఉపశీర్షికలను రూపొందించడానికి లేదా స్వర ఇన్‌పుట్‌కు “వినే”, దానిని టెక్స్ట్‌గా మార్చే, తరువాత ఈ వచనాన్ని అనువదించి, ఫలితాలను ప్రదర్శించే అనువాద అనువర్తనానికి ఆధారం వలె మీరు ప్రసంగ గుర్తింపును ఉపయోగించవచ్చు. వినియోగదారు.

మీరు సృష్టించిన అనువర్తనంతో సంబంధం లేకుండా, మీ అనువర్తనంతో పరస్పర చర్య చేయడానికి వినియోగదారులకు ప్రత్యామ్నాయ మార్గాన్ని అందించడం ద్వారా ప్రసంగ గుర్తింపు ప్రాప్యతను మెరుగుపరుస్తుంది. ఉదాహరణకు, చలనశీలత, సామర్థ్యం లేదా దృష్టి సమస్యలు ఉన్న వ్యక్తులు టచ్‌స్క్రీన్ లేదా కీబోర్డ్ కాకుండా వాయిస్ ఆదేశాలను ఉపయోగించి మొబైల్ అనువర్తనాలను నావిగేట్ చేయడం సులభం. ప్లస్, ప్రపంచ ఆరోగ్య సంస్థ (WHO) ప్రకారం, ఒక బిలియన్ మందికి పైగా ప్రజలు కొంత వైకల్యాన్ని కలిగి ఉన్నారు, ఇది ప్రపంచ జనాభాలో 15% కు సమానం. మీ అనువర్తనాలకు ప్రాప్యత లక్షణాలను జోడించడం వలన మీ సంభావ్య ప్రేక్షకులను గణనీయంగా పెంచుతుంది.

ఈ వ్యాసం ముగిసే సమయానికి, మీరు మీ వాయిస్‌ని రికార్డ్ చేసి, టెక్స్ట్‌గా మార్చి, ఆ వచనాన్ని తెరపై ప్రదర్శించే సరళమైన స్పీచ్-టు-టెక్స్ట్ అనువర్తనాన్ని సృష్టించారు.

స్పీచ్-టు-టెక్స్ట్ యూజర్ ఇంటర్ఫేస్ను నిర్మించడం

ప్రారంభించడానికి, “ఖాళీ కార్యాచరణ” టెంప్లేట్ ఉపయోగించి క్రొత్త Android ప్రాజెక్ట్‌ను సృష్టించండి.

మేము నొక్కినప్పుడు, Android యొక్క స్పీచ్-టు-టెక్స్ట్ ఇంటెంట్‌ను ప్రేరేపిస్తుంది మరియు మీ అనువర్తనం ప్రసంగ ఇన్‌పుట్‌ను అంగీకరించడానికి సిద్ధంగా ఉందని సూచించే డైలాగ్‌ను ప్రదర్శించే బటన్‌ను కలిగి ఉన్న ఒక సాధారణ అనువర్తనాన్ని మేము సృష్టిస్తాము. వినియోగదారు మాట్లాడటం పూర్తయిన తర్వాత, వారి ఇన్‌పుట్ టెక్స్ట్‌గా మార్చబడుతుంది, ఆపై టెక్స్ట్ వ్యూలో భాగంగా ప్రదర్శించబడుతుంది.

మా లేఅవుట్ను సృష్టించడం ద్వారా ప్రారంభిద్దాం:

ఇది మాకు ఈ క్రింది లేఅవుట్‌ను ఇస్తుంది:

మీ Android అనువర్తనానికి ప్రసంగ గుర్తింపును జోడిస్తోంది

మేము రెండు దశల్లో ప్రసంగ ఇన్‌పుట్‌ను సంగ్రహించి ప్రాసెస్ చేస్తాము:

1. రికగ్నైజర్ ఇంటెంట్ ప్రారంభించండి

స్పీచ్-టు-టెక్స్ట్ మార్పిడిని నిర్వహించడానికి సులభమైన మార్గం రికగ్నైజర్ ఇంటెంట్ ఉపయోగించడం. ACTION_RECOGNIZE_SPEECH. ఈ ఉద్దేశ్యం Android యొక్క సుపరిచితమైన మైక్రోఫోన్ డైలాగ్ బాక్స్‌ను ప్రారంభించడం ద్వారా స్వర ఇన్పుట్ కోసం వినియోగదారుని అడుగుతుంది.

వినియోగదారు మాట్లాడటం ఆపివేసిన తర్వాత, డైలాగ్ స్వయంచాలకంగా మూసివేయబడుతుంది మరియు ACTION_RECOGNIZE_SPEECH రికార్డ్ చేసిన ఆడియోను స్పీచ్ రికగ్నైజర్ ద్వారా పంపుతుంది.

మేము రికగ్నైజర్ఇంటెంట్. ACTION_RECOGNIZE_SPEECH ను స్టార్ట్ఆక్టివిటీఫోర్ రిసల్ట్ () ఉపయోగించి బండిల్ చేసిన ఎక్స్‌ట్రాతో ప్రారంభిస్తాము. పేర్కొనకపోతే, గుర్తింపు పరికరం యొక్క డిఫాల్ట్ లొకేల్‌ను ఉపయోగిస్తుందని గమనించండి.

public void onClick (v చూడండి) {// రికగ్నైజర్ ఇంటెంట్ ఉద్దేశాన్ని ట్రిగ్గర్ చేయండి // ఉద్దేశం ఉద్దేశం = క్రొత్త ఉద్దేశం (RecognizerIntent.ACTION_RECOGNIZE_SPEECH); ప్రయత్నించండి {startActivityForResult (ఉద్దేశం, REQUEST_CODE); } క్యాచ్ (ActivityNotFoundException a) {}}

2. ప్రసంగ ప్రతిస్పందనను స్వీకరించడం

ప్రసంగ గుర్తింపు ఆపరేషన్ పూర్తయిన తర్వాత, ACTION_RECOGNIZE_SPEECH ఫలితాలను తిరిగి కాలింగ్ కార్యాచరణకు తీగల శ్రేణిగా పంపుతుంది.

మేము స్టార్ట్ఆక్టివిటీఫోర్ రిసల్ట్ () ద్వారా రికగ్నైజర్ ఇంటెంట్‌ను ప్రేరేపించినందున, స్పీచ్ రికగ్నిషన్ కాల్‌ను ప్రారంభించిన కార్యాచరణలోని యాక్టివిటీ రిసల్ట్ (పూర్ణాంక అభ్యర్థన కోడ్, పూర్ణాంక ఫలిత కోడ్, ఇంటెంట్ డేటా) ను భర్తీ చేయడం ద్వారా మేము ఫలిత డేటాను నిర్వహిస్తాము.

ప్రసంగ గుర్తింపు విశ్వాసం యొక్క అవరోహణ క్రమంలో ఫలితాలు తిరిగి ఇవ్వబడతాయి. కాబట్టి, మేము తిరిగి వచ్చిన అర్రేలిస్ట్ నుండి సున్నా స్థానాన్ని తీసుకోవలసిన అత్యంత ఖచ్చితమైన వచనాన్ని ప్రదర్శిస్తున్నామని నిర్ధారించుకోండి, ఆపై దాన్ని మా టెక్స్ట్ వ్యూలో ప్రదర్శించండి.

Ver ఓవర్రైడ్ // మా ఇంటెంట్ కాలర్ కార్యాచరణలో ఆన్ఆక్టివిటీ రిసల్ట్ పద్ధతిని నిర్వచించండి // రక్షిత శూన్యత ఆన్ యాక్టివిటీ రిసల్ట్ (పూర్ణాంక అభ్యర్థన కోడ్, పూర్ణాంక ఫలితం కోడ్, ఇంటెంట్ డేటా) {super.onActivityResult (requestCode, resultCode, data); మారండి (requestCode) {case REQUEST_CODE: {// RESULT_OK తిరిగి ఇవ్వబడితే ... // if (resultCode == RESULT_OK && null! = data) {//...అప్పుడు అర్రేలిస్ట్‌ను తిరిగి పొందండి // శ్రేణి జాబితా result = data.getStringArrayListExtra (RecognizerIntent.EXTRA_RESULTS); // మా టెక్స్ట్ వ్యూని అప్‌డేట్ చేయండి // textOutput.setText (result.get (0)); } విరామం; }}}}

స్పీచ్-టు-టెక్స్ట్‌కు క్రియాశీల ఇంటర్నెట్ కనెక్షన్ అవసరం లేదని గమనించండి, కాబట్టి వినియోగదారు ఆఫ్‌లైన్‌లో ఉన్నప్పుడు కూడా ఇది సరిగ్గా పని చేస్తుంది.

పైన పేర్కొన్న అన్ని దశలను పూర్తి చేసిన తర్వాత, మీ మెయిన్ఆక్టివిటీ ఇలా ఉండాలి:

android.content.ActivityNotFoundException దిగుమతి; androidx.appcompat.app.AppCompatActivity దిగుమతి; android.os.Bundle దిగుమతి; android.content.Intent దిగుమతి; android.speech.RecognizerIntent దిగుమతి; android.widget.TextView దిగుమతి; android.view.View దిగుమతి; దిగుమతి java.util.ArrayList; పబ్లిక్ క్లాస్ మెయిన్ఆక్టివిటీ AppCompatActivity ని విస్తరిస్తుంది {ప్రైవేట్ స్టాటిక్ ఫైనల్ Int REQUEST_CODE = 100; ప్రైవేట్ టెక్స్ట్ వ్యూ టెక్స్ట్ఆట్పుట్; Ver ఓవర్రైడ్ రక్షిత శూన్యత ఆన్‌క్రియేట్ (బండిల్ సేవ్ఇన్‌స్టాన్స్‌స్టేట్) {super.onCreate (saveInstanceState); setContentView (R.layout.activity_main); textOutput = (టెక్స్ట్ వ్యూ) findViewById (R.id.textOutput); } // ఈ పద్ధతిని బటన్ నొక్కినప్పుడు పిలుస్తారు // పబ్లిక్ శూన్యత onClick (v చూడండి) // “RecognizerIntent.ACTION_RECOGNIZE_SPEECH” చర్యతో ఒక ఉద్దేశాన్ని సృష్టించండి // {ఉద్దేశం ఉద్దేశం = క్రొత్త ఉద్దేశం (RecognizerIntent.ACTION_RECOGNIZE_SPEECH); ప్రయత్నించండి {// కార్యాచరణను ప్రారంభించండి మరియు ప్రతిస్పందన కోసం వేచి ఉండండి // startActivityForResult (ఉద్దేశం, REQUEST_CODE); } క్యాచ్ (యాక్టివిటీనోట్ఫౌండ్ఎక్సెప్షన్ ఎ) {} ver ఓవర్‌రైడ్ // ఫలితాలను నిర్వహించండి // రక్షిత శూన్యత ఆన్ యాక్టివిటీ రిసల్ట్ (పూర్ణాంక అభ్యర్థన కోడ్, పూర్ణాంక ఫలిత కోడ్, ఇంటెంట్ డేటా) {super.onActivityResult (requestCode, resultCode, data); మారండి (requestCode) {case REQUEST_CODE: {if (resultCode == RESULT_OK && null! = data) {శ్రేణి జాబితా result = data.getStringArrayListExtra (RecognizerIntent.EXTRA_RESULTS); textOutput.setText (result.get (0)); } విరామం; }}}}

మీరు పూర్తి చేసిన ప్రాజెక్ట్‌ను గిట్‌హబ్ నుండి డౌన్‌లోడ్ చేసుకోవచ్చు.

మీ ప్రాజెక్ట్‌ను పరీక్షిస్తోంది

మీ దరఖాస్తును పరీక్షించడానికి:

మీ ప్రాజెక్ట్ను భౌతిక Android పరికరం లేదా Android వర్చువల్ పరికరం (AVD) లో ఇన్‌స్టాల్ చేయండి. మీరు AVD ఉపయోగిస్తుంటే, మీ అభివృద్ధి యంత్రంలో అంతర్నిర్మిత మైక్రోఫోన్ ఉండాలి లేదా మీరు బాహ్య మైక్రోఫోన్ లేదా హెడ్‌సెట్‌ను ఉపయోగించవచ్చు.
అనువర్తనం యొక్క “ప్రారంభ డిక్టేషన్” బటన్‌ను నొక్కండి.
మైక్రోఫోన్ డైలాగ్ బాక్స్ కనిపించినప్పుడు, మీ పరికరంలో మాట్లాడండి. కొన్ని క్షణాల తరువాత, మీ పదాలు తెరపై కనిపిస్తాయి.

చుట్టి వేయు

ఈ వ్యాసంలో, స్పీచ్-టు-టెక్స్ట్ ఇంటెంట్ ఉపయోగించి, మీ Android అనువర్తనాలకు మీరు త్వరగా మరియు సులభంగా ప్రసంగ గుర్తింపును ఎలా జోడించవచ్చో చూశాము. ప్రసంగ గుర్తింపును ఆశ్చర్యకరమైన లేదా వినూత్న మార్గాల్లో ఉపయోగించే ఏదైనా Android అనువర్తనాలను మీరు ఎదుర్కొన్నారా?

తరువాత: Google ARCore తో వృద్ధి చెందిన రియాలిటీ Android అనువర్తనాన్ని రూపొందించండి

విషయము

స్పీచ్-టు-టెక్స్ట్ యూజర్ ఇంటర్ఫేస్ను నిర్మించడం

మీ Android అనువర్తనానికి ప్రసంగ గుర్తింపును జోడిస్తోంది

1. రికగ్నైజర్ ఇంటెంట్ ప్రారంభించండి

2. ప్రసంగ ప్రతిస్పందనను స్వీకరించడం

మీ ప్రాజెక్ట్‌ను పరీక్షిస్తోంది

చుట్టి వేయు

రెడ్‌మి కె 20 సమీక్ష: ఛాంపియన్‌గా తయారవుతుంది

రెడ్‌మి కె 20 సిరీస్ 1 మీ సరుకులను దాటింది, భారత్ ఇంకా రాబోతోంది

HMD గ్లోబల్ జూన్ 6 ఈవెంట్లకు ఆహ్వానాలను పంపుతుంది

2020 విడుదలకు సిద్ధంగా ఉన్న నోకియా 5 జి ఫోన్‌లో హెచ్‌ఎండి పనిచేస్తోంది

నోకియా 5.1 ప్లస్ ఇప్పుడు యుఎస్‌లో అందుబాటులో ఉంది