![🔉 ఆడియోని టెక్స్ట్గా మార్చడం ఎలా - ఉచిత & సమయ పరిమితులు లేవు](https://i.ytimg.com/vi/1DsrniDGOJQ/hqdefault.jpg)
విషయము
- స్పీచ్-టు-టెక్స్ట్ యూజర్ ఇంటర్ఫేస్ను నిర్మించడం
- మీ Android అనువర్తనానికి ప్రసంగ గుర్తింపును జోడిస్తోంది
- 1. రికగ్నైజర్ ఇంటెంట్ ప్రారంభించండి
- 2. ప్రసంగ ప్రతిస్పందనను స్వీకరించడం
- మీ ప్రాజెక్ట్ను పరీక్షిస్తోంది
- చుట్టి వేయు
చాలా అనువర్తనాలు, సేవలు మరియు గృహ గాడ్జెట్లు మెరుగైన వినియోగదారు అనుభవాన్ని అందించడానికి మరియు ప్రాప్యతను మెరుగుపరచడానికి ప్రసంగ గుర్తింపును ఉపయోగిస్తాయి. స్పీచ్ రికగ్నిషన్ను ఉపయోగించుకునే లెక్కలేనన్ని ఆండ్రాయిడ్ అనువర్తనాలు ఉన్నాయి - వీటిలో ముఖ్యమైనవి గూగుల్ అసిస్టెంట్ - కాబట్టి దీన్ని అనుసరించండి మరియు మీ స్వంత Android అనువర్తనాలకు ఈ లక్షణాన్ని ఎందుకు జోడించకూడదు?
ఈ వ్యాసంలో, Android యొక్క స్పీచ్-టు-టెక్స్ట్ ఇంటెంట్తో ప్రారంభించడానికి నేను శీఘ్రంగా మరియు సులభమైన మార్గాన్ని పంచుకుంటాను, ఇది విస్తృత శ్రేణి అనువర్తనాలలో ఉపయోగపడుతుంది. ఉదాహరణకు, మీరు శ్రమతో కూడిన మాన్యువల్ డేటా ఎంట్రీని ఆటోమేట్ చేయడానికి, స్వయంచాలకంగా ఉపశీర్షికలను రూపొందించడానికి లేదా స్వర ఇన్పుట్కు “వినే”, దానిని టెక్స్ట్గా మార్చే, తరువాత ఈ వచనాన్ని అనువదించి, ఫలితాలను ప్రదర్శించే అనువాద అనువర్తనానికి ఆధారం వలె మీరు ప్రసంగ గుర్తింపును ఉపయోగించవచ్చు. వినియోగదారు.
మీరు సృష్టించిన అనువర్తనంతో సంబంధం లేకుండా, మీ అనువర్తనంతో పరస్పర చర్య చేయడానికి వినియోగదారులకు ప్రత్యామ్నాయ మార్గాన్ని అందించడం ద్వారా ప్రసంగ గుర్తింపు ప్రాప్యతను మెరుగుపరుస్తుంది. ఉదాహరణకు, చలనశీలత, సామర్థ్యం లేదా దృష్టి సమస్యలు ఉన్న వ్యక్తులు టచ్స్క్రీన్ లేదా కీబోర్డ్ కాకుండా వాయిస్ ఆదేశాలను ఉపయోగించి మొబైల్ అనువర్తనాలను నావిగేట్ చేయడం సులభం. ప్లస్, ప్రపంచ ఆరోగ్య సంస్థ (WHO) ప్రకారం, ఒక బిలియన్ మందికి పైగా ప్రజలు కొంత వైకల్యాన్ని కలిగి ఉన్నారు, ఇది ప్రపంచ జనాభాలో 15% కు సమానం. మీ అనువర్తనాలకు ప్రాప్యత లక్షణాలను జోడించడం వలన మీ సంభావ్య ప్రేక్షకులను గణనీయంగా పెంచుతుంది.
ఈ వ్యాసం ముగిసే సమయానికి, మీరు మీ వాయిస్ని రికార్డ్ చేసి, టెక్స్ట్గా మార్చి, ఆ వచనాన్ని తెరపై ప్రదర్శించే సరళమైన స్పీచ్-టు-టెక్స్ట్ అనువర్తనాన్ని సృష్టించారు.
స్పీచ్-టు-టెక్స్ట్ యూజర్ ఇంటర్ఫేస్ను నిర్మించడం
ప్రారంభించడానికి, “ఖాళీ కార్యాచరణ” టెంప్లేట్ ఉపయోగించి క్రొత్త Android ప్రాజెక్ట్ను సృష్టించండి.
మేము నొక్కినప్పుడు, Android యొక్క స్పీచ్-టు-టెక్స్ట్ ఇంటెంట్ను ప్రేరేపిస్తుంది మరియు మీ అనువర్తనం ప్రసంగ ఇన్పుట్ను అంగీకరించడానికి సిద్ధంగా ఉందని సూచించే డైలాగ్ను ప్రదర్శించే బటన్ను కలిగి ఉన్న ఒక సాధారణ అనువర్తనాన్ని మేము సృష్టిస్తాము. వినియోగదారు మాట్లాడటం పూర్తయిన తర్వాత, వారి ఇన్పుట్ టెక్స్ట్గా మార్చబడుతుంది, ఆపై టెక్స్ట్ వ్యూలో భాగంగా ప్రదర్శించబడుతుంది.
మా లేఅవుట్ను సృష్టించడం ద్వారా ప్రారంభిద్దాం:
ఇది మాకు ఈ క్రింది లేఅవుట్ను ఇస్తుంది:
మీ Android అనువర్తనానికి ప్రసంగ గుర్తింపును జోడిస్తోంది
మేము రెండు దశల్లో ప్రసంగ ఇన్పుట్ను సంగ్రహించి ప్రాసెస్ చేస్తాము:
1. రికగ్నైజర్ ఇంటెంట్ ప్రారంభించండి
స్పీచ్-టు-టెక్స్ట్ మార్పిడిని నిర్వహించడానికి సులభమైన మార్గం రికగ్నైజర్ ఇంటెంట్ ఉపయోగించడం. ACTION_RECOGNIZE_SPEECH. ఈ ఉద్దేశ్యం Android యొక్క సుపరిచితమైన మైక్రోఫోన్ డైలాగ్ బాక్స్ను ప్రారంభించడం ద్వారా స్వర ఇన్పుట్ కోసం వినియోగదారుని అడుగుతుంది.
వినియోగదారు మాట్లాడటం ఆపివేసిన తర్వాత, డైలాగ్ స్వయంచాలకంగా మూసివేయబడుతుంది మరియు ACTION_RECOGNIZE_SPEECH రికార్డ్ చేసిన ఆడియోను స్పీచ్ రికగ్నైజర్ ద్వారా పంపుతుంది.
మేము రికగ్నైజర్ఇంటెంట్. ACTION_RECOGNIZE_SPEECH ను స్టార్ట్ఆక్టివిటీఫోర్ రిసల్ట్ () ఉపయోగించి బండిల్ చేసిన ఎక్స్ట్రాతో ప్రారంభిస్తాము. పేర్కొనకపోతే, గుర్తింపు పరికరం యొక్క డిఫాల్ట్ లొకేల్ను ఉపయోగిస్తుందని గమనించండి.
public void onClick (v చూడండి) {// రికగ్నైజర్ ఇంటెంట్ ఉద్దేశాన్ని ట్రిగ్గర్ చేయండి // ఉద్దేశం ఉద్దేశం = క్రొత్త ఉద్దేశం (RecognizerIntent.ACTION_RECOGNIZE_SPEECH); ప్రయత్నించండి {startActivityForResult (ఉద్దేశం, REQUEST_CODE); } క్యాచ్ (ActivityNotFoundException a) {}}
2. ప్రసంగ ప్రతిస్పందనను స్వీకరించడం
ప్రసంగ గుర్తింపు ఆపరేషన్ పూర్తయిన తర్వాత, ACTION_RECOGNIZE_SPEECH ఫలితాలను తిరిగి కాలింగ్ కార్యాచరణకు తీగల శ్రేణిగా పంపుతుంది.
మేము స్టార్ట్ఆక్టివిటీఫోర్ రిసల్ట్ () ద్వారా రికగ్నైజర్ ఇంటెంట్ను ప్రేరేపించినందున, స్పీచ్ రికగ్నిషన్ కాల్ను ప్రారంభించిన కార్యాచరణలోని యాక్టివిటీ రిసల్ట్ (పూర్ణాంక అభ్యర్థన కోడ్, పూర్ణాంక ఫలిత కోడ్, ఇంటెంట్ డేటా) ను భర్తీ చేయడం ద్వారా మేము ఫలిత డేటాను నిర్వహిస్తాము.
ప్రసంగ గుర్తింపు విశ్వాసం యొక్క అవరోహణ క్రమంలో ఫలితాలు తిరిగి ఇవ్వబడతాయి. కాబట్టి, మేము తిరిగి వచ్చిన అర్రేలిస్ట్ నుండి సున్నా స్థానాన్ని తీసుకోవలసిన అత్యంత ఖచ్చితమైన వచనాన్ని ప్రదర్శిస్తున్నామని నిర్ధారించుకోండి, ఆపై దాన్ని మా టెక్స్ట్ వ్యూలో ప్రదర్శించండి.
Ver ఓవర్రైడ్ // మా ఇంటెంట్ కాలర్ కార్యాచరణలో ఆన్ఆక్టివిటీ రిసల్ట్ పద్ధతిని నిర్వచించండి // రక్షిత శూన్యత ఆన్ యాక్టివిటీ రిసల్ట్ (పూర్ణాంక అభ్యర్థన కోడ్, పూర్ణాంక ఫలితం కోడ్, ఇంటెంట్ డేటా) {super.onActivityResult (requestCode, resultCode, data); మారండి (requestCode) {case REQUEST_CODE: {// RESULT_OK తిరిగి ఇవ్వబడితే ... // if (resultCode == RESULT_OK && null! = data) {//...అప్పుడు అర్రేలిస్ట్ను తిరిగి పొందండి // శ్రేణి జాబితా స్పీచ్-టు-టెక్స్ట్కు క్రియాశీల ఇంటర్నెట్ కనెక్షన్ అవసరం లేదని గమనించండి, కాబట్టి వినియోగదారు ఆఫ్లైన్లో ఉన్నప్పుడు కూడా ఇది సరిగ్గా పని చేస్తుంది. పైన పేర్కొన్న అన్ని దశలను పూర్తి చేసిన తర్వాత, మీ మెయిన్ఆక్టివిటీ ఇలా ఉండాలి: android.content.ActivityNotFoundException దిగుమతి; androidx.appcompat.app.AppCompatActivity దిగుమతి; android.os.Bundle దిగుమతి; android.content.Intent దిగుమతి; android.speech.RecognizerIntent దిగుమతి; android.widget.TextView దిగుమతి; android.view.View దిగుమతి; దిగుమతి java.util.ArrayList; పబ్లిక్ క్లాస్ మెయిన్ఆక్టివిటీ AppCompatActivity ని విస్తరిస్తుంది {ప్రైవేట్ స్టాటిక్ ఫైనల్ Int REQUEST_CODE = 100; ప్రైవేట్ టెక్స్ట్ వ్యూ టెక్స్ట్ఆట్పుట్; Ver ఓవర్రైడ్ రక్షిత శూన్యత ఆన్క్రియేట్ (బండిల్ సేవ్ఇన్స్టాన్స్స్టేట్) {super.onCreate (saveInstanceState); setContentView (R.layout.activity_main); textOutput = (టెక్స్ట్ వ్యూ) findViewById (R.id.textOutput); } // ఈ పద్ధతిని బటన్ నొక్కినప్పుడు పిలుస్తారు // పబ్లిక్ శూన్యత onClick (v చూడండి) // “RecognizerIntent.ACTION_RECOGNIZE_SPEECH” చర్యతో ఒక ఉద్దేశాన్ని సృష్టించండి // {ఉద్దేశం ఉద్దేశం = క్రొత్త ఉద్దేశం (RecognizerIntent.ACTION_RECOGNIZE_SPEECH); ప్రయత్నించండి {// కార్యాచరణను ప్రారంభించండి మరియు ప్రతిస్పందన కోసం వేచి ఉండండి // startActivityForResult (ఉద్దేశం, REQUEST_CODE); } క్యాచ్ (యాక్టివిటీనోట్ఫౌండ్ఎక్సెప్షన్ ఎ) {} ver ఓవర్రైడ్ // ఫలితాలను నిర్వహించండి // రక్షిత శూన్యత ఆన్ యాక్టివిటీ రిసల్ట్ (పూర్ణాంక అభ్యర్థన కోడ్, పూర్ణాంక ఫలిత కోడ్, ఇంటెంట్ డేటా) {super.onActivityResult (requestCode, resultCode, data); మారండి (requestCode) {case REQUEST_CODE: {if (resultCode == RESULT_OK && null! = data) {శ్రేణి జాబితా మీరు పూర్తి చేసిన ప్రాజెక్ట్ను గిట్హబ్ నుండి డౌన్లోడ్ చేసుకోవచ్చు. మీ దరఖాస్తును పరీక్షించడానికి: ఈ వ్యాసంలో, స్పీచ్-టు-టెక్స్ట్ ఇంటెంట్ ఉపయోగించి, మీ Android అనువర్తనాలకు మీరు త్వరగా మరియు సులభంగా ప్రసంగ గుర్తింపును ఎలా జోడించవచ్చో చూశాము. ప్రసంగ గుర్తింపును ఆశ్చర్యకరమైన లేదా వినూత్న మార్గాల్లో ఉపయోగించే ఏదైనా Android అనువర్తనాలను మీరు ఎదుర్కొన్నారా? తరువాత: Google ARCore తో వృద్ధి చెందిన రియాలిటీ Android అనువర్తనాన్ని రూపొందించండిమీ ప్రాజెక్ట్ను పరీక్షిస్తోంది
చుట్టి వేయు