Android 簡單訊飛語音合成與語音聽寫功能實現教程,展示效果
訊飛語音開發集成地址https://www.xfyun.cn/ 解壓後的doc文件夾下的msc develop 文件中有詳細集成步驟
先註冊一個賬號
註冊成功後,點擊自己的應用,點擊下載相關的SDK
SDK的頁面
下載後將sdk解壓, 把案例導入工程中運行看看效果
將libs下的兩個jar包添加到libs目錄下, 將同路徑下的其它 .so文件(與c進行交互)復制到main路徑下新建的 jniLibs(L要大寫)目錄下(別忘瞭jar包要add) , 將assert目錄拷貝到main目錄下 註意 : 這些都是自己創建的應用生成的, 在申請appid時就與自己的應用綁定瞭, 拷貝別人的是沒有用的
添加權限
創建類 , 以下是代碼: initSpeech()方法下的APPID需要改成上面介紹中自己應用生成的appId
MainActivity
public class MainActivity extends Activity implements View.OnClickListener { private static final String TAG = MainActivity.class .getSimpleName(); private EditText et_input; private Button btn_startspeech, btn_startspeektext ; // 用HashMap存儲聽寫結果 private HashMap mIatResults = new LinkedHashMap(); @Override protected void onCreate(Bundle savedInstanceState) { super .onCreate(savedInstanceState) ; initView() ; initSpeech() ; } private void initView() { setContentView(R.layout.activity_main) ; et_input = (EditText) findViewById(R.id.et_input ); btn_startspeech = (Button) findViewById(R.id.btn_startspeech ); btn_startspeektext = (Button) findViewById(R.id.btn_startspeektext ); btn_startspeech .setOnClickListener(this) ; btn_startspeektext .setOnClickListener(this) ; } private void initSpeech() { // 將“12345678”替換成您申請的 APPID,申請地址: https://www.xfyun.cn // 請勿在 “ =”與 appid 之間添加任務空字符或者轉義符 SpeechUtility. createUtility( this, SpeechConstant. APPID + "=56ffe0ae" ); } @Override public void onClick(View v) { switch (v.getId()) { case R.id.btn_startspeech: //語音識別(把聲音轉文字) startSpeechDialog(); break; case R.id. btn_startspeektext:// 語音合成(把文字轉聲音) speekText(); break; } } private void speekText() { //1. 創建 SpeechSynthesizer 對象 , 第二個參數: 本地合成時傳 InitListener SpeechSynthesizer mTts = SpeechSynthesizer.createSynthesizer( this, null); //2.合成參數設置,詳見《 MSC Reference Manual》 SpeechSynthesizer 類 //設置發音人(更多在線發音人,用戶可參見 附錄 13.2 mTts.setParameter(SpeechConstant. VOICE_NAME, "vixyun" ); // 設置發音人 mTts.setParameter(SpeechConstant. SPEED, "50" );// 設置語速 mTts.setParameter(SpeechConstant. VOLUME, "80" );// 設置音量,范圍 0~100 mTts.setParameter(SpeechConstant. ENGINE_TYPE, SpeechConstant. TYPE_CLOUD); //設置雲端 //設置合成音頻保存位置(可自定義保存位置),保存在 “./sdcard/iflytek.pcm” //保存在 SD 卡需要在 AndroidManifest.xml 添加寫 SD 卡權限 //僅支持保存為 pcm 和 wav 格式, 如果不需要保存合成音頻,註釋該行代碼 mTts.setParameter(SpeechConstant. TTS_AUDIO_PATH, "./sdcard/iflytek.pcm" ); //3.開始合成 mTts.startSpeaking( et_input.getText().toString(), new MySynthesizerListener()) ; } class MySynthesizerListener implements SynthesizerListener { @Override public void onSpeakBegin() { showTip(" 開始播放 "); } @Override public void onSpeakPaused() { showTip(" 暫停播放 "); } @Override public void onSpeakResumed() { showTip(" 繼續播放 "); } @Override public void onBufferProgress(int percent, int beginPos, int endPos , String info) { // 合成進度 } @Override public void onSpeakProgress(int percent, int beginPos, int endPos) { // 播放進度 } @Override public void onCompleted(SpeechError error) { if (error == null) { showTip("播放完成 "); } else if (error != null ) { showTip(error.getPlainDescription( true)); } } @Override public void onEvent(int eventType, int arg1 , int arg2, Bundle obj) { // 以下代碼用於獲取與雲端的會話 id,當業務出錯時將會話 id提供給技術支持人員,可用於查詢會話日志,定位出錯原因 // 若使用本地能力,會話 id為null //if (SpeechEvent.EVENT_SESSION_ID == eventType) { // String sid = obj.getString(SpeechEvent.KEY_EVENT_SESSION_ID); // Log.d(TAG, "session id =" + sid); //} } } private void startSpeechDialog() { //1. 創建RecognizerDialog對象 RecognizerDialog mDialog = new RecognizerDialog(this, new MyInitListener()) ; //2. 設置accent、 language等參數 mDialog.setParameter(SpeechConstant. LANGUAGE, "zh_cn" );// 設置中文 mDialog.setParameter(SpeechConstant. ACCENT, "mandarin" ); // 若要將UI控件用於語義理解,必須添加以下參數設置,設置之後 onResult回調返回將是語義理解 // 結果 // mDialog.setParameter("asr_sch", "1"); // mDialog.setParameter("nlp_version", "2.0"); //3.設置回調接口 mDialog.setListener( new MyRecognizerDialogListener()) ; //4. 顯示dialog,接收語音輸入 mDialog.show() ; } class MyRecognizerDialogListener implements RecognizerDialogListener { /** * @param results * @param isLast 是否說完瞭 */ @Override public void onResult(RecognizerResult results, boolean isLast) { String result = results.getResultString(); //為解析的 showTip(result) ; System. out.println(" 沒有解析的 :" + result); String text = JsonParser.parseIatResult(result) ;//解析過後的 System. out.println(" 解析後的 :" + text); String sn = null; // 讀取json結果中的 sn字段 try { JSONObject resultJson = new JSONObject(results.getResultString()) ; sn = resultJson.optString("sn" ); } catch (JSONException e) { e.printStackTrace(); } mIatResults .put(sn, text) ;//沒有得到一句,添加到 StringBuffer resultBuffer = new StringBuffer(); for (String key : mIatResults.keySet()) { resultBuffer.append(mIatResults .get(key)); } et_input.setText(resultBuffer.toString());// 設置輸入框的文本 et_input .setSelection(et_input.length()) ;//把光標定位末尾 } @Override public void onError(SpeechError speechError) { } } class MyInitListener implements InitListener { @Override public void onInit(int code) { if (code != ErrorCode.SUCCESS) { showTip("初始化失敗 "); } } } /** * 語音識別 */ private void startSpeech() { //1. 創建SpeechRecognizer對象,第二個參數: 本地識別時傳 InitListener SpeechRecognizer mIat = SpeechRecognizer.createRecognizer( this, null); //語音識別器 //2. 設置聽寫參數,詳見《 MSC Reference Manual》 SpeechConstant類 mIat.setParameter(SpeechConstant. DOMAIN, "iat" );// 短信和日常用語: iat (默認) mIat.setParameter(SpeechConstant. LANGUAGE, "zh_cn" );// 設置中文 mIat.setParameter(SpeechConstant. ACCENT, "mandarin" );// 設置普通話 //3. 開始聽寫 mIat.startListening( mRecoListener); } // 聽寫監聽器 private RecognizerListener mRecoListener = new RecognizerListener() { // 聽寫結果回調接口 (返回Json 格式結果,用戶可參見附錄 13.1); //一般情況下會通過onResults接口多次返回結果,完整的識別內容是多次結果的累加; //關於解析Json的代碼可參見 Demo中JsonParser 類; //isLast等於true 時會話結束。 public void onResult(RecognizerResult results, boolean isLast) { Log.e (TAG, results.getResultString()); System.out.println(results.getResultString()) ; showTip(results.getResultString()) ; } // 會話發生錯誤回調接口 public void onError(SpeechError error) { showTip(error.getPlainDescription(true)) ; // 獲取錯誤碼描述 Log. e(TAG, "error.getPlainDescription(true)==" + error.getPlainDescription(true )); } // 開始錄音 public void onBeginOfSpeech() { showTip(" 開始錄音 "); } //volume 音量值0~30, data音頻數據 public void onVolumeChanged(int volume, byte[] data) { showTip(" 聲音改變瞭 "); } // 結束錄音 public void onEndOfSpeech() { showTip(" 結束錄音 "); } // 擴展用接口 public void onEvent(int eventType, int arg1 , int arg2, Bundle obj) { } }; private void showTip (String data) { Toast.makeText( this, data, Toast.LENGTH_SHORT).show() ; } }
JsonParser
/** * Json結果解析類 */ public class JsonParser { public static String parseIatResult(String json) { StringBuffer ret = new StringBuffer() ; try { JSONTokener tokener = new JSONTokener(json) ; JSONObject joResult = new JSONObject(tokener) ; JSONArray words = joResult.getJSONArray("ws" ); for (int i = 0; i < words.length(); i++) { // 轉寫結果詞,默認使用第一個結果 JSONArray items = words.getJSONObject(i).getJSONArray("cw" ); JSONObject obj = items.getJSONObject(0 ); ret.append(obj.getString("w" )); // 如果需要多候選結果,解析數組其他字段 // for(int j = 0; j < items.length(); j++) // { // JSONObject obj = items.getJSONObject(j); // ret.append(obj.getString("w")); // } } } catch (Exception e) { e.printStackTrace(); } return ret.toString(); } public static String parseGrammarResult(String json) { StringBuffer ret = new StringBuffer() ; try { JSONTokener tokener = new JSONTokener(json) ; JSONObject joResult = new JSONObject(tokener) ; JSONArray words = joResult.getJSONArray("ws" ); for (int i = 0; i < words.length(); i++) { JSONArray items = words.getJSONObject(i).getJSONArray("cw" ); for (int j = 0; j < items.length() ; j++) { JSONObject obj = items.getJSONObject(j); if (obj.getString("w").contains( "nomatch")) { ret.append( "沒有匹配結果.") ; return ret.toString(); } ret.append( "【結果】" + obj.getString("w" )); ret.append("【置信度】 " + obj.getInt("sc" )); ret.append("\n "); } } } catch (Exception e) { e.printStackTrace(); ret.append(" 沒有匹配結果 ."); } return ret.toString(); } public static String parseLocalGrammarResult(String json) { StringBuffer ret = new StringBuffer() ; try { JSONTokener tokener = new JSONTokener(json) ; JSONObject joResult = new JSONObject(tokener) ; JSONArray words = joResult.getJSONArray("ws" ); for (int i = 0; i < words.length(); i++) { JSONArray items = words.getJSONObject(i).getJSONArray("cw" ); for (int j = 0; j < items.length() ; j++) { JSONObject obj = items.getJSONObject(j); if (obj.getString("w").contains( "nomatch")) { ret.append( "沒有匹配結果.") ; return ret.toString(); } ret.append( "【結果】" + obj.getString("w" )); ret.append("\n "); } } ret.append("【置信度】 " + joResult.optInt("sc" )); } catch (Exception e) { e.printStackTrace(); ret.append(" 沒有匹配結果 ."); } return ret.toString(); } }