前言
一、speech_recognition库是什么?
Python的speech_recognition库是一个用于语音识别的Python包,它可以使Python程序能够识别和翻译来自麦克风、音频文件或网络流的语音。它支持多种语音识别引擎,包括Google Speech Recognition、CMU Sphinx、Microsoft Bing Voice Recognition等,可以根据需要选择不同的引擎进行语音识别。
使用speech_recognition库进行语音识别非常简单,只需要导入该库并创建一个Recognizer对象,然后调用该对象的recognize_*()方法即可。例如,调用recognize_google()方法可以使用Google Speech Recognition引擎进行语音识别。
二、安装speech_recognition库
pip install SpeechRecognition
三、查看speech_recognition版本
pip show SpeechRecognition
Name: SpeechRecognition
Version: 3.10.0
Summary: Library for performing speech recognition, with support for several engines and APIs, online and offline.
Home-page: https://github.com/Uberi/speech_recognition#readme
Author: Anthony Zhang (Uberi)
Author-email: azhang9@gmail.com
License: BSD
Requires: requests
Required-by:
四、pyaudio库是什么?
Pyaudio是Python语言的一个音频处理库,可以用来录制音频、播放音频、读取音频文件等。它是一个跨平台的库,可以在Windows、Mac、Linux等多个操作系统上使用。Pyaudio库是基于PortAudio C库开发的,PortAudio是一个跨平台的音频处理库,Pyaudio库可以方便的使用PortAudio库的功能。
五、安装pyaudio库
pip install pyaudio
六、查看pyaudio版本
pip show pyaudio
Name: PyAudio
Version: 0.2.13
Summary: Cross-platform audio I/O with PortAudio
Home-page: https://people.csail.mit.edu/hubert/pyaudio/
Author: Hubert Pham
Author-email:
License: MIT
Requires:
Required-by: