Python中语音转文字相关库介绍(最新推荐) 寻技术

前言

一、speech_recognition库是什么？

Python的speech_recognition库是一个用于语音识别的Python包，它可以使Python程序能够识别和翻译来自麦克风、音频文件或网络流的语音。它支持多种语音识别引擎，包括Google Speech Recognition、CMU Sphinx、Microsoft Bing Voice Recognition等，可以根据需要选择不同的引擎进行语音识别。
使用speech_recognition库进行语音识别非常简单，只需要导入该库并创建一个Recognizer对象，然后调用该对象的recognize_*()方法即可。例如，调用recognize_google()方法可以使用Google Speech Recognition引擎进行语音识别。

二、安装speech_recognition库

pip install SpeechRecognition

三、查看speech_recognition版本

 pip show SpeechRecognition

Name: SpeechRecognition
Version: 3.10.0
Summary: Library for performing speech recognition, with support for several engines and APIs, online and offline.
Home-page: https://github.com/Uberi/speech_recognition#readme
Author: Anthony Zhang (Uberi)
Author-email: azhang9@gmail.com
License: BSD
Requires: requests
Required-by:

四、pyaudio库是什么？

Pyaudio是Python语言的一个音频处理库，可以用来录制音频、播放音频、读取音频文件等。它是一个跨平台的库，可以在Windows、Mac、Linux等多个操作系统上使用。Pyaudio库是基于PortAudio C库开发的，PortAudio是一个跨平台的音频处理库，Pyaudio库可以方便的使用PortAudio库的功能。

五、安装pyaudio库

pip install pyaudio

六、查看pyaudio版本

pip show pyaudio

Name: PyAudio
Version: 0.2.13
Summary: Cross-platform audio I/O with PortAudio
Home-page: https://people.csail.mit.edu/hubert/pyaudio/
Author: Hubert Pham
Author-email:
License: MIT
Requires:
Required-by: